来自粗糙脉孢菌的β-葡糖苷酶
优先权
本申请要求于2012年10月31日提交的美国临时申请序列号61/720,745的优先权,该临时申请据此全文以引用方式并入。
技术领域
本发明组合物和方法涉及可从粗糙脉孢菌(Neurospora crassa)获得的β-葡糖苷酶多肽、编码β-葡糖苷酶多肽的多核苷酸、以及其制备和使用方法。包含β-葡糖苷酶多肽的制剂和组合物可用于降解或水解木素纤维素生物质。
背景技术
纤维素和半纤维素是通过光合作用产生的最丰富的植物材料。它们可被多种产生能够将聚合物底物水解成单体糖类的胞外酶的微生物(例如,细菌、酵母和真菌)降解和用作能源(Aro et al.,(2001)J.Biol.Chem.,276:24309-24314(Aro等人,2001年,《生物化学杂志》,第276卷,第24309-24314页))。因为非可再生资源方法的局限性,纤维素成为主要可再生能源的潜能是巨大的(Krishna et al.,(2001)Bioresource Tech.,77:193-196(Krishna等人,2001年,《生物资源技术》,第77卷,第193-196页))。通过生物过程对纤维素的有效利用是克服食品、饲料和燃料短缺的一种途径(Ohmiya et al.,(1997)Biotechnol.Gen.Engineer Rev.,14:365-414(Ohmiya等人,1997年,《生物技术与遗传工程评论》,第14卷,第365-414页))。
纤维素酶是水解纤维素(包含β-1,4-葡聚糖或βD-糖苷键)导致形成葡萄糖、纤维二糖、纤维低聚糖等的酶。传统上将纤维素酶分为三大类:内切葡聚糖酶(EC 3.2.1.4)(“EG”)、外切葡聚糖酶或纤维二糖水解酶(EC3.2.1.91)(“CBH”)和β-葡糖苷酶([β]-D-葡糖苷葡萄糖水解酶;EC 3.2.1.21)(“BG”)(Knowles et al.,(1987)TIBTECH 5:255-261(Knowles等人,1987年,《生物技术趋势》,第5卷,第255-261页);以及Schulein,(1988)Methods Enzymol.,160:234-243(Schulein,1988年,《酶学方法》,第160卷,第234-243页))。内切葡聚糖酶主要作用在纤维素纤维的非晶部分,而纤维二糖水解酶还能够降解结晶纤维素(Nevalainen and Penttila,(1995)Mycota,303-319(Nevalainen和Penttila,1995年,《菌界》,第303-319页))。因此,纤维二糖水解酶在纤维素酶体系中的存在是结晶纤维素有效溶解所必需的(Suurnakki et al.,(2000)Cellulose,7:189-209(Suurnakki等人,2000年,《纤维素》,第7卷,第189-209页))。β-葡糖苷酶起到从纤维二糖、纤维低聚糖和其他葡糖苷释放D-葡萄糖单位的作用(Freer,J.(1993)Biol.Chem.,268:9337-9342(Freer,1993年,《生物化学杂志》,第268卷,第9337-9342页))。
已知纤维素酶由大量细菌、酵母和真菌产生。某些真菌产生能够降解结晶形式的纤维素的完全纤维素酶体系。这些真菌可经发酵而产生多组纤维素酶或纤维素酶混合物。相同真菌和其他真菌也可被工程改造而产生或过量产生某些纤维素酶,从而得到包含不同类型或比例的纤维素酶的纤维素酶混合物。真菌也可被工程改造使得它们经由发酵而大量产生各种纤维素酶。丝状真菌发挥特别的作用,因为许多酵母诸如酿酒酵母(Saccharomyces cerevisiae)在其天然状态下没有水解纤维素的能力(参见例如,Wood et al.,(1988)Methods in Enzymology,160:87-116(Wood等人,1988年,《酶学方法》,第160卷,第87-116页))。
CBH、EG和BG的真菌纤维素酶分类可进一步扩展以包括每个分类内的多个组分。例如,已从包括里氏木霉(Trichoderma reesei)(也称为红褐肉座菌(Hypocrea jecorina))的多个真菌来源分离了多种CBH、EG和BG,里氏木霉含有两种CBH的已知基因,即,CBH I(“CBH1”)和CBH II(“CBH2”),至少八种EG的已知基因,即,EG I、EG II、EG III、EGIV、EGV、EGVI、EGVII和EGVIII,以及至少五种BG的已知基因,即,BG1、BG2、BG3、BG4、BG5和BG7(Foreman et al.(2003),J.Biol.Chem.278(34):31988-31997(Foreman等人,2003年,《生物化学杂志》,第278卷,第34期,第31988-31997页))。EGIV、EGVI和EGVIII也具有木葡聚糖酶活性。
为了将结晶纤维素有效地转化成葡萄糖,需要包含来自CBH、EG和BG分类中每一个的组分的完全纤维素酶体系,而分离的组分在水解结晶纤维素方面不太有效(Filho et al.,(1996)Can.J.Microbiol.,42:1-5(Filho等人,1996年,《加拿大微生物学杂志》,第42卷,第1-5页))。内切-1,4-β-葡聚糖酶(EG)和外切纤维二糖水解酶(CBH)催化纤维素水解为纤维低聚糖(纤维二糖作为主要产物),而β-葡糖苷酶(BGL)将低聚糖转化为葡萄糖。已观察到来自不同分类的纤维素酶组分之间的协同关系。具体地讲,EG型纤维素酶和CBH型纤维素酶协同地相互作用以有效地降解纤维素。β-葡糖苷酶起到从纤维低聚糖诸如纤维二糖释放葡萄糖的重要作用,纤维二糖对用于将糖发酵为乙醇的微生物诸如酵母具有毒性;并且纤维二糖还抑制内切葡聚糖酶和纤维二糖水解酶的活性,使得它们在进一步水解结晶纤维素时是低效的。
鉴于β-葡糖苷酶在降解或转化纤维素材料方面所起到的重要作用,具有水解纤维素给料的改善功效或能力的β-葡糖苷酶同源物的发现、表征、制备和应用是所需且有利的。
发明内容
可从粗糙脉孢菌获得的β-葡糖苷酶及其用途
纤维素的酶法水解仍然是通过木素纤维素生物质给料来生物生产可为纤维素糖和/或下游产物的材料的主要限制步骤之一。β-葡糖苷酶起到催化该过程最后一步,从抑制性纤维二糖释放葡萄糖的重要作用,因此其活性和功效直接影响酶法木素纤维素生物质转化的总体功效,并最终影响酶溶液的使用成本。因此,新型且更有效的β-葡糖苷酶的发现、制备和使用受到广泛关注。
虽然多种β-葡糖苷酶是已知的,包括来自里氏木霉或红褐肉座菌的β-葡糖苷酶Bgl1、Bgl3、Bgl5、Bgl7等(Korotkova O.G.et al.,(2009)Biochemistry 74:569-577(Korotkova O.G.等人,2009年,《生物化学》,第74卷,第569-577页);Chauve,M.et al.,(2010)Biotechnol.Biofuels 3:3-3(Chauve,M.等人,2010年,《生物燃料技术》,第3卷,第3-3页))、来自灰腐质霉高温变种(Humicola grisea var.thermoidea)的β-葡糖苷酶(Nascimento,C.V.et al.,(2010)J.Microbiol.48,53-62(Nascimento, C.V.等人,2010年,《微生物学杂志》,第48卷,第53-62页));来自多粉侧孢霉(Sporotrichum pulverulentum)的β-葡糖苷酶(Deshpande V.et al.,(1988)Methods Enzymol.,160:415-424(Deshpande V.等人,1988年,《酶学方法》,第160卷,第415-424页));米曲霉(Aspergillus oryzae)的β-葡糖苷酶(Fukuda T.et al.,(2007)Appl.Microbiol.Biotechnol.76:1027-1033(Fukuda T.等人,2007年,《应用微生物学和生物技术》,第76卷,第1027-1033页));来自嗜热篮状菌(Talaromyces thermophilus)CBS 236.58的β-葡糖苷酶(Nakkharat P.et al.,(2006)J.Biotechnol.,123:304-313(Nakkharat P.等人,2006年,《生物技术杂志》,第123卷,第304-313页));来自埃默森篮状菌(Talaromyces emersonii)的β-葡糖苷酶(Murray P.,et al,(2004)Protein Expr.Purif.38:248-257(Murray P.等人,2004年,《蛋白质表达和纯化》,第38卷,第248-257页)),但迄今为止里氏木霉β-葡糖苷酶Bgl1和黑曲霉(Aspergillus niger)β-葡糖苷酶SP188被认为是针对其来评价其他β-葡糖苷酶的活性和性能的基准β-葡糖苷酶。据报道,里氏木霉Bgl1具有比黑曲霉β-葡糖苷酶SP188更高的比活性,但前者可能分泌极少,而后者对葡萄糖抑制更敏感(Chauve,M.et al.,(2010)Biotechnol.Biofuels,3(1):3(Chauve,M.等人,2010年,《生物燃料技术》,第3卷,第1期,第3页))。
本发明组合物和方法的一个方面是应用或使用分离自真菌物种粗糙脉孢菌的高度活性的β-葡糖苷酶来水解木素纤维素生物质底物。丝状真菌粗糙脉孢菌的基因组已在2003年由Galagan等人在Nature,422(6934):859-868(2003)(《自然》,第422卷,第6934期,第859-868页,2003年)中注释。本文所述的SEQ ID NO:2的序列由美国国家医学图书馆国家生物技术信息中心(National Center for Biotechnology Information,U.S.National Library of Medicine(NCBI))以登录号XP_956104公布,并且认定为是粗糙脉孢菌OR74A的β-葡糖苷酶I前体。该酶此前未制成重组形式或包含在可用于水解木素纤维素生物质底物的酶组合物中。在酶法水解木素纤维素生物质底物的合适方法中,也未将该酶或包含这种酶的组合物施加于这种底物。此外,粗糙脉孢菌的β-葡糖苷酶此前未由工程化微生物表达。其也未与一种或多种纤维素酶基因和/或一种或多种半纤维素酶基因共表达。在合适微生物中的表达使得其可以比β-葡糖苷酶在未工程化微生物中内源表达时或在 植物中表达时实质上更大的量表达这些可用的β-葡糖苷酶,所述合适微生物经过多年开发,在大量遗传工具帮助下,已成为异源蛋白和酶的高度有效且高效的生产者。归类为β-葡糖苷酶的酶不仅在其来源上而且在其对木素纤维素底物的活性上各不相同,但大多数(如果不是全部的话)β-葡糖苷酶可在合适的条件下催化纤维二糖水解。例如,一些不仅对纤维二糖有活性,而且对较长链的低聚糖有活性,而其他则更专一地仅对纤维二糖有活性。即便对于那些具有类似底物偏好性的β-葡糖苷酶而言,一些也具有使其催化活性更大且更高效的酶动力学曲线,并且相应地更加适用于酶催化的水解不能做到持续长于至多数天的工业应用。此外,尚未对能够转化从木素纤维素生物质的酶法水解获得的纤维素糖的发酵或产乙醇微生物进行工程改造,以表达来自粗糙脉孢菌的β-葡糖苷酶,诸如本文的Nc3A多肽。β-葡糖苷酶在产乙醇微生物中的表达提供了重要的机会以进一步从未被酶糖化完全转化的剩余纤维二糖释放D-葡萄糖,其中由此产生的D-葡萄糖可被产乙醇生物立即消耗或及时发酵。
本发明组合物和方法的一方面涉及来源于粗糙脉孢菌的糖基水解酶家族3的β-葡糖苷酶多肽(本文称为“Nc3A”或“Nc3A多肽”)、编码其的核酸、包含其的组合物、以及产生β-葡糖苷酶多肽和包含其的组合物及将β-葡糖苷酶多肽和包含其的组合物应用于将木素纤维素生物质水解或转化成水溶性的可发酵糖的方法。然后可将此类可发酵糖转化成纤维素乙醇、燃料以及其他生物化学物质和可用产物。在某些实施例中,与基准里氏木霉Bgl1(其是已知的高保真性β-葡糖苷酶)相比,Nc3Aβ-葡糖苷酶多肽具有更高的β-葡糖苷酶活性和/或表现出增强的水解给定木素纤维素生物质底物的能力。(Chauve,M.et al.,(2010)Biotechnol.Biofuels,3(1):3(Chauve,M.等人,2010年,《生物燃料技术》,第3卷,第1期,第3页))。
在一些实施例中,将Nc3A多肽与酶组合物中的一种或多种其他纤维素酶一起或在存在酶组合物中的一种或多种其他纤维素酶的情况下施加以水解或分解合适的生物质底物。所述一种或多种其他纤维素酶可为例如其他β-葡糖苷酶、纤维二糖水解酶和/或内切葡聚糖酶。例如,酶组合物可包含Nc3A多肽、纤维二糖水解酶和内切葡聚糖酶。在一些实施例中,将Nc3A多肽与酶组合物中的一种或多种半纤维素酶一起或在存在酶组合物中 的一种或多种半纤维素酶的情况下施加。所述一种或多种半纤维素酶可为例如木聚糖酶、β-木糖苷酶和/或L-阿拉伯呋喃糖苷酶。在另外的实施例中,将Nc3A多肽与酶组合物中的一种或多种纤维素酶和一种或多种半纤维素酶一起或在存在酶组合物中的一种或多种纤维素酶和一种或多种半纤维素酶的情况下施加。例如,酶组合物包含Nc3A多肽、无或一种或两种其他β-葡糖苷酶、一种或多种纤维二糖水解酶、一种或多种内切葡聚糖酶;任选地无或一种或多种木聚糖酶、无或一种或多种β-木糖苷酶、以及无或一种或多种L-阿拉伯呋喃糖苷酶。
在某些实施例中,在存在产乙醇微生物的情况下,将Nc3A多肽或包含Nc3A多肽的组合物施加到木素纤维素生物质底物或部分水解的木素纤维素生物质底物,所述产乙醇微生物能够代谢通过木素纤维素生物质底物的酶法水解所产生的可溶性可发酵糖,并将此类糖转化成乙醇、生物化学物质或其他可用的材料。这种过程可为严格的顺序过程,其中水解步骤在发酵步骤之前进行。这种过程可另选地为混合过程,其中水解步骤首先开始,但在一段时间内与稍后开始的发酵步骤重叠。这种过程可在另外一种替代形式中为同步水解和发酵过程,其中生物质底物的酶法水解在产乙醇生物发酵由酶法水解产生的糖的同时进行。
Nc3A多肽例如可为酶组合物的一部分,从而促进酶法水解过程和从低聚糖诸如纤维二糖释放D-葡萄糖。在某些实施例中,Nc3A多肽可被遗传工程改造而在产乙醇生物中表达,使得产乙醇微生物表达和/或分泌此种β-葡糖苷酶活性。此外,Nc3A多肽可为水解酶组合物的一部分,与此同时也可由产乙醇生物表达和/或分泌,其中使用水解酶组合物水解木素纤维素生物质底物所产生的可溶性可发酵糖被也表达和/或分泌Nc3A多肽的产乙醇微生物代谢和/或转化成乙醇。除一种或多种其他纤维素酶和/或一种或多种半纤维素酶之外,水解酶组合物还可包含Nc3A多肽。产乙醇生物可被工程改造,使得其表达Nc3A多肽、一种或多种其他纤维素酶、一种或多种其他半纤维素酶、或这些酶的组合。β-葡糖苷酶中的一种或多种可在水解酶组合物中并由产乙醇生物表达和/或分泌。例如,可使用包含Nc3A多肽的酶组合物实现木素纤维素生物质底物的水解,并且然后可用经工程改造而表达和/或分泌Nc3A多肽的微生物来发酵由水解产生的糖。作为另一种选择,包含第一β-葡糖苷酶的酶组合物参与水解步骤,并且产乙醇生物表 达和/或分泌与第一β-葡糖苷酶不同的第二β-葡糖苷酶。例如,可使用包含里氏木霉Bgl1的水解酶组合物实现木素纤维素生物质底物的水解,并且通过表达和/或分泌Nc3A多肽的产乙醇微生物来发酵由水解产生的可发酵糖,或反之亦然。
如本文所展示,Nc3A多肽和包含Nc3A多肽的组合物在发生木素纤维素生物质的糖化和降解的条件下具有改善的功效。当将包含Nc3A多肽的酶组合物水解给定生物质底物的性能与包含里氏木霉Bgl1的另外相当的酶组合物相比时,包含Nc3A多肽的酶组合物显示出改善功效。在一些实施例中,生物质底物为磷酸溶胀纤维素(PASC),例如使用如下文献的修改方案预处理的Avicel:Walseth,TAPPI 1971,35:228(Walseth,《纸浆与造纸工业技术协会志》,1971年,第35卷,第228页)和Wood,Biochem.J.1971,121:353-362(Wood,《生物化学杂志》,1971年,第121卷,第353-362页)。在一些其他实施例中,生物质底物为稀氨水预处理的玉米秸秆,例如国际公布的专利申请:WO2006110891、WO2006110899、WO2006110900、WO2006110901和WO2006110902;美国专利No.7,998,713、No.7,932,063中所述的玉米秸秆。
在某些实施例中,改善或增强的β-葡糖苷酶活性反映于Nc3A多肽的改善或增强的纤维二糖酶活性中,所述纤维二糖酶活性使用纤维二糖作为底物例如在约30℃至约65℃(例如,约35℃至约60℃、约40℃至约55℃、约45℃至约55℃、约48℃至约52℃、约40℃、约45℃、约50℃、约55℃等)的温度下测得。在一些实施例中,当使用β-葡糖苷酶多肽水解磷酸溶胀纤维素(PASC)时,观察到与里氏木霉Bgl1相比,Nc3A多肽具有改善的β-葡糖苷酶活性,所述磷酸溶胀纤维素例如为使用如下文献的修改方案预处理的Avicel:Walseth,TAPPI 1971,35:228(Walseth,《纸浆与造纸工业技术协会志》,1971年,第35卷,第228页)和Wood,Biochem.J.1971,121:353-362(Wood,《生物化学杂志》,1971年,第121卷,第353-362页)。在一些实施例中,当使用β-葡糖苷酶多肽水解稀氨水预处理的玉米秸秆时,观察到与里氏木霉Bgl1相比,Nc3A多肽具有改善的β-葡糖苷酶活性,所述稀氨水预处理的玉米秸秆例如为国际公布的专利申请:WO2006110891、WO2006110899、WO2006110900、WO2006110901和 WO2006110902;美国专利No.7,998,713、No.7,932,063中所述的玉米秸秆。
在一些方面,Nc3A多肽和/或在施加在酶组合物中或方法中以水解木素纤维素生物质底物时为(a)源自、可得自或产生自粗糙脉孢菌;(b)包含与SEQ ID NO:2的氨基酸序列具有至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的氨基酸序列的重组多肽;(c)包含与SEQ ID NO:2的催化结构域即第19-875位氨基酸残基具有至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的氨基酸序列的重组多肽;(d)包含与SEQ ID NO:3的氨基酸序列的成熟形式即SEQ ID NO:2的第19-875位氨基酸残基具有至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的氨基酸序列的重组多肽;或(e)具有β-葡糖苷酶活性的(a)、(b)、(c)或(d)的片段。在某些实施例中,提供了具有β-葡糖苷酶活性的变体多肽,其包含SEQ ID NO:2的一个或多个氨基酸残基的置换、缺失和/或插入。
在一些方面,Nc3A多肽和/或在施加在酶组合物或方法中以水解木素纤维素生物质底物时为(a)由与SEQ ID NO:1具有至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的核酸序列所编码的多肽、或(b)在中等严格条件、高度严格条件或极高严格条件下杂交于SEQ ID NO:1或杂交于至少100个连续核苷酸的SEQ ID NO:1的子序列或杂交于其互补序列的多肽,其中多肽具有β-葡糖苷酶活性。在一些实施例中,Nc3A多肽和/或在施加在组合物或方法中以水解木素纤维素生物质底物时为这样的多肽,其由于遗传密码的简并性,不会在中等严格条件、高度严格条件或极高严格条件下杂交于SEQ ID NO:1或杂交于至少100个连续核苷酸的SEQ ID NO:1的子序列,但不过会编码具有β-葡糖苷酶活性并包含与SEQ ID NO:2的氨基酸序列或与SEQ ID NO:3的成熟β-葡糖苷酶序列具有至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的氨基酸序列的多肽。核酸序列可为合成的,并且不一定来源于粗糙脉孢菌,但核酸序列编码具有β-葡糖苷酶活性的多肽并且 包含与SEQ ID NO:2或与SEQ ID NO:3具有至少80%同一性的氨基酸序列。
在一些优选的实施例中,与野生型里氏木霉Bgl1(序列为SEQ ID NO:4)或包含里氏木霉Bgl1的酶组合物相比,Nc3A多肽或包含Nc3A多肽的组合物具有改善的β-葡糖苷酶活性。在某些实施例中,如使用氯-硝基-苯基-葡糖苷(CNPG)水解测定法测量的,本文的组合物和方法的Nc3A多肽的纤维素酶活性比里氏木霉Bgl1低至少约25%、或低约40%、或低约55%、或低约70%、或甚至低约80%。CNPG测定法在本文的实例2B中有所描述。在一些实施例中,如使用CNPG水解测定法测量的,本文的组合物和方法的Nc3A多肽的纤维素酶活性比黑曲霉B-glu高至少约15%、高至少约30%、高至少约45%、高至少约60%、高至少约75%、高至少约90%、或甚至高至少约2倍。
例如,如使用纤维二糖水解测定法测量的,本文的组合物和方法的Nc3A多肽的β-葡糖苷酶活性是里氏木霉Bgl1的至少约2倍(例如,高至少约2倍、高至少约3倍、高至少约4倍、高至少约4.5倍,诸如高至少约5倍)。纤维二糖水解测定法在本文的实例2C中有所描述。在一些实施例中,如使用纤维二糖水解测定法测量的,本文的组合物和方法的Nc3A多肽的β-葡糖苷酶活性为黑曲霉B-glu的约8/9或更少、约7/9或更少、约2/3或更少,诸如约1/2或更少。
在一些实施例中,与里氏木霉Bgl1相比,本文的组合物和方法的Nc3A多肽具有显著增强(例如,高至少约2倍、高至少约3倍、高至少约4倍、高至少约4.5倍,诸如高至少约5倍)的纤维二糖水解活性,但具有实质上降低或减少(例如,低至少约25%、或低约40%、或低约55%、或低约70%、或甚至约80%)的水解氯-硝基-苯基-葡糖苷(CNPG)的能力。例如,本文的组合物和方法的Nc3A多肽具有与黑曲霉B-glu相比实质上增强的CNPG水解活性,但具有与黑曲霉B-glu相比时明显较低的纤维二糖酶或纤维二糖水解活性。
在一些实施例中,与里氏木霉Bgl1相比,重组Nc3A多肽具有降低约5倍、10倍、15倍、20倍、25倍、或甚至30倍的对于CNPG/纤维二糖的水解活性比率。在一些实施例中,与黑曲霉B-glu相比,Nc3A多肽具有大致相同的对于CNPG/纤维二糖的相对水解活性比率。
在某些方面,与野生型里氏木霉Bgl1(序列为SEQ ID NO:4)相比,本发明的Nc3A多肽和包含Nc3A多肽的组合物具有改善的水解木素纤维素生物质底物的性能。在一些实施例中,与里氏木霉Bgl1或包含里氏木霉Bgl1的相同酶组合物从以相同方式预处理的相同生物质在相同糖化条件下产生的葡萄糖的水平相比,能从以特定方式预处理的给定木素纤维素生物质底物产生更大量的葡萄糖,由此可观察到Nc3A多肽或包含Nc3A多肽的组合物的改善的水解性能。例如,当使用0-10mg(例如,约1mg、约2mg、约3mg、约4mg、约5mg、约6mg、约7mg、约8mg、约9mg、约10mg)的β-葡糖苷酶(Nc3A多肽或里氏木霉Bgl1)来水解生物质底物中的1g葡聚糖时,由Nc3A多肽或由包含Nc3A多肽的酶组合物所产生的葡萄糖的量比由里氏木霉Bgl1或包含里氏木霉Bgl1(而非Nc3A多肽)的其他相同酶组合物所产生的量大至少约10%(例如,至少约10%、至少约15%、至少约20%、至少约25%、或甚至至少约30%或更多)。
在一些方面,与里氏木霉Bgl1或包含里氏木霉Bgl1的其他相同酶组合物从以相同方式预处理的相同生物质在相同糖化条件下的葡聚糖转化率%的水平相比,能从以特定方式预处理的给定木素纤维素生物质底物产生增加的葡聚糖转化率%,由此可观察到Nc3A多肽或包含Nc3A多肽的组合物的改善的水解性能。例如,当使用0-10mg(例如,约1mg、约2mg、约3mg、约4mg、约5mg、约6mg、约7mg、约8mg、约9mg、约10mg)的β-葡糖苷酶(Nc3A多肽或里氏木霉Bgl1)来水解生物质底物中的1g葡聚糖时,由Nc3A多肽或包含Nc3A多肽的酶组合物所产生的葡聚糖转化率%与由里氏木霉Bgl1或包含里氏木霉Bgl1(而非Nc3A多肽)的其他相同酶组合物所产生的葡聚糖转化率%相同或比其高至少约5%(例如,至少约5%、至少约10%、或至少约15%、至少约20%、至少约25%、或至少约30%)。
在另外方面,与里氏木霉Bgl1或包含里氏木霉Bgl1的其他相同组合物在相同糖化条件下水解相同生物质底物时的纤维二糖残余量相比,能通过水解以特定方式预处理的给定木素纤维素生物质底物而在产物混合物中获得更高的纤维二糖酶活性和/或减少量的残余纤维二糖,由此可观察到Nc3A多肽或包含Nc3A多肽的组合物的改善的水解性能。例如,由Nc3A多肽或包含Nc3A多肽的组合物通过水解以特定方式预处理的给定生物质 底物所产生的在产物混合物中的残余纤维二糖的量比由里氏木霉Bgl1或由包含里氏木霉Bgl1的其他相同酶组合物在相同糖化条件下通过水解以相同方式预处理的相同生物质底物所产生的在产物混合物中的残余纤维二糖的量少至少约5%(例如,至少约5%、至少约10%、或至少约15%)。当使用0-10mg(例如,约1mg、约2mg、约3mg、约4mg、约5mg、约6mg、约7mg、约8mg、约9mg、约10mg)的β-葡糖苷酶(例如,Nc3A多肽或里氏木霉Bgl1)来水解生物质底物中的1g葡聚糖时,情况亦是如此。
本发明组合物和方法的各方面包括包含如上文详述的重组Nc3A多肽和木素纤维素生物质的组合物。合适的木素纤维素生物质可例如来源于农作物、食物或饲料生产的副产物、木素纤维素废品、植物残体(包括例如草渣)或废纸或纸制废品。在某些实施例中,已对木素纤维素生物质进行一个或多个预处理步骤以使木聚糖、半纤维素、纤维素和/或木质素材料更易被酶触及或对酶更敏感,从而更适合酶法水解。合适的预处理方法可为例如在反应器中对生物质材料使用包含强酸和金属盐的稀溶液的催化剂。参见例如美国专利No.6,660,506、No.6,423,145。作为另一种选择,合适的预处理可为例如如美国专利No.5,536,325中所述的多步骤方法。在某些实施例中,根据美国专利No.6,409,841的公开内容,可使用约0.4%至约2%的强酸对生物质材料进行一个或多个阶段的稀酸水解。预处理方法的另外实施例可包括如下文献中所述的那些:例如,美国专利No.5,705,369;Gould,(1984)Biotech.&Bioengr.,26:46-52(Gould,1984年,《生物技术与生物工程》,第26卷,第46-52页);Teixeira et al.,(1999)Appl.Biochem&Biotech.,77-79:19-34(Teixeira等人,1999年,《应用生物化学与生物技术》,第77-79卷,第19-34页);国际公布的专利申请WO2004/081185;或美国专利公布No.20070031918或国际公布的专利申请WO06110901。
本发明还涉及编码具有β-葡糖苷酶活性的多肽的分离的多核苷酸,其中所述分离的多核苷酸选自:
(1)编码包含与SEQ ID NO:2或与SEQ ID NO:3具有至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的氨基酸序列的多肽的多核苷酸;
(2)与SEQ ID NO:1具有至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的多核苷酸,或者在中等严格条件、高度严格条件或极高严格条件下杂交于SEQ ID NO:1或杂交于其互补序列。
本发明组合物和方法的各方面包括采用编码包含与SEQ ID NO:2的氨基酸序列或成熟序列SEQ ID NO:3的氨基酸序列具有至少80%同一性(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的氨基酸序列的重组多肽的分离的核酸序列,来制备或产生具有β-葡糖苷酶活性的Nc3A多肽的方法。在一些实施例中,所述多肽还包含天然或非天然的信号肽,使得所产生的Nc3A多肽被宿主生物体分泌,例如,信号肽包含与SEQ ID NO:13(里氏木霉Bgl1的信号序列)具有至少90%同一性的序列。在某些实施例中,分离的核酸包含与SEQ IDNO:1具有至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的序列。在某些实施例中,分离的核酸还包含编码信号肽序列的核酸序列。在某些实施例中,信号肽序列可为选自SEQ ID NO:13-42的一者。在某些具体实施例中,编码SEQ ID NO:13的信号肽序列的核酸序列用于在里氏木霉中表达Nc3A多肽。
本发明组合物和方法的各方面包括包含与调控序列有效组合的上述分离的核酸的表达载体。
本发明组合物和方法的各方面包括包含表达载体的宿主细胞。在某些实施例中,宿主细胞为细菌细胞或真菌细胞。在某些实施例中,包含表达载体的宿主细胞为能够代谢由木素纤维素生物质的水解所产生的可溶性糖的产乙醇微生物,其中所述水解是化学和/或酶促过程的结果。
本发明组合物和方法的各方面包括包含上述宿主细胞和培养基的组合物。本发明组合物和方法的各方面包括产生Nc3A多肽的方法,该方法包括:将上述宿主细胞在合适的条件下培养于培养基中以产生β-葡糖苷酶。
本发明组合物和方法的各方面包括包含根据上述用于产生β-葡糖苷酶的方法所产生的培养基上清液中的Nc3A多肽的组合物。
在一些方面,本发明涉及包含编码如上文和本文所述的具有β-葡糖苷酶活性的多肽的多核苷酸的核酸构建体、重组表达载体、工程化宿主细 胞。在另外方面,本发明涉及使用核酸构建体、重组表达载体和/或工程化宿主细胞来制备或产生本发明的β-葡糖苷酶多肽或包含此类β-葡糖苷酶多肽的组合物的方法。具体地讲,本发明涉及例如包含有效连接至β-葡糖苷酶的成熟序列的合适信号肽的核酸构建体、分离的多核苷酸、核酸构建体、重组表达载体或包含此类核酸构建体的工程化宿主细胞,所述β-葡糖苷酶的成熟序列与SEQ ID NO:2或与SEQ ID NO:3的成熟序列具有至少80%同一性,或者由与SEQ ID NO:1具有至少80%同一性的多核苷酸编码。在一些实施例中,信号肽和β-葡糖苷酶序列来源于不同微生物。
还提供了包含与调控序列有效组合的分离的核酸的表达载体。另外,提供了包含该表达载体的宿主细胞。在另外的实施例中,提供了组合物,该组合物包含宿主细胞和培养基。
在一些实施例中,宿主细胞为细菌细胞或真菌细胞。在某些实施例中,宿主细胞为产乙醇微生物,该产乙醇微生物能够代谢通过水解木素纤维素生物质底物而产生的可溶性糖,其中所述水解可通过化学水解或酶法水解或这些方法的组合来进行,但所述产乙醇微生物也能够表达异源酶。在一些实施例中,宿主细胞为酿酒酵母或运动发酵单胞菌(Zymomonas mobilis)细胞,它们不仅能够表达异源多肽诸如本发明的Nc3A多肽,而且能够将糖发酵成乙醇和/或下游产物。在某些具体实施例中,表达β-葡糖苷酶的酿酒酵母细胞或运动发酵单胞菌细胞能够对由包含一种或多种β-葡糖苷酶的酶组合物从木素纤维素生物质产生的糖进行发酵。所述包含一种或多种β-葡糖苷酶的酶组合物可包含相同的β-葡糖苷酶或可包含一种或多种不同的β-葡糖苷酶。在某些实施例中,所述包含一种或多种β-葡糖苷酶的酶组合物可为由工程化宿主细胞产生的酶混合物,该工程化宿主细胞可为细菌或真菌细胞。当酿酒酵母或运动发酵单胞菌细胞表达本公开的Nc3A多肽时,Nc3A多肽可被表达但不被分泌。因此,必须将纤维二糖引入或“转运”到此类宿主细胞中,以便β-葡糖苷酶Nc3A多肽催化D-葡萄糖的释放。因此,在某些实施例中,除编码Nc3A多肽的基因外,还用纤维二糖转运体基因转化酿酒酵母或运动发酵单胞菌细胞。已将纤维二糖转运体和β-葡糖苷酶在酿酒酵母中表达,使得所得微生物能够发酵纤维二糖,例如Ha et al.,(2011)PNAS,108(2):504-509(Ha等人,2011年,《美国国家科学院院刊》,第108卷,第2期,第504-509页)中所述。已将另一种纤 维二糖转运体在毕赤酵母(Pichia)中表达,例如公布的美国专利申请No.20110262983中所述。已将纤维二糖转运体引入大肠杆菌(E.coli)中,例如Sekar et al.,(2012)Applied Environmental Microbiology,78(5):1611-1614(Sekar等人,2012年,《应用与环境微生物学》,第78卷,第5期,第1611-1614页)中所述。
在另外的实施例中,Nc3A多肽由宿主细胞异源表达。例如,Nc3A多肽由并非粗糙脉孢菌的工程化微生物表达。在一些实施例中,Nc3A多肽与一种或多种不同的纤维素酶基因共表达。在一些实施例中,Nc3A多肽与一种或多种半纤维素酶基因共表达。
在一些方面,提供了包含前面段落所述的重组Nc3A多肽的组合物以及制备此类组合物的方法。在一些实施例中,该组合物还包含一种或多种其他纤维素酶,其中所述一种或多种其他纤维素酶由宿主细胞连同Nc3A多肽一起共表达。例如,所述一种或多种其他纤维素酶可选自无或一种或多种其他β-葡糖苷酶、一种或多种纤维二糖水解酶和/或一种或多种内切葡聚糖酶。此类其他β-葡糖苷酶、纤维二糖水解酶和/或内切葡聚糖酶(如果存在的话)可由单个宿主细胞连同Nc3A多肽一起共表达。所述两种或更多种纤维素酶中的至少两种可彼此异源或者来源于不同生物体。例如,该组合物可包含两种β-葡糖苷酶,其中第一种为Nc3A多肽,并且第二β-葡糖苷酶并非来源于粗糙脉孢菌菌株。例如,该组合物可包含并非来源于粗糙脉孢菌的至少一种纤维二糖水解酶、一种内切葡聚糖酶或一种β-葡糖苷酶。在一些实施例中,纤维素酶中的一种或多种是宿主细胞内源性的,但被过表达或以与天然存在于宿主细胞中的水平不同的水平表达。例如,纤维素酶中的一种或多种可为里氏木霉宿主细胞天然存在的里氏木霉CBH1和/或CBH2,但当它们在里氏木霉宿主细胞中连同Nc3A多肽一起共表达时,CBH1和CBH2中任一者或两者被过表达或低表达。
在某些实施例中,包含重组Nc3A多肽的组合物还可包含一种或多种半纤维素酶,其中所述一种或多种半纤维素酶由宿主细胞连同Nc3A多肽一起共表达。例如,所述一种或多种半纤维素酶可选自一种或多种木聚糖酶、一种或多种β-木糖苷酶和/或一种或多种L-阿拉伯呋喃糖苷酶。此类其他木聚糖酶、β-木糖苷酶和L-阿拉伯呋喃糖苷酶(如果存在的话)可由单个宿主细胞连同Nc3A多肽一起共表达。在一些实施例中,该组合物可包 含并非来源于粗糙脉孢菌的至少一种β-木糖苷酶、木聚糖酶或阿拉伯呋喃糖苷酶。
在另外方面,包含重组Nc3A多肽的组合物还可包含一种或多种其他纤维素酶和一种或多种半纤维素酶,其中所述一种或多种纤维素酶和/或一种或多种半纤维素酶由宿主细胞连同Nc3A多肽一起共表达。例如,除与其他非纤维素酶、非半纤维素酶的酶或蛋白一起之外,Nc3A多肽还可连同一种或多种其他β-葡糖苷酶、一种或多种纤维二糖水解酶、一种或多种内切葡聚糖酶、一种或多种内切木聚糖酶、一种或多种β-木糖苷酶和一种或多种L-阿拉伯呋喃糖苷酶一起在相同宿主细胞中共表达。本发明组合物和方法的各方面因此包括包含上述除Nc3A多肽之外还共表达多种酶的宿主细胞以及培养基的组合物。本发明组合物和方法的各方面因此包括产生含Nc3A的酶组合物的方法,该方法包括:将共表达上述多种酶与Nc3A多肽的宿主细胞在合适的条件下培养于培养基中,以产生Nc3A和其他酶。还提供了组合物,该组合物包含根据本文方法产生于培养基上清液中的Nc3A多肽和其他酶。此类培养基上清液可按原样使用,进行很少或不进行产生后的加工,所述产生后的加工可通常包括用以移除细胞碎片的过滤、细胞杀死程序和/或用以富集或浓缩其中的酶的超滤或其他步骤。此类上清液在本文中称为“全发酵液”或“全纤维素酶发酵液”。
在另外方面,本发明涉及在适于降解或转化纤维素材料并适于从纤维素材料产生物质的条件下施加或使用上述组合物的方法。
在另一个方面,提供了用于将纤维素材料降解或转化成可发酵糖的方法,该方法包括:使优选地已进行一个或多个预处理步骤的纤维素材料与前面段落之一中所述的Nc3A多肽或包含此类多肽的组合物接触,以得到可发酵糖。
因此,本说明书涉及下列具体方面:
在第一方面,一种重组多肽,该重组多肽包含与SEQ ID NO:2或SEQ ID NO:3的氨基酸序列具有至少80%同一性的氨基酸序列,其中该多肽具有β-葡糖苷酶活性。
在第二方面,根据第一方面所述的重组多肽,其中当重组多肽和里氏木霉Bgl1用于水解木素纤维素生物质底物时,与里氏木霉Bgl1相比,该多 肽具有改善的β-葡糖苷酶活性。例如,木素纤维素生物质底物为经过一种或多种合适的预处理的底物。
在第三方面,根据第一方面或第二方面所述的重组多肽,其中所述改善的β-葡糖苷酶活性为增强的纤维二糖酶活性或改善的水解纤维二糖的能力,从而释放D-葡萄糖。
在第四方面,根据第一方面至第三方面中任一方面所述的重组多肽,其中所述改善的β-葡糖苷酶活性是在相同的糖化条件下,从木素纤维素生物质获得增加的葡萄糖收率以及相等或更低的总糖收率。
在第五方面,根据上文中第一方面至第四方面中任一方面所述的重组多肽,其中木素纤维素生物质为已在糖化之前进行预处理的木素纤维素生物质。所述预处理可适当地为本领域中已知的使木素纤维素生物质底物更易于被酶触及和水解的那些,其可包括例如本文所述的那些预处理方法。
在第六方面,根据第一方面至第五方面中任一方面所述的重组多肽,其中该多肽包含与SEQ ID NO:2或SEQ ID NO:3的氨基酸序列具有至少80%同一性的氨基酸序列。
在第七方面,根据第一方面至第五方面中任一方面所述的重组多肽,其中该多肽包含与SEQ ID NO:2或SEQ ID NO:3的氨基酸序列具有至少90%同一性的氨基酸序列。
在第八方面,一种组合物,该组合物包含根据上文中第一方面至第七方面中任一方面所述的重组多肽,还包含一种或多种其他纤维素酶。
在第九方面,根据第八方面所述的组合物,其中所述一种或多种其他纤维素酶选自无或一种或多种其他β-葡糖苷酶、一种或多种纤维二糖水解酶和一种或多种内切葡聚糖酶。
在第十方面,一种组合物,该组合物包含根据上文中第一方面至第七方面中任一方面所述的重组多肽,还包含一种或多种半纤维素酶。
在第十一方面,根据如上第八方面或第九方面所述的组合物,还包含一种或多种半纤维素酶。
在第十二方面,根据如上第十方面或第十一方面所述的组合物,其中所述一种或多种半纤维素酶选自一种或多种木聚糖酶、一种或多种β-木糖苷酶和一种或多种L-阿拉伯呋喃糖苷酶。
在第十三方面,一种核酸,该核酸编码根据第一方面至第七方面中任一方面所述的重组多肽。
在第十四方面,根据第十三方面所述的核酸,还包含信号序列。
在第十五方面,根据第十四方面所述的核酸,其中信号序列选自SEQID NO:13-42。
在第十六方面,一种表达载体,该表达载体包含与调控序列有效组合的根据第十三方面至第十五方面中任一方面所述的核酸。
在第十七方面,一种宿主细胞,该宿主细胞包含根据第十六方面所述的表达载体。
在第十八方面,根据第十七方面所述的宿主细胞,其中该宿主细胞为细菌细胞或真菌细胞。多种细菌细胞已知是如本文所述的合适的宿主细胞。多种真菌细胞也是合适的。在一些实施例中,细菌或真菌宿主细胞可为这样的宿主细胞,其为能够将某些单体糖发酵或代谢成乙醇的产乙醇生物。例如,细菌产乙醇运动发酵单胞菌可为表达本公开的β-葡糖苷酶多肽的宿主细胞。例如,真菌产乙醇酿酒酵母也可用作宿主细胞以产生本公开的β-葡糖苷酶多肽。
在第十九方面,一种组合物,该组合物包含根据第十六方面或第十七方面所述的宿主细胞和培养基。
在第二十方面,一种产生β-葡糖苷酶的方法,该方法包括将根据第十七方面或第十八方面所述的宿主细胞在合适条件下培养于培养基中,以产生β-葡糖苷酶。
在第21方面,一种组合物,该组合物包含根据上文中第20方面所述的方法产生于培养基上清液中的β-葡糖苷酶。
在第22方面,一种用于水解木素纤维素生物质底物的方法,该方法包括使木素纤维素生物质底物与根据第一方面至第七方面中任一方面所述的多肽或与根据第21方面所述的组合物接触,以得到葡萄糖和/或其他糖。
根据如下描述,Nc3A组合物和方法的这些及其他方面将显而易见。
附图说明
图1描绘了pENTR/D-TOPO-Bgl1(943/942)载体的图谱。
图2描绘了pTrex3g 943/942构建体的图谱。
图3A-图3C描绘了使用磷酸溶胀纤维素酶(PASC)作为底物,在50℃下持续1.5h时Nc3A与基准里氏木霉Bgl1的水解性能的比较,其中将Nc3A和Bgl1加入由根据公布的专利申请WO 2011/038019中所述的工程化里氏木霉菌株产生的背景全纤维素酶中,并且将β-葡糖苷酶+全纤维素酶混合物以各种β-葡糖苷酶剂量与PASC底物混合。图3A描绘了根据本文的实例4-A中所述的条件,各种β-葡糖苷酶剂量下的葡聚糖转化率%的测量和比较。图3B描绘了根据本文的实例4-A中所述的条件,各种β-葡糖苷酶剂量下的总葡萄糖产量的测量和比较。图3C描绘了根据本文的实例4-A中所述的条件,以各种β-葡糖苷酶剂量水解PASC所产生的纤维二糖的测量和比较。
图4A-图4C描绘了使用稀氨水预处理的玉米秸秆(DACS)作为底物,在50℃下持续2天时Nc3A与基准里氏木霉Bgl1的水解性能的比较,其中将Nc3A和Bgl1加入由根据公布的专利申请WO 2011/038019中所述的工程化里氏木霉菌株产生的背景全纤维素酶中,并且将β-葡糖苷酶+全纤维素酶混合物以各种β-葡糖苷酶剂量与DACS底物混合。图4A描绘了各种β-葡糖苷酶剂量下的总葡聚糖转化率的测量和比较。图4B描绘了各种β-葡糖苷酶剂量下的总葡萄糖产量的测量和比较。图4C描绘了各种β-葡糖苷酶剂量下通过水解DACS得到的糖化混合物中纤维二糖水平的测量和比较。
图5描绘了酵母穿梭载体pSC11构建体,其包含经优化和合成以在酿酒酵母产乙醇生物中表达Nc3A多肽的Nc3A基因。
图6描绘了运动发酵单胞菌整合载体pZC11,其包含经优化和合成以在运动发酵单胞菌产乙醇生物中表达Nc3A多肽的Nc3A基因。
图7A-图7D描绘了本公开的序列和序列标识符。
具体实施方式
I.综述
本文描述了涉及重组β-葡糖苷酶Nc3A的组合物和方法,该重组β-葡糖苷酶属于来自粗糙脉孢菌的糖基水解酶家族3。本发明组合物和方法部分地基于这样的观察:当组合物用于水解木素纤维素生物质材料或给料时,与例如已知的里氏木霉的基准高保真性β-葡糖苷酶Bgl1相比,重组Nc3A多肽具有更高纤维素酶活性并且作为酶组合物的组分更加稳健。Nc3A多肽 的这些特征使它们或其变体适用于许多过程,包括例如适用于木素纤维素生物质给料的转化或水解。
在更详细地描述本发明组合物和方法之前,应当理解,本发明组合物和方法不限于所述的具体实施例,因为这些当然可改变。还应当理解,本文所用的术语仅出于描述具体实施例的目的,并非旨在进行限制,因为本发明组合物和方法的范围将仅受所附权利要求的限定。
当提供值的范围时,应当理解,介于该范围的上限与下限之间的每一个中间值(除非上下文另有明确指明,否则精确到下限单位的十分之一)和所述范围内的任何其他所述值或中间值均涵盖于本发明的组合物和方法内。这些较小范围的上限和下限可以独立地被包括在较小的范围内,并且也涵盖于本发明组合物和方法内,除非是在所述范围内的任何明确排除的界限。当所述范围包括界限中的一者或两者时,排除这些被包括的界限中的任一者或两者的范围,也被包括在本发明组合物和方法中。
某些范围在本文中通过前面带有术语“约”的数值表述。术语“约”在本文中用于为它之后的确切数字以及接近或近似该术语之后的数字的数字提供字面支持。在确定数字是否接近或近似明确列举的数字时,接近或近似的未列举的数字可以是在其中表述它的上下文中提供明确列举的数字的基本上等值的数字。例如,与数值相关的术语“约”是指该数值的-10%至+10%的范围,除非该术语在上下文中另有明确定义。又如,短语“约6的pH值”是指5.4至6.6的pH值,除非pH值另有明确定义。
本文提供的标题并不是对本发明组合物和方法的各个方面或实施例的限制,这些方面或实施例都可以通过整体参考本说明书而获得。因此,通过整体参考本说明书可更完全地限定下文定义的术语。
本文档被组织成多个章节,以便于阅读;然而,读者将会认识到,在一个章节中进行的陈述可以应用到其他章节。因此,本公开不同章节使用的标题不应理解为限制性的。
除非另有定义,否则本文所用的所有技术和科学术语均具有与本发明组合物和方法所属领域普通技术人员通常所理解的相同的含义。尽管与本文所述的那些相似或等同的任何方法和材料也可用于实践或测试本发明组合物和方法,但是现在描述的是代表性的示例性方法和材料。
在本说明书中引用的所有出版物和专利以引用的方式并入本文,如同每个单独的出版物或专利明确地并单独地指示为以引用的方式并入,并且以引用方式并入本文来公开和描述与引用出版物有关的方法和/或材料。任何出版物的引用是关于提交日前的其公开内容,并不应视为承认本发明组合物和方法由于在先发明而无权早于此类出版物。另外,所提供的公布日期可能与实际的公布日期不同,这可能需要独立地核实。
根据此详细描述,应用下面的缩写和定义。注意,除非上下文另有明确指明,否则单数形式“一个”、“一种”和“所述(该)”包括多个指代物。因此,例如,提及“酶”包括多个此种酶,而提及“剂量”则包括提及一个或多个剂量以及本领域技术人员已知的其等同物,等等。
还应当注意,权利要求书可能撰写成排除了任何任选元素。由此,该陈述旨在充当使用与权利要求书要素的引用相关的诸如“仅有”、“只有”等等的排他性术语或使用“负性”限制的先行基础。
当关于对象细胞、核酸、多肽/酶或载体而使用时,术语“重组”指该对象已从其天然状态经过修饰。因此,例如,重组细胞表达未在天然(非重组)形式的细胞中存在的基因,或者以不同于自然界中存在的水平或条件表达天然基因。重组核酸可与天然序列相差一个或多个核苷酸和/或在表达载体中有效连接至异源序列,例如异源启动子、允许分泌的信号序列等。重组多肽/酶可与天然序列相差一个或多个氨基酸和/或与异源序列融合。包含编码β-葡糖苷酶的核酸的载体为例如重组载体。
还应当注意,如本文所用,术语“基本上由…组成”是指这样的组成,其中该术语之后的组分与其他已知的组分共存,所述其他已知的组分总量少于总组成的30重量%,并且不会促进或干扰组分的作用或活性。
还应当注意,如本文所用,术语“包含”意指包括但不限于术语“包含”之后的组分。术语“包含”之后的组分是必要或强制性的,但包含该组分的组合物还可包含其他非强制性或任选的组分。
还应当注意,如本文所用,术语“由…组成”意指包括并限于术语“由…组成”之后的组分。因此术语“由…组成”之后的组分是必要或强制性的,并且组合物中不存在其他组分。
对于本领域技术人员而言,阅读本公开后将显而易见的是,本文所描述和图示的各个实施例中的每一个都具有分立的组分和特征,在不脱离本 文所述的本发明组合物和方法的范围或实质的前提下,这些组分和特征可容易地与其他若干实施例中任一者的特征分离或合并。任何所列举的方法可以按列举的事件顺序或按逻辑上可行的任何其他顺序实施。
II.定义
“β-葡糖苷酶”是指E.C.3.2.1.21的β-D-葡糖苷葡萄糖水解酶。因此,术语“β-葡糖苷酶活性”是指催化β-D-葡萄糖或纤维二糖的水解以释放D-葡萄糖的能力。β-葡糖苷酶活性可使用例如纤维二糖酶测定法确定,该纤维二糖酶测定法测量酶催化纤维二糖底物的水解以得到D-葡萄糖的能力,如本公开的实例2C中所述。
如本文所用,“Nc3A”或“Nc3A多肽”是指属于来源于粗糙脉孢菌的糖基水解酶家族3的β-葡糖苷酶(例如,重组β-葡糖苷酶)(和其变体),与基准β-葡糖苷酶即具有SEQ ID NO:4的氨基酸序列的野生型里氏木霉Bgl1多肽相比时,其具有改善的水解木素纤维素生物质底物的性能。根据本发明组合物和方法的各方面,Nc3A多肽包括具有SEQ ID NO:2所示的氨基酸序列的那些多肽,以及与SEQ ID NO:2的氨基酸序列、或与成熟序列SEQ ID NO:2、或与SEQ ID NO:2的至少100个残基长的片段具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的衍生物或变体多肽,其中Nc3A多肽不仅具有β-葡糖苷酶活性并能够催化纤维二糖转化成D-葡萄糖,而且与里氏木霉Bgl1相比,具有更高的β-葡糖苷酶活性并具有更高的催化纤维二糖转化成D-葡萄糖的能力。
要用于本公开的组合物和方法中的Nc3A多肽将具有SEQ ID NO:2的氨基酸序列的多肽、或由SEQ ID NO:2的第19至875位残基组成的多肽、或成熟序列SEQ ID NO:3的至少5%、优选地至少10%、更优选地至少20%、甚至更优选地至少25%或更多的β-葡糖苷酶活性。
“家族3糖基水解酶”或“GH3”是指符合根据如下文献的分类的糖基水解酶家族3的定义的多肽:Henrissat,Biochem.J.280:309-316(1991)(Henrissat,《生物化学杂志》,第280卷,第309-316页,1991年)和Henrissat&Cairoch,Biochem.J.,316:695-696(1996)(Henrissat和Cairoch,《生物化学杂志》,第316卷,第695-696页,1996年)。
可分离或纯化根据本文所述的本发明组合物和方法的Nc3A多肽。所谓纯化或分离意指通过将Nc3A从与其天然相关的天然存在的成分中的一些或所有分离而使Nc3A多肽从其天然状态改变。此类分离或纯化可通过本领域公认的分离技术诸如离子交换色谱法、亲和色谱法、疏水分离、渗析、蛋白酶处理、硫酸铵沉淀法或其他蛋白质盐沉淀法、离心、尺寸排阻色谱法、过滤、微量过滤、凝胶电泳或梯度分离来实现,以移除最终组合物中不期望的全细胞、细胞碎片、杂质、外来蛋白质或酶。进一步可能的是,然后将能提供另外益处的多种成分加入含Nc3A的组合物中,例如,活化剂、抗抑制剂、所需离子、控制pH的化合物、或者其他酶或化学品。
如本文所用,“微生物”是指细菌、真菌、病毒、原生动物、以及其他微生物或微观生物体。
如本文所用,多肽的“衍生物”或“变体”意指通过如下方式衍生自前体多肽(例如,天然多肽)的多肽:将一个或多个氨基酸添加到C端和N端中任一者或两者上,在氨基酸序列中的一个或多个不同位点置换一个或多个氨基酸,在多肽的任一个或两个末端或在氨基酸序列的一个或多个位点缺失一个或多个氨基酸,或者在氨基酸序列的一个或多个位点插入一个或多个氨基酸。Nc3A衍生物或变体的制备可以任何方便的方式实现,例如通过修饰编码天然多肽的DNA序列、将该DNA序列转化到合适的宿主中、以及表达经修饰的DNA序列以形成衍生物/变体Nc3A。衍生物或变体还包括经化学修饰例如糖基化或以其他方式改变Nc3A多肽的特性的Nc3A多肽。虽然Nc3A的各种衍生物和变体被本发明组合物和方法所涵盖,但与在相同木素纤维素生物质底物水解条件下的SEQ ID NO:4的野生型里氏木霉Bgl1相比时,此类衍生物和变体将表现出改善的β-葡糖苷酶活性。
在某些方面,本文组合物和方法的Nc3A多肽还可涵盖多肽的功能片段或具有β-葡糖苷酶活性的多肽片段,其衍生自亲本多肽,所述亲本多肽可为包含SEQ ID NO:2或由SEQ ID NO:2组成的全长多肽、或包含SEQ ID NO:3或由SEQ ID NO:3组成的成熟序列。功能多肽可在N端区域或C端区域的任一者中或在这两个区域中被截短而生成亲本多肽的片段。出于本公开的目的,功能片段必须具有亲本多肽的至少20%、更优选地至少30%、40%、50%或优选地至少60%、70%、80%、或甚至更优选地至少90%的β-葡糖苷酶活性。
在某些方面,Nc3A衍生物/变体将与SEQ ID NO:2的氨基酸序列或与成熟序列SEQ ID NO:3具有80%至99%(或更大)氨基酸序列同一性的任何值,例如,与SEQ ID NO:2的氨基酸序列或与成熟序列SEQ ID NO:3具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%氨基酸序列同一性。在一些实施例中,氨基酸置换为使用L-氨基酸的“保守氨基酸置换”,其中一个氨基酸被另一个生物学上类似的氨基酸替换。保守氨基酸置换是保留被置换的氨基酸的总体电荷、疏水性/亲水性和/或空间位阻的那些置换。保守置换的例子是下列各组之间的那些置换:Gly/Ala、Val/Ile/Leu、Lys/Arg、Asn/Gln、Glu/Asp、Ser/Cys/Thr和Phe/Trp/Tyr。衍生物可例如相差少至1至10个氨基酸残基,诸如6-10个、少至5个、少至4个、3个、2个、或甚至1个氨基酸残基。在一些实施例中,Nc3A衍生物可具有N端和/或C端缺失,其中不包含缺失末端部分的Nc3A衍生物与SEQ ID NO:2或SEQ ID NO:3中的连续子区域相同。
如本文所用,相对于本文鉴定的氨基酸或核苷酸序列的“序列同一性百分比(%)”被定义为在对序列进行比对并根据需要引入空位以实现最大序列同一性百分比并且不将任何保守置换视为序列同一性的一部分之后,与Nc3A序列中的氨基酸残基或核苷酸相同的候选序列中的氨基酸残基或核苷酸的百分比。
所谓“同源物”,应当意指与所讨论的氨基酸序列和所讨论的核苷酸序列具有指定程度的同一性的实体。同源序列被认为包括与所讨论的序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或甚至99%同一性的氨基酸序列,该同一性使用常规的序列比对工具(例如,Clustal、BLAST等等)测量。通常,除非另外指明,否则同源物将包括与所讨论的氨基酸序列相同的活性位点残基。
用于执行序列比对和确定序列同一性的方法是技术人员已知的,可在不进行过多实验的情况下执行,并且可确切获得同一性值的计算。参见例如Ausubel et al.,eds.(1995)Current Protocols in Molecular Biology,Chapter19(Greene Publishing and Wiley-Interscience,New York)(Ausubel等人编辑,1995年,《分子生物学现行规范》,第19章,格林出版与威立国际科 学,纽约);以及ALIGN程序(Dayhoff(1978)in Atlas of Protein Sequence and Structure 5:Suppl.3(National Biomedical Research Foundation,Washington,D.C.)(Dayhoff,1978年,《蛋白质序列和结构图册》,第5卷,增刊3,国家生物医学研究基金会,华盛顿特区))。多种算法可用于对序列进行比对并确定序列同一性,并且包括例如,Needleman et al.(1970)J.Mol.Biol.48:443(Needleman等人,1970年,《分子生物学杂志》,第48卷,第443页)的同源性比对算法;Smith et al.(1981)Adv.Appl.Math.2:482(Smith等人,1981年,《应用数学进展》,第2卷,第482页)的局部同源性算法;Pearson et al.(1988)Proc.Natl.Acad.Sci.85:2444(Pearson等人,1988年,《美国国家科学院院刊》,第85卷,第2444页)的相似性搜索方法;Smith-Waterman算法(Meth.Mol.Biol.70:173-187(1997)(《分子生物学方法》,第70卷,第173-187页,1997年));以及BLASTP、BLASTN和BLASTX算法(参见Altschul et al.(1990)J.Mol.Biol.215:403-410(Altschul等人,1990年,《分子生物学杂志》,第215卷,第403-410页))。
使用这些算法的计算机化程序也可供使用,并且包括但不限于:ALIGN或Megalign(DNASTAR)软件、或WU-BLAST-2(Altschul et al.,(1996)Meth.Enzym.,266:460-480(Altschul等人,1996年,《酶学方法》,第266卷,第460-480页));或美国威斯康星州麦迪逊(Madison,Wisconsin,USA)的遗传学计算组(Genetics Computing Group(GCG))软件包版本8中可获得的GAP、BESTFIT、BLAST、FASTA和TFASTA;以及加利福尼亚州山景城的Intelligenetics公司(Intelligenetics,Mountain View,California)所开发的PC/Gene程序中的CLUSTAL。本领域的技术人员可确定用于测量比对的适当参数,包括在正进行比较的序列的长度上实现最大比对所需的算法。优选地,使用由程序确定的默认参数来确定序列同一性。具体地讲,可使用Clustal W(Thompson J.D.et al.(1994)Nucleic Acids Res.22:4673-4680(Thompson J.D.等人,1994年,《核酸研究》,第22卷,第4673-4680页))以以下默认参数确定序列同一性,即:
如本文所用,“表达载体”意指包含有效连接至合适控制序列的DNA序列的DNA构建体,所述控制序列能够影响DNA在合适宿主中的表达。这种控制序列可包括影响转录的启动子、控制转录的任选的操纵子序列、编码合适的mRNA上核糖体结合位点的序列、以及控制转录和翻译的终止的序列。不同细胞类型可与不同表达载体一起使用。枯草芽孢杆菌(Bacillus subtilis)中使用的载体的示例性启动子为AprE启动子;变铅青链霉菌(Streptomyces lividans)中使用的示例性启动子为A4启动子(来自黑曲霉);大肠杆菌中使用的示例性启动子为Lac启动子,酿酒酵母中使用的示例性启动子为PGK1,黑曲霉中使用的示例性启动子为glaA,并且里氏木霉的示例性启动子为cbhI。载体可以是质粒、噬菌体颗粒或仅仅是潜在基因组插入物。一旦转化到合适的宿主中,载体就可独立于宿主基因组复制和发挥作用,或者在合适的条件下可整合到基因组本身中。在本说明书中,质粒和载体有时可互换使用。然而,本发明组合物和方法旨在包括其他形式的表达载体,所述表达载体起到等同功能并且是本领域已知的或成为本领域已知的。因此,广泛的宿主/表达载体组合可用于表达本文所述的DNA序列。可用的表达载体例如可由如下组成:染色体、非染色体和合成DNA序列的片段,诸如SV40和已知细菌质粒的各种已知衍生物,例如来自大肠杆菌的质粒,包括col E1、pCR1、pBR322、pMb9、pUC 19及其衍生物;广泛宿主范围质粒,例如RP4;噬菌体DNA,例如噬菌体λ的各种衍生物例如NM989,以及其他DNA噬菌体例如M13和丝状单链DNA噬菌体;酵母质粒,诸如2μ质粒或其衍生物;可用于真核细胞的载体,诸如可用于动物细胞的载体;以及衍生自质粒和噬菌体DNA的组合的载体,诸如经修饰以采用噬菌体DNA或其他表达控制序列的质粒。使用本发明组合 物和方法的表达载体的表达技术是本领域已知的,并且在例如Sambrook et al.,Molecular Cloning:A Laboratory Manual, Second Edition,Cold Spring Harbor Press(1989)(Sambrook等人,《分子克隆:实验室指南》,第二版,冷泉港出版社,1989年)中大体进行了描述。通常,通过经整合事件直接插入具体物种的基因组中,将包含本文所述的DNA序列的此类表达载体转化到单细胞宿主中(参见例如Bennett&Lasure,More Gene Manipulations in Fungi,Academic Press,San Diego,pp.70-76(1991)(Bennett和Lasure,《真菌中更多的基因操作》,学术出版社,圣地亚哥,第70-76页,1991年)以及其中引用的描述真菌宿主中靶向基因组插入的文章)。
如本文所用,“宿主菌株”或“宿主细胞”意指包含根据本发明组合物和方法的DNA的表达载体的合适宿主。可用于本发明组合物和方法的宿主细胞一般为原核或真核宿主,包括可实现表达的任何可转化微生物。具体地讲,宿主菌株可为枯草芽孢杆菌、变铅青链霉菌、大肠杆菌、里氏木霉、酿酒酵母或黑曲霉。在某些实施例中,宿主细胞可为产乙醇微生物,其可为例如酵母诸如酿酒酵母,或细菌产乙醇生物诸如运动发酵单胞菌。当酿酒酵母或运动发酵单胞菌用作宿主细胞时,并且如果不使β-葡糖苷酶基因从宿主细胞分泌而是在细胞内表达,则可将纤维二糖转运体基因引入宿主细胞中,以允许细胞内表达的β-葡糖苷酶作用于纤维二糖底物并释放葡萄糖,进而葡萄糖随后或立即被微生物代谢并转化成乙醇。
使用通过重组DNA技术构建的载体来转化或转染宿主细胞。此类转化的宿主细胞可具有如下一者或两者的能力:使编码Nc3A(及其衍生物或变体(突变体))的载体复制以及表达所需的肽产物。在根据本发明组合物和方法的某些实施例中,“宿主细胞”意指木霉属物种的细胞和由木霉属物种的细胞产生的原生质体两者。
关于细胞而使用的术语“转化”、“稳定转化”和“转基因”意指细胞包含整合到其基因组中或作为经多代保留下来的附加体而携带的非天然(例如,异源)核酸序列。
在将核酸序列插入细胞的上下文中,术语“引入”意指本领域已知的“转染”、“转化”或“转导”。
“宿主菌株”或“宿主细胞”为在其中引入表达载体、噬菌体、病毒或其他DNA构建体,包括编码所关注的多肽(例如,β-葡糖苷酶)的多核 苷酸的生物体。示例性宿主菌株是能够表达所关注的多肽的微生物细胞(例如,细菌、丝状真菌和酵母)。术语“宿主细胞”包括由细胞产生的原生质体。
关于多核苷酸或多肽的术语“异源”是指并非天然存在于宿主细胞中的多核苷酸或多肽。
关于多核苷酸或多肽的术语“内源”是指天然存在于宿主细胞中的多核苷酸或多肽。
术语“表达”是指基于核酸序列产生多肽的过程。所述过程包括转录和翻译二者。
因此,将木素纤维素生物质底物转化成乙醇的过程在一些实施例中可包括两种β-葡糖苷酶活性。例如,可在糖化或水解步骤期间将第一β-葡糖苷酶活性施加到木素纤维素生物质底物,并且可在发酵步骤中将第二β-葡糖苷酶活性作为产乙醇微生物的一部分施加,在发酵步骤期间,由糖化或水解步骤产生的单体糖或可发酵糖发生代谢。第一β-葡糖苷酶活性和第二β-葡糖苷酶活性可在一些实施例中由相同β-葡糖苷酶多肽的存在所产生。例如,糖化中的第一β-葡糖苷酶活性可由本发明的Nc3A多肽的存在所产生,而发酵阶段的第二β-葡糖苷酶活性可由产乙醇微生物表达不同β-葡糖苷酶所产生。又如,第一β-葡糖苷酶活性和第二β-葡糖苷酶活性可由糖化或水解步骤和发酵步骤中的相同多肽的存在所产生。例如,本发明的相同Nc3A多肽可在一些实施例中提供用于水解或糖化步骤和发酵步骤两者的β-葡糖苷酶活性。
在某些其他实施例中,将木素纤维素生物质底物转化成乙醇的过程可包括两种β-葡糖苷酶活性,而糖化或水解步骤和发酵步骤例如在相同罐中同步发生。两种或更多种β-葡糖苷酶多肽可有助于β-葡糖苷酶活性,其中一种可为本发明的Nc3A多肽。
在某些另外的实施例中,将木素纤维素生物质转化成乙醇的过程可包括单种β-葡糖苷酶活性,而糖化或水解步骤或发酵步骤中任一者而非这两个步骤涉及β-葡糖苷酶的参与。例如,本发明的Nc3A多肽或包含Nc3A多肽的组合物可用于糖化步骤。又如,用于水解木素纤维素生物质底物的酶组合物不包含β-葡糖苷酶活性,而产乙醇微生物表达β-葡糖苷酶多肽,例如,本发明的Nc3A多肽。
如本文所用,“信号序列”意指结合于多肽的N-端部分并且促进成熟形式的多肽分泌到细胞之外的氨基酸序列。信号序列的该定义为功能定义。细胞外多肽的成熟形式不含信号序列,其在分泌过程期间被切除。虽然Nc3A的天然信号序列可用于本发明组合物和方法的各方面,但可使用其他非天然的信号序列(例如,SEQ ID NO:13)。当提及本文的多肽时,术语“成熟”意指在翻译和任何翻译后修饰之后的其最终形式的多肽。例如,本发明的Nc3A多肽具有一种或多种成熟形式,其中的至少一种具有SEQ ID NO:3的氨基酸序列。
本发明的β-葡糖苷酶多肽可称为“前体”、“未成熟的”或“全长的”(在这种情况下它们包含信号序列),或者可称为“成熟的”(在这种情况下它们不含信号序列)。多肽的成熟形式通常是最有用的。除非另有说明,否则本文所用的氨基酸残基编号方式是指各淀粉酶多肽的成熟形式。本发明的β-葡糖苷酶多肽也可被截短以移除N端或C端,只要所得多肽保持β-葡糖苷酶活性即可。
本发明的β-葡糖苷酶多肽也可为“嵌合”或“杂合”多肽,因为其包含第一β-葡糖苷酶多肽的至少一部分和第二β-葡糖苷酶多肽的至少一部分(此类嵌合β-葡糖苷酶多肽可例如使用涉及对β-葡糖苷酶每者上的结构域进行交换的已知技术而衍生自第一β-葡糖苷酶和第二β-葡糖苷酶)。本发明β-葡糖苷酶多肽还可包含异源信号序列、允许跟踪或纯化的表位等等。当术语“异源”用来指用于表达所关注的多肽的信号序列时,其意指该信号序列例如与所关注的多肽来源于不同的微生物。用于表达本文Nc3A多肽的合适异源信号序列的例子可为例如来自里氏木霉的那些。
如本文所用,“功能附接”或“有效连接”意指具有已知或所需活性的调控区或功能结构域诸如启动子、终止子、信号序列或增强子区以一定方式附接或连接到靶标(例如,基因或多肽),使得调控区或功能结构域根据其已知或所需活性来控制该靶标的表达、分泌或功能。
如本文所用,术语“多肽”和“酶”可互换使用,是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。本文中使用氨基酸残基的常规单字母或三字母编码。聚合物可为直链或支链的,其可包含经修饰的氨基酸,并且其可被非氨基酸隔断。所述术语还涵盖天然修饰或通过干预修饰的氨基酸聚合物;例如二硫键形成、糖基化、脂质化、乙酰化、磷酸化或 任何其他操作或修饰,诸如与标记组分缀合。还包括在该定义中的是例如含有一个或多个氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
如本文所用,“野生型”与“天然”基因、酶或菌株是指天然存在的那些基因、酶或菌株。
关于多肽的术语“野生型”、“亲本”或“参考”是指不在一个或多个氨基酸位置处包括人为制造的置换、插入或缺失的天然存在的多肽。类似地,关于多核苷酸的术语“野生型”、“亲本”或“参考”是指不包括人为制造的核苷改变的天然存在的多核苷酸。然而,编码野生型多肽、亲本多肽或参考多肽的多核苷酸不局限于天然存在的多核苷酸,而是涵盖编码野生型多肽、亲本多肽或参考多肽的任何多核苷酸。
如本文所用,“变体多肽”是指通过置换、添加或缺失一个或多个氨基酸,通常利用重组DNA技术,从亲本(或参考)多肽衍生的多肽。变体多肽可与亲本多肽相差少量氨基酸残基。它们可由其与亲本多肽的一级氨基酸序列同源性/同一性的水平限定。合适地,变体多肽与亲本多肽具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%的氨基酸序列同一性。
如本文所用,“变体多核苷酸”编码变体多肽;与亲本多核苷酸具有指定程度的同源性/同一性;或在严格条件下与亲本多核苷酸或其互补序列杂交。合适地,变体多核苷酸与亲本多核苷酸或与亲本多核苷酸的互补序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%的核苷酸序列同一性。测定同一性百分比的方法是本领域已知的并且在上文中进行了描述。
术语“源自”涵盖术语“来源于”、“从…获得”、“可由…获得”、“分离自”和“由…产生”,并且通常是指一种指定材料在另一指定材料中找到其起源或者具有可参照另一指定材料而描述的特征。
如本文所用,术语“杂交条件”是指进行杂交反应的条件。这些条件通常根据测量杂交的条件的“严格性”程度来分类。严格性程度可例如基于核酸结合复合物或探针的解链温度(Tm)。例如,“最高严格性”通常在 约Tm-5℃(比探针的Tm低5℃)下发生;“高严格性”在比Tm低约5℃-10℃下发生;“中等严格性”在比探针Tm低约10℃-20℃下发生;并且“低严格性”在比Tm低约20℃-25℃下发生。作为另一种选择或除此之外,杂交条件可基于杂交的盐或离子强度条件,和/或基于一种或多种严格性洗涤,例如:6×SSC=极低严格性;3×SSC=低至中等严格性;1×SSC=中等严格性;并且0.5×SSC=高严格性。在功能上,可以使用最高严格性条件来鉴定与杂交探针具有严格的同一性或接近严格的同一性的核酸序列;而高严格性条件用于鉴定与探针具有约80%或更高序列同一性的核酸序列。对于需要高选择性的应用,通常需要使用相对严格的条件来形成杂交物(例如,使用相对较低的盐和/或高温条件)。
如本文所用,术语“杂交”是指用于使一条核酸链通过本领域已知的碱基配对与互补链接合的方法。更具体地讲,“杂交”是指在印迹杂交技术和PCR技术期间一条核酸链与互补链形成双链即与之碱基配对的过程。如果某核酸序列与参考核酸序列在中等至高度严格杂交和洗涤条件下彼此特异性杂交,则认为这两个序列“选择性杂交”。杂交条件基于核酸结合复合物或探针的解链温度(Tm)。例如,“最高严格性”通常在约Tm-5℃(比探针的Tm低5℃)下发生;“高严格性”在比Tm低约5℃-10℃下发生;“中等严格性”在比探针Tm低约10℃-20℃下发生;并且“低严格性”在比Tm低约20℃-25℃下发生。在功能上,可以使用最高严格性条件来鉴定与杂交探针具有严格的同一性或接近严格的同一性的序列;而可使用中等或低严格性杂交来鉴定或检测多核苷酸序列同源物。
中等严格性和高严格性杂交条件是本领域熟知的。例如,可通过如下步骤进行中等严格性杂交:在包含20%甲酰胺、5×SSC(150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5×邓哈特溶液、10%硫酸葡聚糖和20mg/mL变性剪切的鲑精DNA的溶液中于37℃下过夜孵育,然后在1×SSC中于约37℃至50℃下洗涤滤膜。高严格性杂交条件可为以65℃和0.1×SSC(其中1×SSC=0.15M NaCl、0.015M柠檬酸三钠,pH 7.0)进行的杂交。作为另一种选择,高严格性杂交条件可于约42℃下在50%甲酰胺、5×SSC、5×邓哈特溶液、0.5%SDS和100μg/mL变性载体DNA中进行,然后在2×SSC和0.5%SDS中于室温下洗涤两次,并且在0.1×SSC和0.5%SDS中于42℃下再洗涤两次。并且极高严格性杂交条件可为以68℃ 和0.1×SSC进行的杂交。本领域的技术人员知道如何根据适应诸如探针长度等等的因素的需要来调整温度、离子强度等。
编码变体β-葡糖苷酶的核酸相比于SEQ ID NO:1与其相同互补链的核苷酸之间形成的双链可具有降低1℃-3℃或更多的Tm。
在关于至少两条核酸或多肽的上下文中,短语“实质上相似”或“实质上相同”意指,多核苷酸或多肽包含与亲本或参考序列具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或甚至至少约99%的同一性,或者不包括在不增加功能性的情况下仅为避开本描述所作的氨基酸置换、插入、缺失或修饰的序列。
如本文所用,“表达载体”是指DNA构建体,其含有编码指定多肽且有效连接至能够实现该多肽在合适的宿主中表达的合适控制序列的DNA序列。这种控制序列可包括实现转录的启动子、控制这种转录的任选的操纵子序列、编码合适的mRNA核糖体结合位点的序列和/或控制转录和翻译终止的序列。载体可以是质粒、噬菌体颗粒或是潜在基因组插入物。一旦转化到适合宿主中,载体就可独立于宿主基因组复制和发挥作用,或者在一些情况下可整合到宿主基因组中。
术语“重组”是指诸如通过使编码序列突变以产生改变的多肽、将编码序列与另一基因的编码序列融合、使基因处于不同启动子控制下、在异源生物体中表达基因、以降低或升高的水平表达基因、以不同于基因的天然表达谱的方式有条件地或组成地表达基因等,对遗传物质(即,核酸、核酸编码的多肽以及包含这些多核苷酸的载体和细胞)进行修饰以改变其序列或表达特征。一般说来,重组核酸、多肽和基于它们的细胞已通过人进行操纵使得其与自然界中存在的相关核酸、多肽和细胞不相同。
“信号序列”是指结合至多肽的N端部分,并且促进成熟形式的多肽从细胞分泌的氨基酸序列。细胞外多肽的成熟形式不含信号序列,其在分泌过程期间被切除。
术语“选择标记”或“可选标记”是指能够在宿主细胞中表达使得易于选择含有所引入的核酸或载体的宿主的基因。可选标记的例子包括但不限于抗微生物物质(例如潮霉素、博来霉素或氯霉素)和/或赋予宿主细胞代谢益处(如营养益处)的基因。
术语“调控元件”是指控制核酸序列表达的某一方面的遗传元件。例如,启动子是促进有效连接的编码区的转录起始的调控元件。另外的调控元件包括剪接信号、聚腺苷酸化信号和终止信号。
如本文所用,“宿主细胞”一般为以使用本领域已知的重组DNA技术构建的载体转化或转染的原核或真核宿主的细胞。转化的宿主细胞能够复制编码多肽变体的载体或者表达所需的多肽变体。在载体编码多肽变体的前多肽或原多肽形式的情况下,这些变体在表达时通常由宿主细胞分泌到宿主细胞培养基中。
在将核酸序列插入细胞的上下文中,术语“引入”意指转化、转导或转染。转化的手段包括本领域已知的原生质体转化法、氯化钙沉淀法、电穿孔法、裸DNA法等。(参见,Chang and Cohen(1979)Mol.Gen.Genet.168:111-115(Chang和Cohen,1979年,《分子遗传学和基因组学》,第168卷,第111-115页);Smith et al.,(1986)Appl.Env.Microbiol.51:634(Smith等人,1986年,《应用与环境微生物学》,第51卷,第634页);以及Ferrari等人载于Harwood,Bacillus,Plenum Publishing Corporation,pp.57-72,1989(Harwood,《芽孢杆菌属》,普莱南出版公司,第57-72页,1989年)中的综述文章)。
“融合”多肽序列经由两个所讨论的多肽序列之间的肽键连接,即有效连接。
术语“丝状真菌”是指真菌亚门(Eumycotina),特别是盘菌亚门(Pezizomycotina)物种的所有丝状形式。
“产乙醇微生物”是指能够将糖或低聚糖转化为乙醇的微生物。
其他科技术语的含义与本公开所属领域的普通技术人员通常所理解的相同(参见例如Singleton and Sainsbury,Dictionary of Microbiology and Molecular Biology,2d Ed.,John Wiley and Sons,NY 1994(Singleton和Sainsbury,《微生物学与分子生物学词典》,第2版,约翰威立出版公司,纽约,1994年);以及Hale and Marham,The Harper Collins Dictionary of Biology,Harper Perennial,NY 1991(Hale和Marham,《哈珀柯林斯生物学词典》,哈珀永久出版社,纽约,1991年))。
III.β-葡糖苷酶多肽、多核苷酸、载体和宿主细胞
A.Nc3A多肽
在一个方面,本发明组合物和方法提供了重组Nc3Aβ-葡糖苷酶多肽、其片段或其具有β-葡糖苷酶活性的变体。重组β-葡糖苷酶多肽的一个例子是从粗糙脉孢菌中分离出来。成熟的Nc3A多肽具有如SEQ ID NO:3所示的氨基酸序列。类似地,实质上相似的Nc3A多肽可存在于自然界中,例如存在于粗糙脉孢菌或脉孢菌属物种(Neurospora spp.)的其他菌株或分离株中。本发明组合物和方法涵盖这些和其他重组Nc3A多肽。
在一些实施例中,重组Nc3A多肽是与示例性Nc3A多肽具有指定程度的氨基酸序列同一性的变体Nc3A多肽,例如与SEQ ID NO:2的氨基酸序列或与成熟序列SEQ ID NO:3具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或甚至至少99%的序列同一性。序列同一性可例如使用诸如BLAST、ALIGN或CLUSTAL之类的程序(如本文所述)通过氨基酸序列比对来测定。
在某些实施例中,重组NC3A多肽以重组方式产生于微生物中,例如产生于细菌或真菌宿主生物体中,而在其他实施例中,Nc3A多肽以合成方式产生,或者从天然来源(例如,粗糙脉孢菌)中纯化获得。
在某些实施例中,重组Nc3A多肽包含不会实质上影响多肽的结构和/或功能的置换。这些置换的例子是保守突变,如表I中所概述。
表I.氨基酸置换
涉及天然存在的氨基酸的置换一般是通过使编码重组Nc3A多肽的核酸突变,然后在生物体中表达变体多肽来进行。涉及非天然存在的氨基酸的置换或氨基酸的化学修饰一般是在由生物体合成多肽后通过以化学方式对所述Nc3A多肽进行修饰来实现。
在一些实施例中,变体重组Nc3A多肽与SEQ ID NO:2或SEQ ID NO:3实质上相同,表明其不包含不会显著影响多肽的结构、功能或表达的氨基酸置换、插入或缺失。此类变体重组Nc3A多肽将包括设计用于避开本描述的多肽。在一些实施例中,变体重组Nc3A多肽、包含这些变体的组合物和方法与SEQ ID NO:2或SEQ ID NO:3实质上并不相同,但在某些情况下包括实质上影响本文所述的多肽的结构、功能或表达的氨基酸置换、插入或缺失,使得与SEQ ID NO:2或SEQ ID NO:3的多肽相比,可实现改善 的特性,包括例如,水解木素纤维素底物的改善的比活性、在所需的宿主生物体中的改善的表达、改善的热稳定性,pH稳定性等。
在一些实施例中,重组Nc3A多肽(包括其变体)具有β-葡糖苷酶活性。β-葡糖苷酶活性可使用本文所述的测定法(例如,在实例2中描述的那些)或通过本领域已知的其他测定法来测定和测量。
重组Nc3A多肽包括“全长”Nc3A多肽中保留β-葡糖苷酶活性的片段。优选地,那些功能性片段(即,保留β-葡糖苷酶活性的片段)为至少100个氨基酸残基长(例如,至少100个氨基酸残基长、至少120个氨基酸残基长、至少140个氨基酸残基长、至少160个氨基酸残基长、至少180个氨基酸残基长、至少200个氨基酸残基长、至少220个氨基酸残基长、至少240个氨基酸残基长、至少260个氨基酸残基长、至少280个氨基酸残基长、至少300个氨基酸残基长、至少320个氨基酸残基长,或至少350个氨基酸残基长或更长)。这些片段适当地保留全长前体多肽或全长成熟多肽的活性位点,但可具有非关键性氨基酸残基的缺失。这些片段的活性可使用本文所述的测定法(例如,在实例2中描述的那些)或通过本领域已知的其他测定法容易地测定。
在一些实施例中,Nc3A氨基酸序列和衍生物作为N和/或C端融合蛋白而产生,例如以有助于提取、检测和/或纯化和/或向Nc3A多肽增加功能性质。融合蛋白伴侣的例子包括但不限于谷胱甘肽S-转移酶(GST)、6XHis、GAL4(DNA结合和/或转录激活结构域)、FLAG、MYC标签或本领域技术人员已知的其他标签。在一些实施例中,在融合蛋白伴侣与所关注的多肽序列之间提供蛋白水解裂解位点,以允许移除融合序列。合适地,融合蛋白不妨碍重组Nc3A多肽的活性。在一些实施例中,将重组Nc3A多肽融合至功能结构域,其包括前导肽、前肽、结合结构域和/或催化结构域。融合蛋白任选地通过接头序列连接至重组Nc3A多肽,所述接头序列接合Nc3A多肽和融合结构域而不明显影响任一组分的性质。所述接头任选地在功能上促进预期应用。
本公开提供经工程改造以表达本公开的一种或多种Nc3A多肽的宿主细胞。合适的宿主细胞包括任何微生物的细胞(例如,细菌、原生生物、藻类、真菌(例如,酵母或丝状真菌)或其他微生物的细胞),并且优选地是细菌、酵母或丝状真菌的细胞。
合适的细菌菌属的宿主细胞包括但不限于埃希杆菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳酸杆菌属(Lactobacillus)、假单胞菌属(Pseudomonas)和链霉菌属(Streptomyces)的细胞。合适的细菌菌种的细胞包括但不限于大肠杆菌、枯草芽孢杆菌、地衣芽孢杆菌(Bacillus licheniformis)、短乳杆菌(Lactobacillus brevis)、铜绿假单胞菌(Pseudomonas aeruginosa)和变铅青链霉菌的细胞。
合适的酵母菌属的宿主细胞包括但不限于酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、假丝酵母属(Candida)、汉逊酵母属(Hansenula)、毕赤酵母属、克鲁维酵母菌属(Kluyveromyces)和法夫酵母属(Phaffia)的细胞。合适的酵母菌种的细胞包括但不限于酿酒酵母、粟酒裂殖酵母(Schizosaccharomyces pombe)、白假丝酵母(Candida albicans)、多形汉逊酵母(Hansenula polymorpha)、巴斯德毕赤酵母(Pichia pastoris)、加拿大毕赤酵母(P.canadensis)、马克斯克鲁维酵母(Kluyveromyces marxianus)和红法夫酵母(Phaffia rhodozyma)的细胞。
丝状真菌的合适宿主细胞包括真菌亚门的全部丝状形式。合适的丝状真菌属的细胞包括但不限于支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、黑管菌属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢属(Chrysoporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、棒囊壳属(Corynascus)、毛壳菌属(Chaertomium)、隐球酵母属(Cryptococcus)、线黑粉酵母属(Filobasidium)、镰孢属(Fusarium)、赤霉菌属(Gibberella)、腐质霉属(Humicola)、大角间座壳菌属(Magnaporthe)、毛霉菌属(Mucor)、毁丝菌属(Myceliophthora)、毛霉菌属、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、柱顶孢属(Scytaldium)、裂褶菌属(Schizophyllum)、孢子丝菌属(Sporotrichum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)和木霉属的细胞。
合适的丝状真菌菌种的细胞包括但不限于泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉、米 曲霉、鲁克文金孢子菌(Chrysosporium lucknowense)、杆孢状镰孢(Fusarium bactridioides)、谷类镰孢(Fusarium cerealis)、克地镰刀菌(Fusarium crookwellense)、黄色镰孢菌(Fusarium culmorum)、禾谷镰孢菌(Fusarium graminearum)、禾赤镰孢菌(Fusarium graminum)、异孢镰刀菌(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢菌(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢菌(Fusarium roseum)、接骨木镰刀菌(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰刀菌(Fusarium sporotrichioides)、硫色镰刀菌(Fusarium sulphureum)、念珠镰孢菌(Fusarium torulosum)、拟丝孢镰刀菌(Fusarium trichothecioides)、镶片镰孢霉(Fusarium venenatum)、烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、浅黄拟蜡菌(Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、环带拟蜡菌(Ceriporiopsis rivulosa)、浅红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉(Humicola insolens)、柔毛腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌、间型脉孢菌(Neurospora intermedia)、产紫青霉菌(Penicillium purpurogenum)、变灰青霉(Penicillium canescens)、离生青霉(Penicillium solitum)、绳状青霉(Penicillium funiculosum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、射脉齿菌(Phlebia radiate)、杏鲍菇(Pleurotus eryngii)、黄色蠕形霉(Talaromyces flavus)、太瑞斯梭孢壳霉(Thielavia terrestris)、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉以及绿色木霉(Trichoderma viride)的细胞。
将核酸转化到这些生物体中的方法是本领域已知的。例如,转化曲霉属宿主细胞的合适工序描述于EP 238 023中。
在一些实施例中,重组Nc3A多肽融合至信号肽,以例如促进重组Nc3A多肽的细胞外分泌。例如,在某些实施例中,信号肽由选自SEQ ID NO:13-42的序列编码。在具体实施例中,重组Nc3A多肽作为分泌的多肽在异源生物体中表达。本文中的组合物和方法因此涵盖在异源生物体中表 达作为分泌的多肽的Nc3A多肽的方法。在一些实施例中,重组Nc3A多肽在异源生物体细胞内表达,例如当异源生物体是诸如酿酒酵母或运动发酵单胞菌的产乙醇微生物时。在这些情况下,可使用基因工程工具将纤维二糖转运体基因引入生物体中,从而使Nc3A多肽作用于该生物体内的纤维二糖底物以将纤维二糖转化为D-葡萄糖,随后D-葡萄糖由生物体代谢或转化为乙醇。
本公开还提供了包含上述核酸的表达盒和/或载体。合适地,编码本公开的Nc3A多肽的核酸有效连接到启动子。启动子是本领域所熟知的。在宿主细胞内发挥功能的任何启动子均可以用于表达本公开的β-葡糖苷酶和/或任何其他核酸。可用于在多种宿主细胞中驱动本公开的β-葡糖苷酶核酸和/或任何其他核酸表达的起始控制区域或启动子数量繁多并且是本领域技术人员熟悉的(参见,例如WO 2004/033646和其中引用的参考文献)。事实上可以使用能够驱动这些核酸的任何启动子。
具体地讲,在期望在丝状真菌宿主中进行重组表达的情况下,该启动子可以是丝状真菌启动子。核酸可以处于例如异源启动子的控制下。核酸还可以在组成型或诱导型启动子控制下表达。可使用的启动子的例子包括但不限于纤维素酶启动子、木聚糖酶启动子、1818启动子(此前通过对木霉属进行EST作图鉴定为高表达的蛋白质)。例如,该启动子可以合适地为纤维二糖水解酶、内切葡聚糖酶或β-葡糖苷酶启动子。尤其合适的启动子可以为例如里氏木霉纤维二糖水解酶、内切葡聚糖酶或β-葡糖苷酶启动子。例如,该启动子是纤维二糖水解酶I(cbh1)启动子。启动子的非限制性例子包括cbh1、cbh2、egl1、egl2、egl3、egl4、egl5、pki1、gpd1、xyn1或xyn2启动子。启动子的额外非限制性例子包括里氏木霉的cbh1、cbh2、egl1、egl2、egl3、egl4、egl5、pki1、gpd1、xyn1或xyn2启动子。
编码本文的Nc3A多肽的核酸序列可包含于载体中。在一些方面,载体含有在表达控制序列的控制下编码Nc3A多肽的核酸序列。在一些方面,表达控制序列是天然表达控制序列。在一些方面,表达控制序列是非天然表达控制序列。在一些方面,载体包含选择标记或可选标记。在一些方面,将编码Nc3A多肽的核酸序列整合到宿主细胞的染色体中而不具有可选标记。
合适的载体是与所采用的宿主细胞相容的那些。合适的载体可源自例如细菌、病毒(诸如细菌噬菌体T7或源自M-13的噬菌体)、粘粒、酵母或植物。合适的载体可以在宿主细胞中以低、中或高拷贝数维持。获得和使用这些载体的方案是本领域的技术人员已知的(参见例如,Sambrook et al.,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring Harbor,1989(Sambrook等人,《分子克隆:实验室指南》,第2版,冷泉港出版社,1989年))。
在一些方面,表达载体还包括终止序列。终止控制区域还可源自宿主细胞中天然存在的多种基因。在一些方面,终止序列和启动子序列源自相同来源。
可使用标准技术将编码Nc3A多肽的核酸序列引入诸如表达载体的载体中(Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor,1982(Sambrook等人,《分子克隆:实验室指南》,冷泉港出版社,1982年))。
在一些方面,可能想要以远高于天然存在细胞中当前存在的水平来过表达本公开中所述的Nc3A多肽和/或一种或多种任何其他核酸。在一些实施例中,可能想要以远低于天然存在细胞中当前存在的水平来低表达(例如,突变、失活或缺失)本公开中所述的内源性β-葡糖苷酶和/或一种或多种任何其他核酸。
B.Nc3a多核苷酸
本文所述组合物和方法的另一方面是编码具有β-葡糖苷酶活性的重组Nc3A多肽(包括其变体和片段)的多核苷酸或核酸序列。在一些实施例中,在用于引导Nc3A多肽在异源生物体(诸如,本文指出的异源生物体)中表达的表达载体的上下文中提供多核苷酸。编码重组Nc3A多肽的多核苷酸可以有效连接至调控元件(例如启动子、终止子、增强子等)以帮助表达编码的多肽。
编码重组Nc3A多肽的多核苷酸序列的一个例子具有SEQ ID NO:1的核苷酸序列。相似的(包括实质上相同的)编码重组Nc3A多肽和变体的多核苷酸可存在于自然界,例如,存在于粗糙脉孢菌或脉孢菌属物种的其他菌株或分离株中。鉴于遗传密码的简并性,应当理解具有不同核苷酸序列的多核苷酸可编码相同的Nc3A多肽、变体或片段。
在一些实施例中,编码重组Nc3A多肽的多核苷酸与编码Nc3A多肽的示例性多核苷酸具有指定程度的氨基酸序列同一性,例如与SEQ ID NO:2的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%的序列同一性。同源性可例如使用诸如BLAST、ALIGN或CLUSTAL之类的程序(如本文所述)通过氨基酸序列比对来测定。
在一些实施例中,编码重组Nc3A多肽的多核苷酸框内融合于用于引导重组Nc3A多肽的细胞外分泌的信号肽的编码序列之后(即下游)。如本文所述,术语“异源”当用来指代用于表达所关注的多肽的信号序列时,其意指该信号序列和所关注的多肽来源于不同的生物体。异源信号序列包括例如那些来自其他真菌纤维素酶基因的信号序列,例如里氏木霉Bgl1的SEQ ID NO:13的信号序列。可在适于表达重组Nc3A多肽或适于在将表达载体引入合适宿主细胞之前使表达载体增殖的异源宿主细胞中提供表达载体。
在一些实施例中,编码重组Nc3A多肽的多核苷酸与SEQ ID NO:1的多核苷酸(或其互补序列)在指定杂交条件下杂交。条件的例子是本文所述的中等严格性、高严格性和极高严格性条件。
Nc3A多核苷酸可为天然存在或合成的(即人造的),并且可经过密码子优化以在不同宿主中表达、经过突变以引入克隆位点或以其他方式改变以增加功能性。
C.Nc3A载体和宿主细胞
为了产生所公开的重组Nc3A多肽,编码该多肽的DNA可由已公布的序列通过化学方式合成或可直接得自具有相应基因的宿主细胞(例如,通过cDNA文库筛选或PCR扩增)。在一些实施例中,将Nc3A多核苷酸包含在表达盒中和/或通过标准分子克隆技术克隆到合适的表达载体中。此类表达盒或载体包含有助于转录起始和终止的序列(例如,启动子和终止子),并通常还可包含一种或多种可选标记。
将表达盒或载体引入合适的表达宿主细胞,该宿主细胞然后表达相应的Nc3A多核苷酸。合适的表达宿主可为细菌或真菌微生物。细菌表达宿主可为例如埃希氏菌属(例如大肠杆菌)、假单胞菌属(例如荧光假单胞 菌(P.fluorescens)或斯氏假单胞菌(P.stutzere))、变形杆菌属(Proteus)(例如奇异变形杆菌(Proteus mirabilis))、罗尔斯通菌属(Ralstonia)(例如富养罗尔斯通氏菌(Ralstonia eutropha))、链霉菌属、葡萄球菌属(Staphylococcus)(例如肉葡萄球菌(S.carnosus))、乳球菌属(Lactococcus)(例如乳酸乳球菌(L.lactis))或芽孢杆菌属(例如,枯草芽孢杆菌、巨大芽孢杆菌(Bacillus megaterium)、地衣芽孢杆菌等)。真菌表达宿主可为例如酵母,酵母还可用作产乙醇生物。酵母表达宿主可为例如酿酒酵母、粟酒裂殖酵母、解脂耶氏酵母(Yarrowia lipolytica)、多形汉逊酵母、乳酸克鲁维酵母(Kluyveromyces lactis)或巴斯德毕赤酵母。真菌表达宿主还可为例如丝状真菌宿主,包括黑曲霉、鲁克文金孢子菌、嗜热毁丝霉、曲霉属(例如,米曲霉、黑曲霉、构巢曲霉等)或里氏木霉。同样合适的是哺乳动物表达宿主,诸如小鼠(例如NS0)、中国仓鼠卵巢(CHO)或幼仓鼠肾(BHK)细胞系。其他真核宿主诸如昆虫细胞或病毒表达系统(例如,细菌噬菌体,诸如M13、T7噬菌体或λ噬菌体,或病毒,诸如杆状病毒)也适用于产生Nc3A多肽。
在所关注的特定宿主中与分泌蛋白相关的启动子和/或信号序列是用于在该宿主或其他宿主中进行Nc3A多肽的异源产生和分泌的候选物。例如,在丝状真菌系统中,驱动纤维二糖水解酶I(cbh1)、葡糖淀粉酶A(glaA)、TAKA-淀粉酶(amyA)、木聚糖酶(exlA)、gpd-启动子cbh1、cbhll、内切葡聚糖酶基因eg1-eg5、Cel61B、Cel74A、gpd启动子、Pgk1、pki1、EF-1α、tef1、cDNA1和hex1的基因的启动子是合适的并可来源于许多不同的生物体(例如黑曲霉、里氏木霉、米曲霉、泡盛曲霉和构巢曲霉)。
在一些实施例中,Nc3A多核苷酸与编码合适的同源或异源信号序列(导致重组Nc3A多肽分泌到细胞外(或周质)空间)的多核苷酸重组相关,从而允许直接在细胞上清液(或周质空间或裂解物)中检测酶活性。对于本领域已知的大肠杆菌、其他革兰氏阴性菌和其他生物体,合适的信号序列包括驱动HlyA、DsbA、Pbp、PhoA、PelB、OmpA、OmpT或M13噬菌体Gill基因表达的那些序列。对于本领域已知的枯草芽孢杆菌、革兰氏阳性生物体和其他生物体,合适的信号序列还包括驱动AprE、NprB、Mpr、AmyA、AmyE、Blac、SacB表达的那些序列,并且对于酿酒酵母或其他酵母,包括杀伤毒素、Bar1、Suc2、交配因子α、Inu1A或Ggplp信号 序列。信号序列可通过多种信号肽酶裂解,从而将它们从所表达的蛋白质的其余部分移除。真菌表达信号序列可为选自例如本文的SEQ ID NO:13-37的序列。酵母表达信号序列可为选自例如SEQ ID NO:38-40的序列。可适用于在运动发酵单胞菌中表达本发明的Nc3A多肽的信号序列可包括例如选自SEQ ID NO:41-42的序列。(Linger J.G.et al.,(2010)Appl.Environ.Microbiol.76(19):6360-6369(Linger J.G.等人,2010年,《应用与环境微生物学》,第76卷,第19期,第6360-6369页))。
在一些实施例中,重组Nc3A多肽单独地或作为与位于N或C端的其他肽、标签或蛋白(例如6XHis、HA或FLAG标签)的融合体而表达。合适的融合体包括有利于亲和纯化或检测的标签、肽或蛋白(例如,6XHis、HA、甲壳质结合蛋白、硫氧还蛋白或FLAG标签),以及有利于靶标β-葡糖苷酶的表达、分泌或加工的那些。合适的加工位点包括肠激酶、STE13、Kex2或用于体内或体外裂解的其他蛋白酶裂解位点。
将Nc3A多核苷酸通过多种转化方法引入表达宿主细胞,这些方法包括但不限于电穿孔、脂质辅助转化或转染(“脂质转染”)、化学介导转染(例如CaCl和/或CaP)、醋酸锂介导的转化(例如,宿主细胞原生质体的转化)、生物弹射“基因枪”转化、PEG介导的转化(例如,宿主细胞原生质体的转化)、原生质体融合(例如使用细菌或真核细胞原生质体)、脂质体介导的转化、根癌农杆菌(Agrobacterium tumefaciens)、腺病毒或其他病毒或噬菌体转化或转导。
D.细胞培养基
一般来讲,将微生物在适用于产生本文所述的Nc3A多肽的细胞培养基中培养。培养使用本领域已知的步骤和变化在合适的营养培养基中进行,所述培养基包含碳源和氮源及无机盐。适于生长和纤维素酶产生的培养基、温度范围和其他条件是本领域已知的。作为非限制性例子,通过里氏木霉制备纤维素酶的典型温度范围为24℃至37℃,例如,介于25℃与30℃之间。
1.细胞培养条件
适于真菌培养物的维持和生长的材料和方法是本领域所熟知的。在一些方面,将细胞在容许由插入宿主细胞内的核酸所编码的一种或多种β-葡糖苷酶多肽表达的条件下在培养基中培养。可以使用标准细胞培养条件来 培养细胞。在一些方面,将细胞在合适的温度、气体混合物和pH培育和维持。在一些方面,在合适的细胞培养基中培育细胞。
IV.Nc3A的活性
本文所公开的重组Nc3A多肽具有β-葡糖苷酶活性或者能够水解纤维二糖并且从中释放D-葡萄糖。在相同的糖化条件下,与里氏木霉的基准高保真性β-葡糖苷酶Bgl1相比,本文的Nc3A多肽具有更高的β-葡糖苷酶活性以及改善或增强的从纤维二糖释放D-葡萄糖的能力。在一些实施例中,与黑曲霉的另一基准β-葡糖苷酶B-glu相比,本文的Nc3A多肽可具有更高的β-葡糖苷酶活性和/或改善或增强的从纤维二糖释放D-葡萄糖的能力。
如实例3所示,与里氏木霉Bgl1相比,重组Nc3A多肽具有约50%或更少、约40%或更少、约30%或更少或者甚至约20%或更少的水解氯-硝基-苯基-葡糖苷(CNPG)底物的活性。在一些实施例中,与黑曲霉B-glu相比,重组Nc3A多肽具有至少高约10%、高约20%、高约30%、高约50%、高约60%、高约80%或高约90%或者甚至为约2倍的水解CNPG底物的活性。
与里氏木霉Bgl1相比,重组Nc3A多肽具有显著改善或增强的纤维二糖酶活性,例如,至少约2倍、更优选至少约3倍、优选至少约4倍或甚至更优选至少约5倍的纤维二糖酶活性,纤维二糖酶活性可量度酶催化纤维二糖水解并释放D-葡萄糖的能力。在一些实施例中,与黑曲霉B-glu相比,重组Nc3A多肽具有约8/9、约7/9、约6/7、约5/6、约2/3或者甚至约1/2或更少的催化纤维二糖水解并释放D-葡萄糖的能力。
在一些实施例中,与里氏木霉Bgl1相比,重组Nc3A多肽具有约1/5或更少、约1/10或更少、约1/15或更少、约1/20或更少或者甚至约1/25或更少,诸如约1/30或更少的对CNPG/纤维二糖的相对水解活性比率。在一些实施例中,与黑曲霉B-glu相比,Nc3A多肽具有大致相同的对于CNPG/纤维二糖的相对水解活性比率。
如实例4所示,与里氏木霉Bgl1相比,重组Nc3A多肽从磷酸溶胀纤维素底物产生更多的葡萄糖但是等量或更少量的总糖。
如实例5所示,与里氏木霉Bgl1相比,重组Nc3A多肽从碱性预处理的生物质底物(诸如稀氨水预处理的玉米秸秆底物)产生更多的葡萄糖并且实现更高水平的葡聚糖转化率。
V.包含重组β-葡糖苷酶Nc3A多肽的组合物
本公开提供了工程化的酶组合物(例如,纤维素酶组合物)或富含重组Nc3A多肽的发酵液。在一些方面,该组合物是纤维素酶组合物。该纤维素酶组合物可以是,例如,丝状真菌纤维素酶组合物,诸如木霉纤维素酶组合物。在一些方面,该组合物是包含编码一种或多种纤维素酶多肽的一种或多种核酸的细胞。在一些方面,该组合物是包含纤维素酶活性的发酵液,其中所述发酵液能够将生物质样品中存在的超过约50重量%的纤维素转化成糖。如本文所用,术语“发酵液”和“全发酵液”是指通过工程化微生物的发酵制备的酶制剂,该酶制剂在发酵之后不经历或经历最小限度的回收和/或纯化。发酵液可为丝状真菌的发酵液,例如,木霉属、腐质霉属、镰孢属、曲霉属、脉孢菌属、青霉属、头孢霉属(Cephalosporium)、绵霉属(Achlya)、柄孢壳菌属(Podospora)、内座壳属(Endothia)、毛霉菌属、旋孢腔菌属(Cochliobolus)、梨孢属(Pyricularia)、毁丝菌属或金孢子菌属(Chrysosporium)发酵液。具体地讲,发酵液可为例如木霉属物种诸如里氏木霉,或青霉属物种诸如绳状青霉。发酵液还可以适当地为无细胞发酵液。在一个方面,本发明的任何纤维素酶、细胞或发酵液组合物还可以包含一种或多种半纤维素酶。
在一些方面,该全发酵液组合物在里氏木霉或其工程化菌株中表达。在一些方面,该全发酵液在里氏木霉的整合型菌株中表达,其中包含Nc3A多肽的多种纤维素酶已经被整合到里氏木霉宿主细胞的基因组中。在一些方面,在整合型里氏木霉菌株中表达的多肽的一种或多种组分已被缺失。
在一些方面,该全发酵液组合物在黑曲霉或其工程化菌株中表达。
作为另一种选择,重组Nc3A多肽可在细胞内表达。任选地,在酶变体在细胞内表达或利用诸如上述那些的信号序列分泌进周质空间后,可采用透化或裂解步骤使重组Nc3A多肽释放到上清液中。膜屏障的破坏通过使用机械手段诸如超声波、加压处理(弗氏压碎器)、空化或通过使用膜消化酶诸如溶菌酶或酶混合物而实现。该实施例的变型形式包括重组Nc3A多肽在产乙醇微生物细胞内的表达。例如,纤维二糖转运体可通过基因工程引入同一产乙醇微生物中,使得从木素纤维素生物质的水解产生的纤维二糖可被转运到产乙醇生物体中,并且可在所述生物体中水解并转化为D-葡萄糖,D-葡萄糖可继而被产乙醇生物代谢。
在一些方面,使用合适的无细胞表达系统表达编码重组Nc3A多肽的多核苷酸。在无细胞系统中,通常将所关注的多核苷酸在启动子帮助下转录,但任选进行连接以形成环状表达载体。在一些实施例中,以外源方式添加或生成RNA而不进行转录,然后在无细胞系统中翻译。
VI.使用Nc3A多肽来水解木素纤维素生物质底物
在一些方面,本文提供了用于将木素纤维素生物质转化为糖的方法,该方法包括使生物质底物与本文公开的组合物接触,所述组合物包含能有效地将生物质底物转化成可发酵糖的量的Nc3A多肽。在一些方面,该方法还包括用酸和/或碱和/或机械手段或其他物理手段预处理生物质。在一些方面,酸包括磷酸。在一些方面,碱包括氢氧化钠或氨。在一些方面,机械手段可包括例如牵拉、挤压、压碎、研磨,以及将木素纤维素生物质物理地分解成更小的物理形式的其他手段。其他物理手段还可包括例如使用蒸汽或其他加压烟气或蒸气“解开”木素纤维素生物质以便增加酶对纤维素和半纤维素的可及性。在某些实施例中,预处理方法还可涉及能够分解木素纤维素生物质底物中的木质素的酶,从而使得生物质水解酶组合物中的酶对生物质的纤维素和半纤维素的可及性增加。
生物质:本公开提供了使用包含Nc3A多肽的本公开酶组合物进行生物质糖化的方法和过程。如本文所用,术语“生物质”是指包含纤维素和/或半纤维素的任何组合物(任选地还有木素纤维素生物质材料中的木质素)。如本文所用,生物质包括但不限于种子、谷粒、块茎、植物废料(诸如,棕榈树空果串或棕榈纤维废料)或食品加工或工业加工的副产物(例如,茎秆)、玉米(包括例如,玉米芯、秸秆等等)、草料(包括例如,印度草,诸如黄假高粱(Sorghastrum nutans);或者柳枝稷(例如,黍属(Panicum)物种,诸如柳枝稷(Panicum virgatum))、多年生木质茎(例如,芦竹)、木材(包括例如,木屑、加工废料)、纸材、纸浆和回收纸(包括例如,报纸、打印纸等等)。其他生物质材料包括但不限于马铃薯、大豆(例如油菜籽)、大麦、黑麦、燕麦、小麦、甜菜和甘蔗渣。
本公开因而提供糖化方法,所述方法包括使包含生物质材料(例如,包含木聚糖、半纤维素、纤维素和/或可发酵糖的材料)的组合物与本公开的Nc3A多肽,或本公开的核酸或多核苷酸编码的Nc3A多肽,或本公开的 任何一种包含Nc3A多肽的纤维素酶或非天然存在的半纤维素酶组合物或制造产物接触。
糖化的生物质(例如由本公开的酶加工的木素纤维素材料)可以通过诸如微生物发酵和/或化学合成的过程制成众多基于生物的产品。如本文所用,“微生物发酵”是指在合适的条件下培养和收获发酵微生物的过程。发酵微生物可以是适用于生产基于生物的产品所需的发酵过程的任何微生物。合适的发酵微生物包括但不限于丝状真菌、酵母和细菌。通过发酵和/或化学合成,可例如将经糖化的生物质制成燃料(例如,生物燃料,诸如生物乙醇、生物丁醇、生物甲醇、生物丙醇、生物柴油、喷气燃料等)。通过发酵和/或化学合成,还可例如将经糖化的生物质制成日用化学品(例如,抗坏血酸、异戊二烯、1,3-丙二醇)、脂质、氨基酸、多肽和酶。
预处理:在进行糖化或酶水解和/或对从糖化获得的可发酵糖进行发酵之前,生物质(例如,木素纤维素材料)优选地进行一个或多个预处理步骤,以使得木聚糖、半纤维素、纤维素和/或木质素材料对于酶组合物(例如,包含Nc3A多肽的本发明酶组合物)中的酶更可触及或更敏感,并且因此更易于被酶和/或酶组合物水解。
在一些方面,合适的预处理方法可涉及在反应器中对生物质材料使用包含强酸和金属盐的稀溶液的催化剂。该生物质材料可以是,例如,原材料或干燥材料。这种预处理可以降低纤维素水解的活化能或温度,最终允许可发酵糖的更高产量。参见例如,美国专利No.6,660,506;No.6,423,145。
在一些方面,合适的预处理方法可涉及使生物质材料在含水介质中在所选择的温度和压力下经历第一水解步骤,以便主要实现半纤维素的解聚,而不实现纤维素显著解聚为葡萄糖。这个步骤产生浆液,在所述浆液中液态水相包含因半纤维素解聚产生的溶解单糖,以及包含纤维素和木质素的固相。随后该浆液在允许主要部分的纤维素解聚的条件下经历第二水解步骤,产生包含纤维素的已溶解/可溶解解聚产物的液态水相。参见例如,美国专利No.5,536,325。
在其他方面,合适的预处理方法可涉及使用约0.4%至约2%的强酸,通过一个或多个阶段的稀酸水解来处理生物质材料;随后使用碱性脱木质 法处理酸水解材料的未反应固态木素纤维素组分。参见例如,美国专利No.6,409,841。
在其他方面,合适的预处理方法可涉及在预水解反应器中预水解生物质(例如,木素纤维素材料);将酸性液体添加至固态木素纤维素材料以制得混合物;将该混合物加热至反应温度;保持反应温度一段时间,所述时间足够使木素纤维素材料分解成溶解部分和固体级分,所述溶解部分包含至少约20%来自木素纤维素材料的木质素,所述固体级分包含纤维素;将溶解部分与固体级分分离,并且在反应温度或接近反应温度移出溶解部分;以及回收溶解部分。固体级分中的纤维素变得更易于进行酶消化。参见例如,美国专利No.5,705,369。在这个方面的变型形式中,预水解可另选地或者进一步涉及使用例如能够分解木素纤维素生物质材料中的木质素的酶来进行预水解。
在其他方面,合适的预处理可涉及过氧化氢H2O2的使用。参见Gould,1984,Biotech,and Bioengr.26:46-52(Gould,1984年,《生物技术和生物工程》,第26卷,第46-52页)。
在其他方面,预处理还可以包括使生物质材料与化学计量的量的极低浓度氢氧化钠和氢氧化铵接触。参见Teixeira et al.,(1999)Appl.Biochem.and Biotech.77-79:19-34(Teixeira等人,1999年,《应用生物化学与生物技术》,第77-79卷,第19-34页)。
在一些实施例中,预处理可包括使木素纤维素在约9至约14的pH、适当温度、压力和pH下接触化学品(例如碱,诸如碳酸钠或氢氧化钾)。参见已公布的国际申请WO2004/081185。氨用于例如优选的预处理方法。这种预处理方法包括在高固形物含量的条件下使生物质材料与低浓度的氨接触。参见例如美国专利公布No.20070031918和已公布的国际申请WO06110901。
A.糖化过程
在一些方面,本文提供了一种糖化过程,所述过程包括用包含多肽的酶组合物处理生物质,其中所述多肽具有β-葡糖苷酶活性并且其中所述过程导致至少约50重量%(例如,至少约55重量%、60重量%、65重量%、70重量%、75重量%或80重量%)的生物质转化成可发酵糖。在一些方面,该生物质包含木质素。在一些方面,该生物质包含纤维素。在一些方 面,该生物质包含半纤维素。在一些方面,包含纤维素的生物质还包含木聚糖、半乳聚糖或阿拉伯聚糖中的一者或多者。在一些方面,生物质可以为但不限于种子、谷粒、块茎、植物废料(例如,棕榈树空果串或棕榈纤维废料)或食品加工或工业加工的副产物(例如,茎秆)、玉米(包括例如,玉米芯、秸秆等等)、草料(包括例如,印度草,诸如黄假高粱;或柳枝稷(例如,黍属物种,诸如柳枝稷)、多年生木质茎(例如,芦竹)、木材(包括例如,木屑、加工废料)、纸材、纸浆和回收纸(包括例如,报纸、打印纸等等)、马铃薯、大豆(例如,油菜籽)、大麦、黑麦、燕麦、小麦、甜菜和甘蔗渣。在一些方面,在用多肽处理之前,使包含生物质的材料经受一种或多种预处理方法/一个或多个预处理步骤。在一些方面,糖化或酶法水解还包括用包含本发明的Nc3A多肽的酶组合物处理生物质。除了Nc3A多肽外,酶组合物还可例如包含一种或多种其他纤维素酶。作为另一种选择,酶组合物可包含一种或多种其他半纤维素酶。在某些实施例中,酶组合物包含本发明的Nc3A多肽、一种或多种其他纤维素酶、一种或多种半纤维素酶。在一些实施例中,所述酶组合物是全发酵液组合物。
在一些方面,提供了包括用包含多肽的组合物处理木素纤维素生物质材料的糖化过程,其中所述多肽与SEQ ID NO:2具有至少约80%(例如,至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)的序列同一性,并且其中所述过程导致至少约50重量%(例如,至少约55重量%、60重量%、65重量%、70重量%、75重量%、80重量%、85重量%或90重量%)的生物质转化成可发酵糖。在一些方面,木素纤维素生物质材料已经受如本文所述的一种或多种预处理方法/一个或多个预处理步骤。
根据前面的描述和以下的实例,本发明组合物和方法的其他方面和实施例将显而易见。
实例
提供以下实例以论证和说明本公开的某些优选实施例和方面,而不应该理解为限制。
实例1
1-A.Nc3A和基准里氏木霉Bgl1的基因表达的克隆和表达
1-A-a.里氏木霉bgl1表达载体的构建
将天然里氏木霉β-葡糖苷酶基因bgl1的N端部分进行密码子优化(DNA 2.0,加利福尼亚州门洛帕克市(Menlo Park,CA))。这种合成的部分包含该酶编码区的最初447个碱基。随后通过PCR使用引物SK943和SK941(见下文)扩增这种片段。使用引物SK940和SK942(见下文),将天然bgl1基因的剩余区域从提取自里氏木霉菌株RL-P37的基因组DNA样品进行PCR扩增(Sheir-Neiss,G et al.,(1984)Appl.Microbiol.Biotechnol.20:46-53(Sheir-Neiss,G等人,1984年,《应用微生物学和生物技术》,第20卷,第46-53页))。使用如下引物SK943和SK942,在融合PCR反应中将bgl1基因的这两个PCR片段融合在一起:
正向引物SK943:(5’–CACCATGAGATATAGAACAGCTGCCGCT-3’)(SEQ ID NO:5)
反向引物SK941:(5’-CGACCGCCCTGCGGAGTCTTGCCCAGTGGTCCCGCGACAG-3’)(SEQ ID NO:6)
正向引物(SK940):(5’-CTGTCGCGGGACCACTGGGCAAGACTCCGCAGGGCGGTCG-3’)(SEQ ID NO:7)
反向引物(SK942):(5’–CCTACGCTACCGACAGAGTG-3’)(SEQ ID NO:8)
将所得的融合PCR片段克隆至入门载体(Entry vector)(图1),并且转化至大肠杆菌OneTOP10(E.coli OneTOP10)化学感受态细胞(英杰公司(Invitrogen)),从而产生中间载体pENTR TOPO-Bgl1(943/942)(图1)。测定插入DNA的核苷酸序列。将具有正确的bgl1序列的pENTR-943/942载体与pTrex3g使用LR反应加以重组(参见英杰公司概述的方案)。将LR clonase反应混合物转化进大肠杆菌OneTOP10化学感受态细胞(英杰公司),从而产生表达载体pTrex3g 943/942(图2)。该载体还包含编码乙酰胺酶的构巢曲霉amdS基因,作为里氏木霉转化的可选标记。使用引物SK745和SK771(见下文)对表达盒进行PCR扩增以生成用于转化的产物。
正向引物SK771:(5’–GTCTAGACTGGAAACGCAAC-3’)(SEQ ID NO:9)
反向引物SK745:(5’–GAGTTGTGAAGTCGGTAATCC-3’)(SEQ ID NO:10)
1-A-b.nc3a表达载体的构建
β-葡糖苷酶基因的开放阅读框通过使用从粗糙脉孢菌提取的基因组DNA作为模板来进行PCR扩增。使开放阅读框与天然信号序列一起扩增。所用的PCR热循环仪是DNA Engine Tetrad 2Peltier热循环仪(伯乐实验室(BioRad Laboratories))。所用的DNA聚合酶是PfuUltra II融合HS DNA聚合酶(PfuUltra II Fusion HS DNA Polymerase)(Stratagene)或者类似的质量校正DNA聚合酶。用于扩增开放阅读框的引物如下:
Nc3A-F:5'-CAC CAT GAA GTT CGC CAT TCC GCT TG-3'(SEQ ID NO:11)Nc3A-R:5'-TCA GGG AAG AAC CTC CTC GAG ATC CAA-3'(SEQ ID NO:12)
Nc3A-F正向引物在5’端处包括四个额外的核苷酸(序列–CACC),以促进定向克隆到pENTR/D-TOPO。使用Qiaquick PCR纯化试剂盒(加利福尼亚州瓦伦西亚的凯杰公司(Qiagen,Valencia,CA))纯化开放阅读框的PCR产物。将经纯化的PCR产物克隆到pENTR/D-TOPO载体(英杰公司),转化进TOP10化学感受态大肠杆菌细胞(加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen,Carlsbad,CA))并接种在具有50ppm卡那霉素的LA平板上。使用QIAspin质粒制备试剂盒(凯杰公司(Qiagen))从大肠杆菌转化体中获得质粒DNA。
使用M13正向引物和反向引物来获得插入pENTR/D-TOPO载体的DNA的序列数据。根据生产商的说明书,使用LR clonase反应混合物(加利福尼亚州卡尔斯巴德的英杰公司)将具有正确的开放阅读框DNA序列的pENTR/D-TOPO载体与pTrex3gM目的载体(图2)重组。
随后将LR clonase反应的产物转化进TOP10化学感受态大肠杆菌细胞,然后将这些细胞接种在含有50ppm羧苄青霉素的LA上。所得的pExpression构建体是含有Nc3A开放阅读框和塔宾曲霉(Aspergillus tubingensis)乙酰胺酶选择标记(amdS)的pTrex3gM。使用Qiagen小量提取试剂盒分离pExpression构建体的DNA并且将该DNA用于里氏木霉的转化。
使用如下所述的细微修改的PEG介导的原生质体方法将pExpression质粒或表达盒的PCR产物转化到里氏木霉六重缺失菌株(参见例如,已公布的国际专利申请公布No.WO 2010/141779中的描述)。对于原生质体制 备,将孢子于24℃在木霉属基本培养基MM中以150rpm振荡培育16-24小时,该培养基包含20g/L葡萄糖、15g/L KH2PO4(pH 4.5)、5g/L(NH4)2SO4、0.6g/L MgSO4×7H2O、0.6g/L CaCl2×2H2O、1mL的1000X里氏木霉微量元素溶液(其包含5g/L FeSO4×7H2O、1.4g/L ZnSO4×7H2O、1.6g/L MnSO4×H2O、3.7g/L CoCl2×6H2O)。通过离心收集正在萌发的孢子并且使用50mg/mL的Glucanex G200(诺维信公司(Novozymes AG))溶液进行处理以裂解真菌细胞壁。对原生质体的进一步制备根据et al.(1987)Gene 61:155-164(等人,1987年,《基因》,第61卷,第155-164页)描述的方法进行。将在200μL总体积中包含约1μg DNA和1-5×107原生质体的转化混合物均用2mL的25%PEG溶液处理,用2体积的1.2M山梨醇/10mM Tris(pH7.5)、10mM CaCl2稀释,与包含5mM尿苷和20mM乙酰胺的3%选择性顶层琼脂糖MM混合。将所得的混合物倾倒于包含尿苷和乙酰胺的2%选择性琼脂糖平板上。在选取单一转化体到包含尿苷和乙酰胺的新鲜MM平板上之前,将平板在28℃进一步孵育7-10天。使用来自独立克隆的孢子在摇瓶中接种发酵培养基。
发酵培养基为36mL包含葡萄糖/槐糖和2g/L尿苷的限定液体培养基,例如甘氨酸基本培养基(6.0g/L甘氨酸;4.7g/L(NH4)2SO4;5.0g/LKH2PO4;1.0g/L MgSO4·7H2O;33.0g/L PIPPS;pH 5.5)并且灭菌后在250ml Thomson超高产培养瓶(Thomson Ultra Yield Flask)(加利福尼亚州奥欣赛德的汤姆森仪器有限公司(Thomson Instrument Co.,Oceanside,CA))中添加作为碳源的约2%葡萄糖/槐糖混合物、10ml/L的100g/L CaCl2、2.5ml/L里氏木霉微量元素(400X):175g/L无水柠檬酸;200g/LFeSO4·7H2O;16g/L ZnSO4·7H2O;3.2g/L CuSO4·5H2O;1.4g/LMnSO4·H2O;0.8g/L H3BO3。
1-A-c.酵母穿梭载体pSC11的构建
酵母穿梭载体可根据图5的载体图谱构建。该载体可用于在酿酒酵母细胞内表达Nc3A多肽。可使用已知方法以相同的穿梭载体或单独的载体将纤维二糖转运体引入酿酒酵母中,所述已知方法为诸如Ha et al.,(2011)in PNAS,108(2):504-509(Ha等人,2011年,《美国国家科学院院刊》,第108卷,第2期,第504-509页)所述的那些方法。
可使用酵母EZ-转化试剂盒进行表达盒的转化。可使用包含20g/L纤维二糖的YSC培养基选择转化体。可使用特异性引物通过菌落PCR来确定表达盒被成功引入酵母中。
可根据已知的方法和方案来培养酵母菌株。例如,所述酵母菌株可在30℃下在含有20g/L葡萄糖的YP培养基(10g/L酵母提取物、20g/L细菌蛋白胨)中培养。为了使用氨基酸营养缺陷型标记选择转化体,可使用酵母合成性完全(YSC)培养基,该培养基包含6.7g/L酵母基础氮源,加上20g/L葡萄糖、20g/L琼脂和CSM-Leu-Trp-Ura,以提供核苷酸和氨基酸。
1-A-d.运动发酵单胞菌整合载体pZC11的构建。
运动发酵单胞菌整合载体pZC11可根据图6的载体图谱进行构建。该载体可用于在运动发酵单胞菌细胞内表达Nc3A多肽。可以使用将那些转运体引入细菌细胞中的已知方法,以相同的整合载体或单独的载体将纤维二糖转运体引入运动发酵单胞菌,所述已知方法为诸如Sekar et al.,(2012)Applied Environmental Microbiology,78(5):1611-1614(Sekar等人,2012年,《应用环境微生物学》,第78卷,第5期,第1611-1614页)所述的那些。
可使用各种已知的方法来确定整合载体以及纤维二糖转运体基因的成功引入,例如通过使用为此目的特别设计的确认引物的PCR来进行确定。
可根据已知方法来培养和发酵运动发酵单胞菌菌株,所述方法为诸如在美国专利No.7,741,119中所述的那些。
1-B.里氏木霉Bgl1和Nc3A的纯化
里氏木霉Bgl1在六重缺失的里氏木霉宿主菌株的发酵液中过表达并且从该发酵液纯化(参见,例如在已公布的国际专利申请公布No.WO2010/141779中的描述)。将浓缩发酵液上样至G25SEC色谱柱(通用电气医疗生物科学有限公司(GE Healthcare Bio-Sciences))并且与50mM乙酸钠(pH 5.0)进行缓冲交换。然后将经过缓冲交换的Bgl1上样至填充有氨苄基-S-吡喃葡糖基琼脂糖亲和基质的25mL色谱柱上。在用50mM乙酸钠中的250mM氯化钠(pH 5.0)充分淋洗后,用50mM乙酸钠和250mM氯化钠中的100mM葡萄糖(pH 5.0)洗脱结合级分。汇集并浓缩经检测对于氯-硝基-苯基-葡糖苷(CNPG)活性呈阳性的洗脱级分。对应于SDS-PAGE上里氏木霉Bgl1 的MW并且通过质谱确定的单一条带验证了经洗脱的Bgl1的纯度。最终的原液浓度通过280nm处的吸光度被确定为2.2mg/mL。
如上所述由里氏木霉表达的Nc3A可以从浓缩的发酵液通过首先稀释100mg到50mM MES缓冲液(pH 6.0)中来纯化。Nc3A可通过以每毫升树脂2mg蛋白上样到在pH 6处带电荷的SP Sepharose离子交换树脂(通用电气医疗集团(GE Healthcare))来富集。然后Nc3A可洗脱在流穿液中。所富集的Nc3A随后可使用10,000MW截留膜(Vivaspin,通用电气医疗集团)从原始体积浓缩成小5倍的体积。其他背景组分通过以成批模式添加40%硫酸铵(w/v)来从Nc3A移除。在离心之后可从上清液中回收纯Nc3A。随后可使用10,000MW截留膜(Vivaspin,通用电气医疗集团),在50mM MES缓冲液(pH 6.0)中同时透析和浓缩Nc3A。随后可分别通过氯-硝基-苯基-葡糖苷测定法和SDS-PAGE来评估Nc3A的活性和纯度。随后可使用7,000MW截留膜透析盒(皮尔斯公司(PIERCE)),用50mM MES、100mMNaCl缓冲液(pH 6.0)对上清液充分透析。最后一批Nc3A的活性可用氯-硝基-苯基-葡糖苷测定法来确定。可通过二辛可宁酸测定法(皮尔斯公司)以及通过在280nm波长处使用由GPMAW v 7.0计算出的摩尔消光系数进行吸光度测定来确定浓度。
制备两种稍微不同浓度的Nc3A原液以用于这里所述的这些实验的目的,一种浓度为0.64mg/mL,而另一种浓度为0.72mg/mL。
实例2:各种测定法
2-A.通过UPLC进行蛋白质浓度测量
使用Agilent HPLC 1290Infinity系统和Waters ACQUITY UPLC BEHC4色谱柱(1.7μm,1×50mm)进行蛋白质定量。使用六分钟程序,该六分钟程序使用在0.5分钟内从5%至33%乙腈(西格玛奥德里奇(Sigma-Aldrich))的初始梯度,然后在4.5分钟内从33%至48%的梯度,接着为最终到90%乙腈的阶变梯度。基于纯化的里氏木霉Bgl1的蛋白质标准曲线用于定量Nc3A多肽。
2-B.氯-硝基-苯基-葡糖苷(CNPG)水解测定法
将二百(200)μL的50mM乙酸钠缓冲液(pH 5)添加至微量滴定平板的各个孔。还将稀释于50mM乙酸钠缓冲液(pH 5)中的五(5)μL酶添加至各个孔。覆盖该平板,并使其在Eppendorf热混合仪中于37℃平衡15分钟。将 Millipore水中制备的二十(20)μL的2mM 2-氯-4-硝基苯基-β-D-吡喃葡萄糖苷(CNPG,加利福尼亚州埃德蒙顿的罗斯科技有限公司(Rose Scientific Ltd.,Edmonton,CA))添加至各个孔并且将该平板迅速转移至分光光度计(SpectraMax 250,分子仪器公司(Molecular Devices))。在OD 405nm进行15分钟的动力学读数并且将数据记录为Vmax。使用CNP的消光系数,将Vmax的单位从OD/秒换算成μM CNP/秒。比活性(μM CNP/秒/mg蛋白)通过μM CNP/秒除以该测定法中所用的酶的毫克数来测定。CNPG测定法的标准误差被确定为3%。
2-C.纤维二糖水解测定法
在50℃使用Ghose,T.K.Pure&Applied Chemistry,1987,59(2),257-268(Ghose,T.K.,《纯化学与应用化学》,1987年,第59卷,第2期,第257-268页)所述的方法来测定纤维二糖酶活性。将纤维二糖单位(如Ghose所述而产生)定义为0.0926除以在测定条件下释放0.1mg葡萄糖所需的酶的量。纤维二糖酶测定法的标准误差被确定为10%。
2-D.磷酸溶胀纤维素(PASC)的制备
磷酸溶胀纤维素(PASC)使用如下文献的修改方案从Avicel制备:Walseth,TAPPI 1971,35:228(Walseth,《纸浆与造纸工业技术协会志》,1971年,第35卷,第228页)和Wood,Biochem.J.1971,121:353-362(Wood,《生物化学杂志》,1971年,第121卷,第353-362页)。简而言之,将Avicel PH-101溶解于浓磷酸中,然后使用冷去离子水沉淀。收集纤维素并且用较多的水洗涤以中和所述pH。将所述纤维素在50mM乙酸钠(pH5)中稀释成1%的固体。
实例3:Nc3A相对于基准里氏木霉Bgl1或者相对于基准黑曲霉B-glu 的改善的水解性能,如在CNPG和纤维二糖酶测定法中所见。
3-A.在摇瓶中制备的β-葡糖苷酶的CNPG和纤维二糖酶活性
通过UPLC(本文所述)测量摇瓶粗发酵液中Nc3A的浓度并且所述浓度被确定为0.64g/L。以下实验中包括两种纤维素二糖水解酶作为表达菌株背景中β-葡糖苷酶活性的对照并且低于测定法的检测极限。从2.2mg/mL(A280测量值)的原液中使用经纯化的里氏木霉Bgl1。经纯化的黑曲霉β-葡糖苷酶B-glu得自美格兹密国际公司(Megazyme International),不含BSA (爱尔兰威克洛的美格兹密国际爱尔兰公司(Megazyme International Ireland Ltd.,Wicklow,Ireland),批号031809)。
测量每一种酶对模型底物氯-硝基-苯基-葡糖苷(CNPG)和纤维二糖的活性。所述测定法各自在标准方案中的温度下进行;CNPG在37℃并且纤维二糖在50℃下测量。
表3-1
与里氏木霉Bgl1相比,Nc3A具有约1/5的对CNPG的活性,并且具有高约5倍的纤维二糖水解活性(或纤维二糖酶活性)。与黑曲霉B-glu相比,Nc3A具有约2倍的对CNPG的活性,但与黑曲霉B-glu相比,具有约40%或更低的对纤维二糖的活性。纤维二糖水解酶对纤维二糖没有活性(在任何孔中均未观察到葡萄糖)。
表3-2
酶经纯化CNPG/纤维二糖
里氏木霉Bgl1是62
黑曲霉B-glu是2
Nc3A否2
为了独立于蛋白质测定来比较每种分子的活性,计算CNPG与纤维二糖酶活性的比率。Nc3A对CNPG/纤维二糖的水解活性的比率比里氏木霉Bgl1对CNPG/纤维二糖的水解活性的比率小约30倍。Nc3A对CNPG/纤维二糖的水解活性的比率与黑曲霉B-glu对CNPG/纤维二糖的水解活性的比率大致相同。
实例4:Nc3A多肽对PASC底物的改善的水解性能。
将β-葡糖苷酶以0-10mg蛋白质/g纤维素添加到10mg蛋白质/g葡聚糖恒定加载量的由已公布的国际专利申请No.WO 2011/038019中所述菌株 (其表达Fv43D、Fv3A、Fv51A、AfuXyn2、EG4等)产生的全纤维素酶背景中,总蛋白质浓度为88.8g/L。所述混合物用于水解磷酸溶胀纤维素(PASC)。各样品剂量一式四份进行测定。
将全部酶稀释物在50mM乙酸钠缓冲液(pH 5.0)中制备。将一百五十(150)μL冷的0.6%PASC添加到微量滴定平板(NUNC平底聚苯乙烯材质,目录号269787)中的30μL酶溶液中。该酶混合物因此含有10mg蛋白质/g葡聚糖的全纤维素酶,并且添加有0-10mg Nc3A或Bgl1/g葡聚糖。将平板用铝板密封件覆盖并且在50℃、200rpm的Innova培养箱/摇床中孵育1.5h。用100μL 100mM甘氨酸(pH 10)淬灭该反应,过滤(Millipore真空过滤板(Millipore vacuum filter plate),目录号MAHVN45),并且在Agilent5042-1385HPLC上用Aminex HPX-87P色谱柱测量可溶性糖。
葡聚糖转化百分比被确定为(mg葡萄糖+mg纤维二糖+mg纤维三糖)/mg反应中的纤维素。
结果示于图3A-图3C中。在约46%和62.5%转化率处的水平线表示仅全纤维素酶背景活性的10mg/g和20mg/g加载量。
Nc3A比相同剂量的里氏木霉Bgl1产生更多的葡萄糖。这与Nc3A具有比里氏木霉Bgl1更高的纤维二糖酶活性相符。当测量总可溶性糖(包括葡萄糖和纤维二糖)的浓度以确定葡聚糖转化率%时,Nc3A的性能超过里氏木霉Bgl1。
实例5:Nc3A多肽对稀氨水预处理的玉米秸秆底物的改善的水解性 能。
在该实验中,将β-葡糖苷酶以递增剂量添加到10mg蛋白质/g葡聚糖恒定加载量的由根据国际公布的专利申请No.WO 2011/038019的工程化里氏木霉菌株产生的全纤维素酶中。
该混合物用于在50℃下水解DACS 2天。为了制备该混合物,将里氏木霉Bgl1从2.2g/L总蛋白的经纯化的原液中添加到水解测定法中。从0.72mg/mL浓缩样品添加Nc3A。使稀氨水预处理的玉米秸秆(DACS)在20mM乙酸钠(pH 5)中成浆以获得最终7%固含量。如果需要的话,将所述浆液调节到pH 5并且将所述浆液转移到96孔微量滴定平板中。
如上所述在微量滴定平板中制备稀氨水预处理的玉米秸秆。将所有酶基于mg蛋白质/g葡聚糖计加载到底物中。将全部酶稀释物在50mM乙酸 钠缓冲液(pH 5.0)中制备。将三十(30)μL的酶溶液添加到微量滴定平板每个孔内的45μg底物中。将平板用箔密封件覆盖并且在50℃、200rpm的Innova培养箱/摇床中孵育2天。用100μL 100mM甘氨酸(pH 10)淬灭该反应,过滤,并且通过HPLC(Agilent 100系列,配备有脱灰柱(Biorad 125-0118)和碳水化合物柱(Aminex HPX-87P))测量可溶性糖。流动相是水,流速为0.6毫升/分钟以及运行时间为20分钟。生成葡萄糖标准曲线并用于定量。
将葡聚糖转化百分比定义为(mg葡萄糖+mg纤维二糖+mg纤维三糖)/mg底物中的纤维素。
结果示于图4A-图4C中。
Nc3A在所有剂量下的性能都超过里氏木霉Bgl1,如通过葡聚糖转化水平、产生的葡萄糖的量所测得。Nc3A和Bgl1表现出相似有效地从糖化混合物中除去纤维二糖。