相关申请的交叉参考
[01]本申请要求下列美国临时申请的优先权:2003年3月21日提交的60/456,368 号(律师案卷编号是GC793P),和2003年3月27日提交的60/458,696号(律师 案卷编号是GC793-2P),所有申请在此并入,作为参考。
关于在联邦政府资助的研究和开发项目中做出的发明的权利的声明
[02]本工作的一部分由与美国国家再生能源实验室签定的分包合同 ZCO-0-30017-01资助进行,而该分包合同隶属于与美国能源部签定的基本合同 DE-AC36-99GO10337。因此,美国政府可以拥有本发明的某些权利。
技术领域
[03]本发明涉及红褐肉座菌(Hypocrea jecorina)(里氏木霉(Trichoderma reesei))CBH1的同源物和变异体。本发明涉及编码具有纤维二糖水解酶 (cellobiohydrolase)活性的多肽的分离的核酸序列。本发明也涉及含有所述核酸 序列的核酸构建物、载体和宿主细胞,以及用于生产重组变异CBH多肽和红褐肉 座菌CBH1的新的同源物的方法。
参考文献
Altschul,S.F.,et al.,J.Mol.Biol.215:403-410,1990.
Altschul,S.F.,et al.,Nucleic Acids Res.25:3389-3402,1997.
Aro,N.,et al.,J.Biol.Chem.,10.1074/M003624200,April 13,2001.
Aubert,et al.,Ed.,pll et seq.,Academic Press,1988.
Ausubel G.M.,et al.CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,John Wiley & Sons,New York,N.Y.,1993.
Baldwin,D.,et al.,Curr.Opin.Plant Biol.2(2):96-103,1999.
Baulcombe,D.,Arch.Virol.Suppl.15:189-201,1999.
Bhikhabhai,R.et al.,J.Appl.Biochem.6:336,1984.
Brumbauer,A.et al.,Bioseparation 7:287-295,1999.
Carter et al.,Nucl.Acids Res.13:4331,1986.
Chen et al.,Biochem.Biophys.Acta.1121:54-60,1992.
Coligan,J.E.et al.,eds.,CURRENT PROTOCOLS IN IMMUNOLOGY,1991.
Collen,A.,et al,Journal of Chromatography A 910:275-284,2001.
Coughlan,et al.,BIOCHEMISTRY AND GENETICS OF CELLULOSE DEGRADATION.
Cummings and Fowler,Curr.Genet.29:227-233,1996.
Dayhoff et al.in Atlas of Protein Sequence and Structure,Volume 5,Supplement 3, Chapter 22,pp.345-352,1978.
Deutscher,M.P.,Methods Enzymol.182:779-80,1990.
Doolittle,R.F.,OF URFs AND ORFs,University Science Books,CA,1986.
Ellouz,S.et al.,J.Chromatography 396:307,1987.
Fields and Song,Nature 340:245-246,1989.
Filho,et al.Can.J.Microbiol.42:1-5,1996.
Fliess,A.,et al.,Eur.J.Appl.Microbiol.Biotechnol.17:314,1983.
Freer,et al.J.Biol.Chem.268:9337-9342,1993.
Freshney,R.I.,ed.,ANIMAL CELL CULTURE,1987.
Goyal,A.et al.Bioresource Technol.36:37,1991.
Halldorsdottir,S et al.,Appl Microbiol Biotechnol.49(3):277-84,1998.
Hu et al.,Mol Cell Biol.11:5792-9,1991.
Hemmpel,W.H.ITB Dyeing/Printing/Finishing 3:5-14,1991.
Herr et al.,Appl.Microbiol.Biotechnol.5:29-36,1978.
Jakobovits,A,et al.,Ann N Y Acad Sci 764:525-35,1995.
Jakobovits,A,Curr Opin Biotechnol 6(5):561-6,1995.
Jones et al.,Nature 321:522-525,1986.
Kawaguchi,T et al.,Gene 173(2):287-8,1996.
Knowles,J.et al.,TIBTECH 5,255-261,1987.
Kohler and Milstein,Nature 256:495,1975.
Krishna,S.et al.,Bioresource Tech.77:193-196,2001.
Kumar,A.,et al.,Textile Chemist and Colorist 29:37-42,1997.
Lehtio,J.et al.,FEMS Microbiology Letters 195:197-204,2001.
Li and Ljungdahl Appl.Environ.Microbiol.62:209-213,1996.
Linder,M.and Teeri,T.T.,Biotechnol.57:15-28,1997.
Medve,J.et al.,J.Chromatography A 808:153,1998.
Ohmiya et al.,Biotechnol.Gen.Engineer.Rev.14:365-414,1997.
Ooi et al.,Nucleic Acids Res.18(19):5884,1990.
Ortega et al.,International Biodeterioration and Biodegradation 47:7-14,2001.
Penttila et al.,Yeast 3:175-185,1987.
Penttila et al.,Gene 63:103-112,1988.
Pere,J.,et al.,In Proc.Tappi Pulping Conf.,Nashville,TN,27-31,pp.693-696,1996.
Riechmann et al.,Nature 332:323-327,1988.
Rothstein et al.,Gene 55:353-356,1987.
Saarilahti et al.,Gene 90:9-14,1990.
Sakamoto et al.,Curr.Genet.27:435-439,1995.
Saloheimo M,et al.,Gene 63:11-22,1988.
Sambrook et al.,MOLECULAR CLONING:A LABORATORY MANUAL(Second Edition),Cold Spring Harbor Press,Plainview,N.Y.,1989.
Schulen,Methods Enzymol.,160,25,pages 234 et seq,1988.
Scopes,Methods Enzymol.90 Pt E:479-90,1982.
Spilliaert R,et al.,Eur J Biochem.224(3):923-30,1994.
Stahlberg,J.et al.,Bio/Technol.9:286-290,1991.
Strathern et al.,eds.(1981)The Molecular Biology of the Yeast Saccharomyces.
Suurnakki,A.et al,Cellulose 7:189-209,2000.
Te′o,J.et al.,FEMS Microbiology Letters 190:13-19,2000.
Tilbeurgh,H.et al.,FEBS Lett.16:215,1984.
Timberlake et al.,Cell 1:29-37,1981.
Tomaz,C.and Queiroz,J.,J.Chromatography A 865:123-128,1999.
Tomme,P.et al.,Eur.J.Biochem.170:575-581,1988.
Tormo,J.et al.,EMBO J.15:5739-5751,1996.
Tyndall,R.M.,Textile Chemist and Colorist 24:23-26,1992.
Van Rensburg et al.,Yeast 14:67-76,1998.
Van Tilbeurgh,H.et al.,FEBS Lett.204:223-227,1986.
Verhoeyen et al.,Science 239:1534-1536,1988.
Warrington,et al.,Genomics 13:803-808,1992.
Wells et al.,Gene 34:315,1985.
Wells et al.,Philos.Trans.R.Soc.London SerA 317:415,1986.
Wood,Biochem.Soc.Trans.,13,pp.407-410,1985.
Wood et al.,METHODS IN ENZYMOLOGY,160,25,p.87 et seq.,Academic Press, New York,1988.
Zoller et al.,Nucl.Acids Res.10:6487,1987.
背景技术
[04]纤维素(Cellulose)和半纤维素(hemicellulose)是由光合作用生成的最丰 富的植物材料。它们可以被许多微生物降解并用作能量来源,这包括细菌、酵母 和真菌,它们产生能够将多聚物底物水解为单体糖的胞外酶(Aro et al.,2001)。由 于不可再生资源途径的限制,纤维素成为主要的可再生能源的潜力是巨大的 (Krishna et al.,2001)。通过生物学方法有效利用纤维素,是解决食品、饲料和燃 料短缺的一个途径(Ohmiya et al.,1997)。
[05]纤维素酶(Cellulases)是水解纤维素(β-1,4葡聚糖或者β D-糖苷键)导 致形成葡萄糖、纤维二糖、纤维寡糖(cellooligosaccharides)和类似物质的酶。纤 维素酶在传统上被分为三个主要类型:内切葡聚糖酶(endoglucanases)(EC 3.2.1.4)(″EG″),外切葡聚糖酶(exoglucanases)或者纤维二糖水解酶(EC 3.2.1.91)(″CBH″)和β-葡萄糖苷酶([β]-D-glucoside glucohydrolase;EC 3.2.1.21) (″BG″)。(Knowles et al.,1987;Shulein,1988)。内切葡聚糖酶主要作用于纤维素 纤维的非晶体部分,而纤维二糖水解酶也可以降解晶体纤维素(Nevalainen and Penttila,1995)。因此,纤维二糖水解酶在纤维素酶系统中的存在对于晶体纤维素 的有效溶解是必需的(Suurnakki,et al.2000)。β-葡萄糖苷酶的作用是从纤维二糖、 纤维寡糖和其它糖苷释放出D-葡萄糖单位(Freer,1993)。
[06]已知纤维素酶是由众多的细菌、酵母和真菌产生的。一些真菌产生能够降 解晶体形式的纤维素的完整纤维素酶系统,这样,纤维素酶很容易地通过发酵而 大量生成。由于许多酵母,如酿酒酵母(Saccharomyces cerevisiae)缺乏水解纤维 素的能力,丝状真菌起了特殊的作用。参见,例如,Aro et al.,2001;Aubert et al.,1988; Wood et al.,1988,和Coughlan,et al.
[07]真菌纤维素酶的CBH、EG和BG分类可以被进一步细化,在每种类别中包 括多种成分。例如,多种CBHs、EGs和BGs已经从各种真菌来源分离出来,包 括里氏木霉,其含有下列已知基因:2个CBHs,即CBH1和CBH II,至少8个 EGs,即EG I、EG II、EG III、EG IV、EG V、EG VI、EG VII和EG VIII,和至少 5个BGs,即BG1、BG2、BG3、BG4和BG5。
[08]为了有效地将晶体纤维素转变为葡萄糖,完整的纤维素酶系统是必需的, 其包括来自CBH、EG和BG类别中每一类的成分,而孤立的成分在水解晶体纤维 素方面的有效性较小(Filho et al.,1996)。已经观察到,在不同类别的纤维素成分 之间存在协同关系。特别地,EG-型纤维素酶和CBH-型纤维素酶协同地相互作用, 以更加有效地降解纤维素。参见,例如,Wood,1985。
[09]在本领域已知,纤维素酶在织物的处理方面是有用的,可用于增强洗涤剂 组合物清洁能力、用作软化剂、用于改善棉织物的手感和外观,和类似方面(Kumar et al.,1997)。
[010]已经描述了,具有改进的清洁特性的含纤维素酶的洗涤剂组合物(美国专 利4,435,307号;英国申请2,095,275号和2,094,826号),以及用于织物处理以改 善织物的手感和外观的含纤维素酶的洗涤剂组分(美国专利5,648,263、5,691,178 和5,776,757号;英国申请1,358,599号;The Shizuoka Prefectural Hammamatsu Textile Industrial Research Institute Report,Vol.24,pp.54-61,1986)。
[011]因此,真菌和细菌中产生的纤维素酶受到了关注。特别地,已经表明,木 霉菌(Trichoderma spp.)(例如,长枝木霉(Trichoderma longibrachiatum)或者里 氏木霉(Trichoderma reesei))发酵生成能够降解晶体形式纤维素的完整纤维素酶 系统。
[012]尽管纤维素组合物在之前已被描述过,但仍存在着对新的和改进的纤维素 组合物的需求,它们将用于家用洗涤剂、石磨洗组合物或者洗衣店洗涤剂,等等。 显示出改进的性能的纤维素酶是特别有价值的。
发明概述
[013]本发明提供了分离的纤维素酶蛋白,其在本文中被称为所需纤维素酶,和 编码所需纤维素酶的核酸。所需纤维素酶可以选自来自红褐肉座菌的变异CBH1 和来自施韦尼兹肉座菌(Hypocrea schweinitzii)、东方肉座菌(Hypocrea orientalis)、 假康宁木霉(Trichoderma pseudokoningii)或者康长木霉(Trichoderma konilangbra) 的新的CBH1。
[014]提供了变异的CBH1纤维素酶(CBH1变异体),其中所述变异体包含在对 应于下列残基中的一个或多个的位置处的替代或者删除:来自红褐肉座菌CBH1 的L6、S8、P13、Q17、G22、T24、Q27、T41、S47、N49、T59、T66、A68、 C71、A77、G88、N89、A100、N103、A112、S113、L125、T160、Y171、Q186、 E193、S195、C210、M213、L225、T226、P227、T232、E236、E239、G242、T246、 D249、N250、R251、Y252、D257、D259、S278、T281、L288、E295、T296、S297、 A299、N301、F311、L318、E325、N327、D329、T332、A336、S341、S342、F352、 K354、T356、G359、D368、Y371、N373、T380、Y381、N384、V393、R394、 V407、P412、T417、F418、G430、N436、G440、P443、T445、Y466、T478、A481 和/或N490。
[015]在另一个方面,变异的CBH1包含在对应于下列残基中的一个或者多个的 位置处的取代:Q186(E)、S195(A/F)、E239S、G242(H/Y/N/S/T/D/A)、D249 (K/L/Y/C/I/V/W/T/N/M)、E325(S/T)、T332(A/H/Y/L/K)和P412(T/S/A)。
[016]在第二种实施方案中,本发明提供了东方肉座菌CBH1。
[017]在第三种实施方案中,本发明提供了施韦尼兹肉座菌CBH1。
[018]在第四种实施方案中,提供了康长木霉CBH1。
[019]在第五种实施方案中,提供了假康宁木霉CBH1。
[020]在本发明的另一种实施方案中,提供了编码本发明的所需纤维素酶的核酸。 在另一种实施方案中,该DNA是在载体中。在进一步的实施方案中,该载体被用 于转化宿主细胞。
[021]在本发明的另一种实施方案中,提供了用于产生本发明的所需纤维素酶的 方法。该方法包括在适合于产生所需纤维素酶的条件下在合适的培养基中培养用 编码所需纤维素酶的核酸转化的宿主细胞,并获得这样产生的所需纤维素酶的步 骤。
[022]在本发明的又一种实施方案中,提供了含有表面活性剂和所需的纤维素酶 的洗涤剂。在本发明的一个方面,该洗涤剂是洗衣洗涤剂或餐盘洗涤剂。在本发 明的另一个方面,所需的CBH1纤维素酶被用于含有纤维素的织物的处理,特别 地,用于石磨洗或者靛青染色粗斜棉布。或者,本发明的纤维素酶可以作为饲料 添加剂,用于木浆处理和用于将生物材料(biomass)还原为葡萄糖。
附图简述
[023]图1显示了红褐肉座菌的野生型Cel7A(CBH1)的核酸序列(下面的行) (SEQ ID NO:1)和氨基酸序列(上面的行)(SEQ ID NO:2)。
[024]图2A和图2B显示了红褐肉座菌(也被称为里氏木霉)(SEQ ID NO:2)、 东方肉座菌(SEQ ID NO:5)、施韦尼兹肉座菌(SEQ ID NO:8)、康长木霉(SEQ ID NO:11)和假康宁木霉(SEQ ID NO:14)Cel7A家族成员的氨基酸联配。也显 示了共有序列。
[025]图3是东方肉座菌CBH1的基因组DNA序列(SEQ ID NO:3)。内含子用 粗体表示并且有下划线。
[026]图4是东方肉座菌CBH1的信号序列(4A)(SEQ ID NO:4)和成熟的氨基 酸序列(4B)(SEQ ID NO:5)。
[027]图5是施韦尼兹肉座菌CBH1的基因组DNA序列(SEQ ID NO:6)。内含 子用粗体表示并且有下划线。
[028]图6是施韦尼兹肉座菌CBH1的信号序列(6A)(SEQ ID NO:7)和成熟的 氨基酸序列(6B)(SEQ ID NO:8)。
[029]图7是康长木霉CBH1的基因组DNA序列(SEQ ID NO:9)。内含子用粗 体表示并且有下划线。
[030]图8是康长木霉CBH1的信号序列(8A)(SEQ ID NO:10)和成熟的氨基 酸序列(8B)(SEQ ID NO:11)。
[031]图9是假康宁木霉CBH1的基因组DNA序列(SEQ ID NO:12)。内含子用 粗体表示并且有下划线。
[032]图10是假康宁木霉CBH1的信号序列(10A)(SEQ ID NO:13)和成熟的 氨基酸序列(10B)(SEQ ID NO:14)。
[033]图11是pRAX1载体。该载体是以质粒pGAPT2为基础,不同的是构巢曲 霉(Aspergillus nidulans)基因组DNA片段AMA1序列的5259bp的HindIII片段 (Molecular Microbiology 1996 19:565-574)被插入。碱基1-1134包含黑曲霉葡糖 淀粉酶基因启动子。碱基3098至3356和4950至4971包含黑曲霉葡糖淀粉酶终 止子。构巢曲霉pyrG基因被插入到3357至4949,作为真菌转化的标记(marker)。 存在可以插入基因的多克隆位点(MCS)。
[034]图12是pRAXdes2载体骨架。此载体是基于质粒载体pRAX1。入门 (gateway)序列盒已被插入pRAX1载体(用环状质粒内的箭头表示)。此序列盒 含有重组序列attR1和attR2和选择性标记物(marker)catH和ccdB。该载体是根 据GatewayTM Cloning Technology第一版34-38页中的指南被制备,并且仅可以在 invitrogen的大肠杆菌DB3.1中复制;在其它大肠杆菌宿主中,ccdB基因是致命的。 首先,用含有attB1/2重组序列的引物获得PCR片段。将此片段与pDONR201(可 以从Invitrogen公司购得)重组;此载体含有attP1/2重组序列,catH和ccdB位于 重组位点之间。应用invitrogen的BP clonase酶,将该PCR片段重组到被称为 ENTRY的载体中,带有插入的PCR片段的克隆可以用50μg/ml卡那霉素选择出来, 原因是表达ccdB的克隆不存活。现在,att序列被改变,并且被称为attL1和attL2。 第二个步骤是,用pRAXdes2载体(在重组位点之间含有attR1和attR2catH和ccdB) 重组此克隆。应用invitrogen的LP clonase酶,将来自ENTRY载体的插入片段重 组到目标载体(destination vsctor)中。应用100μg/ml氨苄青霉素,仅pRAXCBH1 载体被选择出来,原因是ccdB是致命的,而且ENTRY载体对氨苄青霉素敏感。 通过这种方法,现在,表达载体得以制备并且可以用于转化黑曲霉。
[035]图13提供了对pRAXdes2cbh1载体的说明,该载体被用于在曲霉菌中表达 编码CBH1同源物或者CBH1变异体的核酸。通过att序列的同源重组,编码CBH1 酶同源物或者变异体的核酸被克隆入该载体。
发明详述
[036]现在,将通过参考下面的定义和实施例来详细描述本发明。此处提及的所 有的专利和出版物,包括在这些专利和出版物中公开的序列,都特意地以引用方 式并入。
[037]除非本文另有定义,此处应用的所有技术术语和科学术语,皆具有本发明 所属领域的普通技术人员所普遍理解的含义。Singleton,et al.,DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY,2D ED.,John Wiley and Sons, New York(1994)和Hale & Marham,THE HARPER COLLINS DICTIONARY OF BIOLOGY,Harper Perennial,NY(1991)向技术人员提供了本发明中应用的许多术 语的一般性解释。尽管与此处描述的方法和材料相似或者等价的任意方法和材料 可以被用于本发明的实践或者试验中,但仍描述了优选的方法和材料。数字范围 包括用于限定该范围的端值。除非另有指明,核酸以5’-3’的方向从左至右书写; 氨基酸序列以氨基末端向羧基末端的方向从左至右书写。关于本领域的定义和术 语,实践者可以特别地参考Sambrook et al.,1989和Ausubel FM et al.,1993。应该 理解,本发明不限于所描述的具体的方法学、方案和试剂,因为它们可以变化。
[038]本文提出的标题不是对本发明各个方面或者各种实施方案的限制,可以通 过参考整个说明书来考虑它们。因此,通过将说明书作为一个整体来参考,下面 即将被定义的术语可以被更加全面地定义。
[039]本文引用的所有出版物均特意地通过引用方式并入本文,以用于描述和揭 示可能与本发明联系使用的组合物和方法学。
1.定义
[040]“纤维素酶”(cellulase)、“纤维水解酶”(cellulolytic enzymes)或者“纤维 素酶酶”(cellulase enzymes)是指细菌或者真菌的外切葡聚糖酶(exoglucanases) 或者外切纤维二糖水解酶(exocellobiohydrolases),和/或内切葡聚糖酶 (endoglucanases),和/或β-葡糖苷酶。纤维素酶的这三种不同形式协同作用,以 将纤维素及其衍生物转化为葡萄糖。
[041]许多微生物都产生水解纤维素的酶,包括腐木真菌木霉(Trichoderma)、堆 肥细菌高温单孢菌(Thermomonospora)、杆菌(Bacillus)和纤维单胞菌 (Cellulomonas);链霉菌(Streptomyces);和真菌腐质霉(Humicola)、曲霉 (Aspergillus)和镰孢菌(Fusarium)。这些微生物产生的酶是具有三种类型的功能 的蛋白混合物:内切葡聚糖酶(EG)、纤维二糖水解酶(CBH)和β-葡糖苷酶, 它们在纤维素向葡萄糖的转变中是有用的。
[042]如此处所应用,“所需纤维素酶”(“desired cellulase”)是指下列中的任意 一个:
a)根据本发明的来源于红褐肉座菌的CBH1变体;
b)来源于东方肉座菌的CBH1同源物;
c)来源于施韦尼兹肉座菌的CBH1同源物;
d)来源于康长木霉的CBH1同源物;
e)来源于假康宁木霉的CBH1同源物;和
f)由核酸编码的多肽,所述核酸在严紧条件下与编码a-e中任意一个的核酸 杂交。
[043]如此处所应用,“编码所需纤维素酶的核酸”(“desired cellulase-encoding nucleic acid”)是指下列中的任意一个:
a)根据本发明的编码来源于红褐肉座菌的CBH1变体的核酸;
b)编码来源于东方肉座菌的CBH1同源物的核酸,其具有图3显示的序列;
c)编码来源于施韦尼兹肉座菌的CBH1同源物的核酸,其具有图5显示的序 列;
d)编码来源于康长木霉的CBH1同源物的核酸,其具有图7显示的序列;
e)编码来源于假康宁木霉的CBH1同源物的核酸,其具有图9显示的序列和
f)在严紧条件下与上面的a-e中所述核酸中的任意一个杂交的核酸。
[044]“变体”(“variant”)是指衍生于前体蛋白质(例如,天然蛋白质)的蛋白 质,其通过在氨基酸序列的一个位点或者许多不同位点处一个或者多个氨基酸的 取代而生产。通过修饰编码天然蛋白质的DNA序列,将该DNA序列转化到合适 的宿主,并表达该修饰的DNA序列以形成衍生的酶或者酶变异体,酶变体的制备 得以优选地完成。本发明的CBH1酶变体包括这样的肽,与前体酶氨基酸序列相 比,其含有改变的氨基酸序列,其中该变体CBH酶保留了前体酶的特征性的纤维 水解性质,但是在一些特定方面可以具有改变的性质。例如,变体CBH酶可以具 有增加的最适pH,或者具有增加的温度或氧化稳定性,但仍保持其特征性的纤维 水解活性。
[045]如此处所应用,术语“基因”是指参与生成多肽链的DNA片段,可以包括 或者不包括编码区之前的区域和之后的区域,例如,5’非翻译区(5’UTR)或者“前 导”序列和3’UTR或者“尾部”序列,也可以包括或者不包括各个编码片段(外 显子)之间的间插序列(内含子)。
[046]本发明的“丝状真菌”是真核微生物,包括所有丝状形式的真菌亚门 (Eumycotina)(参见Alexopoulos,C.J.(1962),Introductory Mycology,New York: Wiley)。这些真菌的特征在于营养菌丝,具有由几丁质、纤维素和其它复合多糖组 成的细胞壁。本发明的丝状真菌在形态学、生理学和遗传性上不同于酵母。丝状 真菌的营养生长是通过菌丝的延长,并且碳代谢是专性需氧的。与之不同,酵母 如酿酒酵母的营养生长是通过单细胞原植体的出芽,并且碳代谢可以是发酵的。 酿酒酵母具有显著的十分稳定的二倍体期,而在丝状真菌,例如曲霉和脉孢菌中, 二倍体仅短暂地出现于减数分裂之前。尽管在一些情形下,酵母可以显示出假菌 丝生长(pseudohyphal growth),但应该理解,这并不使酵母可以归入到丝状真菌 的定义中。酿酒酵母有17条染色体,而构巢曲霉(A.nidulans)和粗糙脉孢菌(N. crassa)分别具有8条和7条。酿酒酵母和丝状真菌的差异的进一步例证包括,酿 酒酵母不能加工曲霉和木霉内含子,不能识别丝状真菌的许多转录调控因子(Innis, M.A.et al.(1985)Science,228,21-26)。
[047]当用于谈及核酸部分时,术语“异源的”(“heterologous”)表示,该核酸 含有2个或者更多个子序列(subsequences),其在正常情况下在自然界中未发现 相互之间具有同样的关系。例如,该核酸典型地通过重组产生,具有例如来源于 不相关的基因的2个或者更多个序列,它们被排列以形成具有新功能的核酸,例 如,所述的序列可以是一个来源的启动子和另一个来源的编码区域。类似地,异 源蛋白常常涉及两个或者更多个子序列,其在自然界中并未发现具有同样的相互 关系(例如,融合蛋白)。
[048]“异源的”核酸构建物或序列具有与表达它的细胞不存在天然联系的序列 的一部分。有关于调控序列的异源序列,是指调节基因的表达的控制序列(即, 启动子或者增强子),但是在自然界它并不调节现在它所调节的基因的表达。通常 地,异源核酸序列对于其所寄存的细胞或者基因组部分不是内源性的,而是通过 感染、转染、转化、微注射、电穿孔或者类似方法被加入该细胞。“异源的”核酸 构建物可以含有调控序列/DNA编码序列组合,该组合可以与天然细胞中发现的调 控序列/DNA编码序列组合相同或者不同。
[049]如此处所应用,术语“分离的”或者“纯化的”是指与同其天然联系的至 少一种成分分离开的核酸或者氨基酸。
[050]如此处所应用,术语“启动子”是指核酸序列,其功能是指导下游基因的 转录。启动子通常适用于表达靶基因的宿主细胞。启动子与其它转录调节核酸序 列和翻译调节核酸序列(也被称为“调控序列”),对表达特定的基因是必需的。 通常地,转录调节序列和翻译调节序列包括但不限于,启动子序列、核糖体结合 位点、转录起始序列和转录终止序列、翻译起始序列和翻译终止序列,以及增强 子或者激活子序列。
[051]通常地,“启动子序列”是可被特定的丝状真菌识别以用于表达用途的DNA 序列。“组成型”启动子是在大多数环境条件或者发育条件下均具有活性的启动 子。“诱导型”启动子是在环境调节或者发育调节下活化的启动子。本发明中有用 的诱导型启动子的一个例子是里氏木霉(红褐肉座菌)cbh1启动子,其在GenBank 中的收录编号(Accession Number)是D86235。在另一个方面,启动子是来自红 褐肉座菌的cbh II或者木聚糖酶启动子。
[052]代表性的启动子包括来自泡盛曲霉(A.awamori)或者黑曲霉葡糖淀粉酶基 因(Nunberg,J.H.et al.(1984)Mol.Cell.Biol.4,2306-2315;Boel,E.et al.(1984) EMBO J.3,1581-1585)、米黑毛霉(Mucor miehei)羧基蛋白酶基因、红褐肉座菌 纤维二糖水解酶I基因(Shoemaker,S.P.et al.(1984)欧洲专利申请 EPO0137280A1)、构巢曲霉trpC基因(Yelton,M.et al.(1984)Proc.Natl.Acad.Sci. USA 81,1470-1474;Mullaney,E.J.et al.(1985)Mol.Gen.Genet.199,37-45)、构巢 曲霉alcA基因(Lockington,R.A.et al.(1986)Gene 33,137-149)、构巢曲霉tpiA基 因(McKnight,G.L.et al.(1986)Cell 46,143-147)、构巢曲霉amdS基因(Hynes,M. J.et al.(1983)Mol.Cell Biol.3,1430-1439)、红褐肉座菌xln1基因、红褐肉座菌cbh2 基因、红褐肉座菌eg1基因、红褐肉座菌eg2基因、红褐肉座菌eg3基因的启动子, 和更高级的真核启动子例如SV40早期启动子(Barclay,S.L.and E.Meller(1983) Molecular and Cellular Biology 3,2117-2130)。
[053]当一个核酸被置于与另一个核酸序列的功能联系中时,该核酸便是“有效 连接的(operably linked)”。例如,如果多肽是以参与该多肽的分泌的前蛋白形式 被表达,那么编码促分泌前导序列即信号肽的DNA便与该多肽的DNA是有效连 接的;如果启动子或增强子可影响编码序列的转录,那么该启动子或增强子便是 有效连接于该序列;或者,如果核糖体结合位点被定位以致于可协助翻译,那么 该核糖体结合位点便是有效连接于编码序列。通常地,“有效连接”意味着被连接 的DNA序列是相邻的,而且在促分泌前导序列的情形中,是相邻的和处于正确的 阅读框架中的。然而,增强子不一定是相邻的。连接可以通过在方便的限制性位 点进行连接而完成。如果这样的位点不存在,可以按照常规的实践,应用合成的 寡核苷酸接头或者连接子。因此,术语“有效连接”是指在核酸表达调控序列(例 如启动子,或者一串转录因子结合位点)和另一核酸序列之间的功能联系,其中 所述的表达调控序列指导对应于所述的另一序列的核酸的转录。
[054]如此处所定义,“嵌合基因”或者“异源核酸构建物”是指非天然的基因(即, 已被导入到宿主中的基因),其可以由不同的基因部分组成,包括调控元件。典型 地,用于转化宿主细胞的嵌合基因构建物包括转录调控区域(启动子),其可有效 连接于异源蛋白编码序列,或者,在选择性标记物嵌合基因的情形中,其有效连 接于选择性标记物基因,该基因编码使转化细胞具有抗生素抗性的蛋白。本发明 的用于转化入宿主细胞的典型嵌合基因包括,组成型或者诱导型转录调控区、蛋 白编码序列和终止子序列。如果需要分泌靶蛋白,嵌合基因构建物也可以包括编 码信号肽的另一个DNA序列。
[055]术语“重组子”,当用于例如细胞或者核酸、蛋白、载体时,表示该细胞、 核酸、蛋白或者载体已经通过异源性核酸或蛋白的导入或者天然核酸或蛋白的改 造而被修饰,或者该细胞衍生于如此修饰的细胞。因此,例如,重组细胞表达在 该细胞的天然(非重组)形式中未发现的基因,或者表达的是天然基因,但是该 天然基因在其它情况下是异常地表达、表达不足或者根本不表达。
[056]术语“促分泌信号序列”表示编码多肽(“促分泌肽”)的DNA序列,促分 泌肽作为更大的多肽的一部分,指导该更大的多肽穿过合成它的细胞的分泌通路。 在通过所述分泌通路的过程中,该更大的肽通常被切割,以去除促分泌肽。
[057]如此处所应用,短语“全纤维素酶制备物(whole cellulase preparation)”和 “全纤维素酶组合物(whole cellulase composition)“可以互换地应用,可以指天然 发生和非天然发生的组合物。“天然发生的”组合物是由天然发生的来源产生的, 其含有一个或者多个纤维二糖水解酶类型、一个或者多个内切葡聚糖酶类型,和 一个或者多个β-葡糖苷酶成分,其中这些成分中的每一个以由所述来源所产生的 比率被发现。天然发生的组合物是由就纤维素水解酶而言未加以修饰的生物体产 生的组合物,因此酶成分的比率与由天然生物体生成的相比没有改变。
[058]“非天然发生的”组合物包括那些如下产生的组合物:(1)以天然发生的 比率或者非天然发生的比率即改变的比率将纤维水解酶成分组合起来;或者(2) 修饰生物体,以过量表达或者抑制表达一种或者多种纤维素水解酶;或者(3)修 饰生物体,以致于至少一种纤维素水解酶被剔除。
[059]“等价残基(equivalent residues)”也可以被定义,通过在前体纤维素酶的 三级结构水平上确定同源性,所述前体纤维素酶的三级结构已经通过X射线晶体 学确定。等价残基被定义为这样的残基,对于它们来说,纤维素酶和红褐肉座菌 CBH在联配(alignment)之后,特定氨基酸残基的主链原子(N对N,CA对CA, C对C和O对O)中的2个或者更多个的原子坐标是在0.13nm内,优选地在0.1nm 内。在讨论红褐肉座菌CBH1时,联配是在最佳模型已经被定向和定位从而得到 纤维素酶的非氢蛋白原子的原子坐标的最大重叠之后实现的。所述的最佳模式是 在可利用的最高分辨率下对于衍射实验数据给出最低R因子的晶体学模型。
[060]在功能上类似于红褐肉座菌CBH1特定残基的等价残基被定义为纤维素酶 的那些氨基酸,其可以采用一种构象以致于它们可以以贡献于红褐肉座菌CBH1 特定残基的限定的方式,改变、修饰或者影响蛋白质的结构、底物结合或者催化 作用。进一步地,它们是纤维素酶(其三级结构已经通过X射线晶体学获得)的 那些残基,其占据相似的位置,所述的相似达到了这样的程度,虽然给定残基的 主链原子可能不满足基于占据同源位置的等价标准,但是残基的侧链原子中的至 少2个的原子坐标位于红褐肉座菌CBH的对应侧链原子的0.13nm内。
[061]术语“核酸分子”包括RNA、DNA和cDNA分子。可以理解的是,由于遗 传密码的简并性,编码一种给定蛋白如CBH1的多个核苷酸序列可以产生。本发 明涵盖了每一种可能的变异体核苷酸序列,其编码CBH1,所有的序列都可能被赋 予遗传密码的简并性。
[062]如此处所应用,术语“载体”是指设计用于在不同宿主细胞之间转移的核 酸构建物。“表达载体”是指具有整合异源DNA片段和在外源细胞中表达异源 DNA片段的能力的载体。许多原核细胞和真核细胞表达载体是商业上可得到的。 对合适载体的选择在本领域技术人员的知识范围内。
[063]因此,“表达序列盒”或者“表达载体”是重组产生或者合成产生的核酸构 建物,其带有允许特定核酸在靶细胞中转录的一系列特定核酸元件。重组表达序 列盒可以被并入质粒、染色体、线粒体DNA、质体DNA、病毒或者核酸片段。典 型地,表达载体的重组表达序列盒部分包括将被转录的核酸序列和启动子。
[064]如此处所应用,术语“质粒”是指环状双链(ds)DNA构建物,其用作克隆 载体,并且在许多细菌和一些真核细胞中形成染色体外的自我复制遗传元件。
[065]如此处所应用,术语“编码选择性标记物的核苷酸序列”是指能够在细胞 中表达的核酸序列,并且选择性标记物的表达使含有该被表达的基因的细胞能够 在存在相应的选择试剂的条件下或者在相应的选择生长条件下生长。
[066]一般来说,在中度至高度严紧(stringency)的条件下,编码变异体CBH1 的核酸分子会和本文提供为SEQ ID NO:1(天然的红褐肉座菌CBH1)的野生型 序列杂交。然而,在一些情形下,应用的是具有大体上不同的密码子使用的编码 CBH1的核苷酸序列,而由该编码CBH1的核苷酸序列编码的蛋白质具有和天然蛋 白质相同的或者大体上相同的氨基酸序列。例如,根据特定密码子被宿主应用的 频率,编码序列可以被修饰以有利于CBH1在特定原核细胞或者真核细胞表达系 统中更快地表达,例如,Te′o,et al.(2000)描述了在丝状真菌中表达基因的最优化 方式。
[067]如果两个序列在中度至高度严紧的杂交和洗脱条件下彼此特异地杂交,那 么便认为其中一个核酸对于另一个参照核酸,是“可选择性地杂交”的。杂交温 度是基于核酸结合复合物或者探针的解链温度(Tm)。例如“最大的严紧性”典型 地发生在大约Tm-5℃(低于探针的Tm 5℃);“高严紧性”发生在低于Tm大约 5-10℃;“中度”或者“中间严紧性”发生在低于探针的Tm大约10-20℃;“低严 紧性”发生在低于Tm大约20-25℃。从功能上来说,最大严紧条件可以被用来鉴 定与杂交探针具有严格同一性或者接近严格的同一性的序列,而高严紧条件被用 来鉴定与探针具有大约80%或者更多的序列同一性的序列。
[068]中度严紧和高度严紧的杂交条件在本领域是公知的(参见,例如,Sambrook, et al,1989,Chapters 9 and 11,以及Ausubel,F.M.,et al.,1993,在此特意地并入作为 参考)。高度严紧条件的例子包括,在大约42℃,在50%甲酰胺、5×SSC、5×Denhardt′s 溶液、0.5%SDS和100μg/ml变性载体DNA中杂交,随后,用2×SSC和0.5%SDS 室温洗涤2次,用0.1×SSC和0.5%SDS在42℃再洗涤2次。
[069]如本文所应用,当用于描述细胞时,术语“转化的”、“稳定转化的”或者 “转基因的”是指该细胞具有非天然的(异源的)核酸序列,其被整合入细胞的 基因组中或者作为附加体质粒,经过多代之后依然被维持。
[070]如本文所应用,术语“表达”是指根据基因的核酸序列产生多肽的过程。 此过程既包括转录又包括翻译。
[071]在谈及将核酸序列插入到细胞中时,术语“导入”是指“转染”或者“转 化”或者“转导”,包括将核酸序列整合到真核细胞或者原核细胞中,其中所述核 酸序列可以被并入到细胞的基因组(例如,染色体、质粒、质体或者线粒体DNA), 转变为自主复制子,或者短暂地表达(例如,转染的mRNA)。
[072]接下来,术语“所需纤维素酶的表达”是指所需纤维素酶基因的转录和翻 译,其产物包括前体RNA、mRNA、多肽、翻译后加工的多肽。作为例子,对CBH1 表达的分析包括CBH1蛋白的蛋白质印迹(Western blot)、CBH1 mRNA的RNA 印迹(Northern blot)分析和反转录酶聚合酶链式反应(RT-PCR)分析,和内切葡 聚糖酶活性分析,如Shoemaker S.P.and Brown R.D.Jr.(Biochim.Biophys.Acta, 1978,523:133-146)和Schulen(1988)中所描述。
[073]术语“选择性剪接”是指由单一的基因产生多个多肽异构体的过程,其涉 及将不连续的外显子通过剪接方式连在一起,这发生在一些但不是所有的基因转 录物的加工过程中。因此特定的外显子可以与数个可供选择的外显子中的任意一 个相连,以形成信使RNA。选择性剪接的mRNA生成多肽(“剪接变异体”),其 中一些部分是共同的,而其它部分是不同的。
[074]术语“宿主细胞”是指含有载体并支持表达构建物的复制和/或转录或者转 录和翻译(表达)的细胞。用于本发明的宿主细胞可以是原核细胞,如大肠杆菌, 或者真核细胞,如酵母、植物、昆虫、两栖动物或者哺乳动物细胞。通常地,宿 主细胞是丝状真菌。
[075]术语“纤维素酶”是指酶的一个种类,其能够将纤维素多聚物水解为较短 的纤维寡糖寡聚物、纤维二糖和/或葡萄糖。纤维素酶的许多例子,如外切葡聚糖 酶、外切纤维二糖水解酶、内切葡聚糖酶和葡糖苷酶已经从可水解纤维素的生物 体中获得,特别地,包括真菌、植物和细菌。
[076]来自红褐肉座菌的CBH1是糖基水解酶家族7(Cel7)的一个成员,特别地, 是该家族(Cel7)在红褐肉座菌中鉴定的第一个成员。糖基水解酶家族7既含有内 切葡聚糖酶又含有纤维二糖水解酶/外切葡聚糖酶,CBH1是后者。因此,短语 CBH1、CBH1-型蛋白和Cel7纤维二糖水解酶在此可以互换地应用。
[077]如此处所应用,术语“纤维素结合结构域”是指纤维素酶的部分氨基酸序 列,或者该酶的一个区域,其参与纤维素酶或其衍生物的纤维素结合活性。纤维 素结合结构域或者组件通常通过将该纤维素酶非共价地结合于纤维素、纤维素衍 生物或者它们的其它多糖等价物而起作用。纤维素结合结构域允许或有助于通过 结构上不同的催化核心区域进行纤维素纤维的水解,并且,典型地,它们独立于 催化核心而起作用。因此,纤维素结合结构域不具有显著的水解活性,水解活性 可归因于催化核心。换言之,纤维素结合结构域是纤维素酶蛋白三级结构中不同 于具有催化活性的结构元件的结构元件。
[078]如本文中所使用的,术语“表面活性剂”是指在本领域通常被认为具有表 面活性性质的任何化合物。因此,例如,表面活性剂包括阴离子、阳离子表面活 性剂和非离子型表面活性剂,如通常发现于洗涤剂中的那些表面活性剂。阴离子 表面活性剂包括线性的或者分支的烷基苯磺酸盐;具有线性或分支烷基基团或者 烯基基团的烷基或烯基醚硫酸盐;烷基或烯基硫酸盐;烯烃磺酸盐和烷基磺酸盐。 兼性表面活性剂包括季铵磺酸盐和甜菜碱型兼性表面活性剂。这样的兼性表面活 性剂在同一分子中既有正电荷基团又负电荷基团。非离子型表面活性剂可以包括 聚乙二醇,以及更高级的脂肪酸链烷醇酰胺或者其氧化烯加合物、脂肪酸甘油单 酯,和类似物。
[079]如本文所应用,术语“含纤维素的织物(cellulose containing fabric)”是指 任何缝制或者非缝制的织物、纱或者纤维,由含棉或者不含棉的纤维素制成,或 者由含棉或者不含棉的纤维素混合物制成,所述的纤维素混合物包括天然纤维素 和人造纤维素(如黄麻、亚麻、苎麻、人造丝和莱赛尔纤维(lyocell))。
[080]如本文中所使用的,术语“含棉织物(cotton-containing fabric)”指缝制或 者非缝制的织物、纱或纤维,其由纯棉或棉混合物制成,棉混合物包括棉织物 (cotton woven fabrics)、棉编织物(cotton knits)、斜纹粗棉布(cotton denims)、 棉纱(cotton yarns)、原棉和类似物。
[081]如本文中所应用,术语“石磨洗组合物”是指用于石磨洗含纤维素的织物 的制剂。石磨洗组合物被用于在出售之前,即,在生产过程中修饰含纤维素的织 物。与之不同,洗涤剂组合物主要用于清洁污染的衣服,而不是用在生产过程中。
[082]如本文中所应用,术语“洗涤剂组合物(detergent composition)”是指打算 应用于洗涤介质中用于洗涤污染的含纤维素织物的混合物。就本发明来说,除了 纤维素酶和表面活性剂,这样的组合物还可以包括另外的水解酶、增洁剂、漂白 剂、漂白催化剂、蓝色漂白剂(bluing agents)和荧光染料、结块抑制剂、掩蔽剂 (masking agents)、纤维素酶激活剂、抗氧化剂和增溶剂。
[083]如本文中所应用,术语“cbh1基因表达的降低或者消除”是指cbh1基因已 经从基因组中删除,因此不能被重组宿主微生物表达,或者cbh1基因已经被修饰 以致于有功能的CBH1酶不能被宿主微生物产生。
[084]术语“变异体cbh1基因”,或者“变异体CBH1”分别指,来自红褐肉座菌 的cbh1基因的核酸序列已经通过去除、增加和/或操纵编码序列而被改变,或者被 表达的蛋白的氨基酸序列已经被修饰,与本文所描述的发明一致。
[085]如本文中所应用,术语“活性的”或者“生物活性的”是指与特定蛋白相 关联的生物活性,它们在此可以互换应用。例如,与蛋白酶相关联的酶活性是蛋 白水解,因此,活性蛋白酶具有蛋白水解活性。这样,特定蛋白的生物活性是指 本领域技术人员通常认为该蛋白具有的任何生物活性。
[086]当应用于酶溶液时,同源或者变异CBH1成分通常被加入的量足以允许可 溶性糖以最大速度从生物材料中释放出来。加入的CBH1同源物或者变异体的量 取决于要被糖化的生物材料的类型,这可以被技术人员容易地确定。然而,当被 应用时,CBH1同源物或者变异体成分相对于纤维素酶组合物中存在的EG类型成 分的重量百分比是从优选地大约1、优选地大约5、优选地大约10、优选地大约 15或者优选地大约20的重量百分比至优选地大约25、优选地大约30、优选地大 约35、优选地大约40、优选地大约45或者优选地大约50的重量百分比。进一步 地,优选的范围可以是,大约0.5至大约15的重量百分比、大约0.5至大约20的 重量百分比、从大约1至大约10的重量百分比、从大约1至大约15的重量百分 比、从大约1至大约20的重量百分比、从大约1至大约25的重量百分比、从大 约5至大约20的重量百分比、从大约5至大约25的重量百分比、从大约5至大 约30的重量百分比、从大约5至大约35的重量百分比、从大约5至大约40的重 量百分比、从大约5至大约45的重量百分比、从大约5至大约50的重量百分比、 从大约10至大约20的重量百分比、从大约10至大约25的重量百分比、从大约 10至大约30的重量百分比、从大约10至大约35的重量百分比、从大约10至大 约40的重量百分比、从大约10至大约45的重量百分比、从大约10至大约50的 重量百分比、从大约15至大约20的重量百分比、从大约15至大约25的重量百 分比、从大约15至大约30的重量百分比、从大约15至大约35的重量百分比、 从大约15至大约40的重量百分比、从大约15至大约45的重量百分比、从大约 15至大约50的重量百分比。
II.宿主生物体
[087]丝状真菌包括所有丝状形式的真菌亚门(Eumycota)和卵菌亚门 (Oomycota)。丝状真菌的特征在于营养菌丝,其具有由几丁质、葡聚糖、壳聚糖、 甘露聚糖和其它复杂多糖组成的细胞壁,营养生长是通过菌丝的延长,碳分解代 谢是专性好氧的。
[088]在本发明中,丝状真菌亲代细胞可以是下述种—但不限于这些种—的细胞: 木霉,如长梗木霉(Trichoderma longibrachiatum)、绿色木霉(Trichoderma viride)、 康宁木霉(Trichoderma koningii)、哈茨木霉(Trichoderma harzianum);青霉属某 种(Penicillium sp.);腐质霉属某种(Humicola sp.)包括异常腐质霉(Humicola insolens)和灰腐质霉(Humicola grisea);金孢菌某种(Chrysosporium sp.)包括 拉克淖金孢菌(C.lucknowense);粘帚霉某种(Gliocladium sp.);曲霉属某种;镰 孢菌属某种(Fusarium sp.)、脉孢菌属某种(Neurospora sp.)、肉座菌属某种 (Hypocrea sp.)和裸孢壳属某种(Emericella sp.)。如本文中所使用的,术语“木 霉”或“木霉属某种”指之前已被归入木霉属的任何真菌菌株或目前被归入木霉 属的任何真菌菌株。
[089]在一种优选实施方案中,丝状真菌亲代细胞是黑曲霉、泡盛曲霉(Aspergllus awamori)、棘孢曲霉(Aspergillus aculeatus)或构巢曲霉细胞。
[090]在另外一种优选实施方案中,丝状真菌亲代细胞是里氏木霉细胞。
III.纤维素酶
[091]在本领域中,认为纤维素酶是水解纤维素(β-1,4葡聚糖或者β D-葡糖苷键) 从而导致形成葡萄糖、纤维二糖、纤维寡糖和类似物质的酶。如前面所阐明,纤 维素酶传统地被分为三个主要类型:内切葡聚糖酶(EC 3.2.1.4)(″EG″)、外切葡 聚糖酶或者纤维二糖水解酶(EC 3.2.1.91)(″CBH″)和β-葡糖苷酶(EC 3.2.1.21) (″BG″)(Knowles,et al.,1987;Schulen,1988)。
[092]一些真菌产生包括外切-纤维二糖水解酶或者CBH-型纤维素酶、内切葡聚 糖酶或者EG-型纤维素酶、β-葡糖苷酶或者BG-型纤维素酶在内的完整的纤维素 酶系统(Schulein,1988)。然而,有时这些系统缺乏CBH-型纤维素酶,细菌纤维 素酶通常也含有很少的CBH-型纤维素酶或者不含有CBH-型纤维素酶。此外,已 经表明,EG成分和CBH成分协同地相互作用,以更加有效地降解纤维素。参见, 例如,Wood,1985。多组分或者完整的纤维素酶系统中的不同成分,即,各种内切 葡聚糖酶和外切纤维二糖水解酶,通常具有不同的性质,如等电点、分子量、糖 基化程度、底物特异性和酶作用方式。
[093]也已经表明,纤维素酶组合物可降解含棉织物,导致织物减弱的强度丧失 (美国专利4,822,516),这造成了在商业洗涤剂应用中不愿使用纤维素酶组合物。 已经有提示,与含有完整的纤维素酶系统的组合物相比,包含内切葡聚糖酶成分 的纤维素酶组合物对含棉织物显示出降低的强度丧失。
[094]也已经表明,纤维素酶可以用于将纤维素生物材料降解为乙醇(其中纤维 素酶降解纤维素为葡萄糖,酵母或者其它微生物进一步酵解葡萄糖为乙醇),用于 机械纸浆处理(Pere et al.,1996),用作饲料添加剂(WO 91/04673)和用在谷物湿 磨(wet milling)中。
[095]大多数CBH和EG具有由通过连接肽分隔开的纤维素结合结构域(CBD) 和核心结构域组成的多结构域结构(Suurnakki et al.,2000)。核心结构域含有活性 位点,而CBD通过使酶结合于纤维素而与纤维素发生作用(van Tilbeurgh et al., 1986;Tomme et al.,1988)。CBD在晶体状纤维素的水解中特别重要。已经表明, 当CBD不存在时,纤维二糖水解酶降解晶体状纤维素的能力明显降低(Linder and Teeri,1997)。然而,CBD的确切作用和作用机制仍然是一种推论。已经有人提出, CBD仅仅通过增加纤维素表面的有效酶浓度(Stahlberg et al.,1991),和/或通过从 纤维素表面松开单个的纤维素链(Tormo et al.,1996)来增强酶活性。涉及纤维素 酶结构域对不同底物的作用的大多数研究是应用纤维二糖水解酶的核心蛋白来进 行的,原因是它们的核心蛋白可以容易地通过木瓜蛋白酶的有限蛋白水解而产生 (Tomme et al.,1988)。许多纤维素酶已经在科学文献中被描述,其例子包括:来 自里氏木霉:Shoemaker,S.et al.,Bio/Technology,1:691-696,1983,其公开了CBHI; Teeri,T.et al.,Gene,51:43-52,1987,其公开了CBHII。来自不同于木霉的其它种 的纤维素酶也已经被描述,例如Ooi et al.,1990,其公开了编码棘孢曲霉产生的 内切葡聚糖酶F1-CMC的cDNA序列;Kawaguchi T et al.,1996,其公开了编码棘 孢曲霉的β-葡糖苷酶的cDNA的克隆和测序;Sakamoto et al.,1995,其公开了编 码白曲霉(Aspergillus kawachii)IFO 4308的内切葡聚糖酶CMCase-1的cDNA序 列;Saarilahti et al.,1990,其公开了来自欧氏杆菌(Erwinia carotovara)的内切葡 聚糖酶;Spilliaert R,et al.,1994,其公开了bglA的克隆和测序,bglA编码 Rhodothermus marinus的热稳定β-葡聚糖酶;Halldorsdottir S et al.,1998,其公开了 Rhodothermus marinus基因的克隆、测序和过量表达,Rhodothermus marinus基因 编码糖基水解酶家族12的热稳定性纤维素酶。然而,仍然需要鉴定和表征新型的 纤维素酶,它们应具有改良的特性,诸如在热应激下或在表面活性剂存在的情况 下改善的性能、增加的比活性、改变的底物切割模式和/或体外高水平的表达。
[096]对含有不同含量CBH类型纤维素酶的新的和改进的纤维素酶组合物的开 发,对下列用途是有价值的:(1)用在洗涤剂组合物中,其表现出增强的清洗能 力,起到柔软剂的作用和/或改善棉织物的手感(例如,“石磨洗”或者“生物抛光 (biopolishing)”;(2)用在用于将木浆或者其它生物材料降解为糖的组合物中(例 如,用于生物乙醇生产);和/或(3)用在饲料组合物中。
IV分子生物学
[097]在一种实施方案中,本发明提供了在丝状真菌中有功能的启动子的控制下 表达所需纤维素酶基因。因此,本发明依赖于重组遗传学领域中的常规技术。公 开了用于本发明的一般性方法的基本文献包括:Sambrook et al.,Molecular Cloning, A Laboratory Manual(2nd ed.1989);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990),和Ausubel et al.,eds.,Current Protocols in Molecular Biology(1994)。
A.用于鉴定同源CBH1基因的方法
[098]在图1中显示了野生型红褐肉座菌CBH1的核酸序列。本发明,在一个方 面,包括了此处描述的编码CBH1同源物的核酸分子。该核酸可以是DNA分子。
[099]可以被用来分离编码同源CBH1的DNA序列的技术在本领域中是公知的, 包括但不限于,用同源DNA探针进行cDNA文库筛选和/或基因组文库筛选,用 活性分析或者抗CBH1抗体进行表达筛选。这些方法中的任一种都可以发现于 Sambrook,et al.或者CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,F. Ausubel,et al.,ed.Greene Publishing and Wiley-Interscience,New York(1987) (″Ausubel″)。
B.突变CBH核酸序列的方法
[0100]本领域中已知的可以引入突变的任何方法,均被本发明所预期。
[0101]本发明涉及CBH1变异体的表达、纯化和/或分离和应用。这些酶优选地通 过利用红褐肉座菌的cbh基因的重组方法来制备。
[0102]在红褐肉座菌的cbh1基因被分离和克隆之后,本领域中已知的其它方法, 如定点诱变,被用于在对应于表达的CBH1变异体中取代氨基酸的位置进行替代、 添加或者删除。此外,定点诱变和在DNA水平上实现在表达蛋白中引入氨基酸变 化的其它方法,可以在Sambrook,et al和Ausubel,et al中找到。
[0103]编码红褐肉座菌CBH1的氨基酸序列变异体的DNA是通过本领域中已知的 各种方法制备的。这些方法包括但不限于,通过对早先制备的编码红褐肉座菌 CBH1的DNA进行定点(或者寡核苷酸介导)诱变、PCR诱变和盒式诱变来制备。
[0104]定点诱变是制备替代型变异体的优选方法。此技术在本领域中是公知的(参 见,例如Carter et al.Nucleic Acids Res.13:4431-4443(1985)and Kunkel et al.,Proc. Nat1.Acad.Sci.USA 82:488(1987))。简言之,进行DNA的定点诱变时,起始DNA 是通过首先将编码所需突变的寡核苷酸和此起始DNA的单链杂交来改变的。杂交 后,以杂交的寡核苷酸作为引物,以起始DNA的单链作为模板,应用DNA聚合 酶合成完整的第二链。由此,编码所需突变的寡核苷酸被并入到得到的双链DNA 中。
[0105]PCR诱变也适用于制备起始多肽即红褐肉座菌CBH1的氨基酸序列变异体。 参见,Higuchi,PCR Protocols,pp.177-183(Academic Press,1990);和Vallette et al., Nuc.Acids Res.17:723-733(1989)。简言之,当小量的DNA模板在PCR中被用作 起始物质时,在序列上与模板DNA的对应区域略微不同的引物可以被用于生成相 对大量的特定DNA片段,这样的DNA片段仅在引物不同于模板的位置处不同于 模板序列。
[0106]用于制备变异体的另一种方法,盒式诱变,是基于Wells et al.,Gene 34: 315-323(1985)所描述的技术。起始材料是含有要被突变的起始多肽DNA的质粒 (或者其它载体)。要被突变的起始DNA中的密码子被鉴定。在鉴定的突变位点 的每一侧,必须存在特有的限制性内切酶位点。如果不存在这样的限制性位点, 可以应用上述的寡核苷酸介导的诱变方法生成它们,以在起始多肽DNA的合适位 置导入这样的位点。质粒DNA在这些位点被切割,以使之线性化。编码限制性位 点之间的DNA序列但包含所需突变的双链寡核苷酸,应用标准方法被合成,其中 寡核苷酸的两条链分别被合成,然后应用标准方法被杂交在一起。此双链寡核苷 酸被称为序列盒。将此序列盒设计为具有与线性化质粒的末端相容的5’和3’末端, 这样,可以将其直接连接入质粒。至此,此质粒含有突变的DNA序列。
[0107]选择地,或者附加地,编码所需纤维素酶的所需氨基酸序列可以被确定, 编码这样的氨基酸序列变异体的核酸序列可以通过合成方法来生成。
[0108]这样制备的所需纤维素酶可以被进一步修饰,这时常是取决于纤维素酶的 目的用途。这样的修饰可以涉及氨基酸序列的进一步变化、与异源多肽的融合和/ 或共价修饰。
V.cbh1核酸和CBH1多肽
A.变异cbh型核酸
[0109]在编码CBH1变异体的DNA序列克隆入DNA构建物之后,将该DNA转 化到微生物中。根据本发明,用于表达变异体CBH1的要被转化的微生物,可以 包括来源于木霉的菌株,这是较为有利的。因此,根据本发明,用于制备变异体 CBH1纤维素酶的优选方式包括,用DNA构建物转化木霉宿主细胞,所述的DNA 构建物包括编码变异体CBH1的部分或者全部的DNA的至少一个片段。DNA构 建物通常功能性地连接于启动子。然后,被转化的宿主细胞在一定条件下生长, 表达所需的蛋白。随后,将所需的蛋白产物纯化为基本同质。
[0110]然而,可能的事实是,编码变异体CBH1的特定DNA的最佳表达媒介可能 不同于红褐肉座菌。因此,在与变异体CBH1的来源生物体种系发生相似的转化 宿主中表达蛋白,可能会最有利。在一种可以选择的实施方案中,黑曲霉可以被 用作表达媒介。关于黑曲霉的转化技术的描述,参见WO 98/31821,其公开内容 通过引用方式整体并入。
[0111]因此,在此对木霉(Trichoderma spp.)表达系统的描述,仅仅是提供用作 阐释的目的,为表达本发明变异体CBH1提供一个选择。然而,本领域的技术人 员可以选择在不同的宿主细胞中表达编码变异体CBH1的DNA,如果是合适的话, 并且应该理解,在确定最佳表达宿主时,变异体CBH1的来源应该被考虑。另外 地,本领域技术人员将能够应用本领域中可利用的手段,通过常规技术选择针对 特定基因的最佳表达系统。
B.变异CBH1多肽
[0112]图1显示了野生型红褐肉座菌CBH1的氨基酸序列。变异体CBH1多肽包 括,在对应于下列残基中的一个或者多个的位置处的取代或者删除:来自红褐肉 座菌的CBH1中的L6、S8、P13、Q17、G22、T24、Q27、T41、S47、N49、T59、 T66、A68、C71、A77、G88、N89、A100、N103、A112、S113、L125、T160、 Y171、Q186、E193、S195、C210、M213、L225、T226、P227、T232、E236、E239、 G242、T246、D249、N250、R251、Y252、D257、D259、S278、T281、L288、 E295、T296、S297、A299、N301、F311、L318、E325、N327、D329、T332、A336、 S341、S342、F352、K354、T356、G359、D368、Y371、N373、T380、Y381、 N384、V393、R394、V407、P412、T417、F418G430、N436、G440、P443、T445、 Y466、T478、A481和/或N490。
[0113]本发明的变异体CBH1具有衍生于前体红褐肉座菌CBH1氨基酸序列的氨 基酸序列。通过对前体氨基酸序列的一个或者多个氨基酸的取代、删除或者插入, CBH1变异体的氨基酸序列不同于前体CBH1氨基酸序列。图1显示了红褐肉座菌 CBH1的成熟氨基酸序列。因此,本发明所涉及的CBH1变异体在与红褐肉座菌 CBH1中具体鉴定的残基等价的位置含有氨基酸残基。如果CBH1变异体的残基 (氨基酸)与红褐肉座菌CBH1的特定残基或残基的一部分同源(即,在一级结 构或者三级结构中的位置相对应)或者功能上类似(即,在化学或者结构的组合、 反应或者相互作用方面具有相同或者相似的功能能力),那么CBH1变异体的该残 基(氨基酸)便等价于红褐肉座菌CBH1的该残基。如此处所应用,编号是对应 于如图1所示的成熟CBH1氨基酸序列的编号。除了前体CBH1内的位置,在前 体CBH1中对应于与该前体CBH1在热应激时的不稳定性有联系的氨基酸位置处 的特定残基在此被鉴定,以用于取代或者删除。氨基酸位置编号(例如,+51)是 指针对图1显示的成熟红褐肉座菌CBH1序列设计的编号。
[0114]优选地,应用“序列比较算法”来进行氨基酸序列的联配,以确定同源性。 用于比较的序列的最佳联配可以通过下列方法或算法来进行:例如,Smith & Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法(local homology algorithm),Needleman & Wunsch,J.Mol.Biol.48:443(1970)的同源性联配算法, Pearson & Lipman,Proc.Nat′l Acad.Sci.USA 85:2444(1988)的相似性搜索方法,这 些算法的计算机实施(GAP、BESTFIT、FASTA和TFASTA,Wisconsin Genetics Software Package,Genetics Computer Group,575 Science Dr.,Madison,WI),视觉 观察(visual inspection)或Chemical Computing Group,Montreal Canada的MOE。
[0115]适合于确定序列相似性的算法的一个例子是BLAST算法,在Altschul,et al., J.Mol Biol.215:403-410(1990)中有描述。用于实施BLAST分析的软件可以通过 美国国家生物技术信息中心(www.ncbi.nim.nih.gov)公开得到。此算法涉及,首 先通过鉴别待询序列(query sequence)中长度为W的短的字串来确定高分序列对 (high scoring sequence pairs,HSPs),所述高分序列对在与数据库序列中同样长度 的字串联配时,匹配或者满足某个正值的阈值T。这些初始的邻近字串被用作起始 点以发现包含有它们的更长的HSPs。所述字串沿着被比较的这两个序列中的每一 个向两个方向延伸,只要累积的联配分数在增加。出现下面情况时,字串的延伸 便停止:累积的联配分数由达到的最大值下降了数量X;累积分数达到0或者0 以下;或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配 的灵敏度和速率。BLASTN程序默认的是:字串长度(W)为11,BLOSUM62记 分矩阵(参见Henikoff & Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989)), 联配(B)为50,期望值(E)为10,M’5,N’-4,对两条链进行比较。
[0116]然后,BLAST算法进行两个序列之间的相似性的统计学分析(参见,例如, Karlin & Altschul,Proc.Nat′l.Acad.Sci.USA 90:5873-5787(1993))。由BLAST算 法提供的一种相似性量度是最小合计概率(smallest sum probability,P(N)),其表 示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,如果在受测氨 基酸序列和蛋白酶氨基酸序列的比较中,最小合计概率是小于大约0.1,更优选地 小于大约0.01,最优选地小于大约0.001,便认为该氨基酸序列与蛋白酶相似。
[0117]下面提供了用于改变CBH1纤维素酶的稳定性的另外的具体策略:
[0118](1)减少主链去折叠的熵可以导致酶的稳定性。例如,脯氨酸残基的导入 可以通过降低去折叠的熵而显著地稳定蛋白(参见,例如,Watanabe,et al.,Eur.J. Biochem.226:277-283(1994))。相似地,甘氨酸残基没有β-碳,因此与任何其它 残基相比,具有大得多的骨架构象自由度。取代甘氨酸,优选地应用丙氨酸进行 取代,可以降低去折叠的熵而改善稳定性(参见,例如,Matthews,et al.,Proc.Natl. Acad.Sci.USA 84;6663-6667(1987))。此外,通过缩短外部环结构(loops),可能 改善稳定性。已经观察到,由极端嗜热菌产生的蛋白与它们的嗜温同源物相比, 具有更短的外部环结构(参见,例如,Russel,et al.,Current Opinions in Biotechnology 6:370-374(1995))。二硫键的导入也可以有效地稳定相互关联的不同的三级结构。 因此,在可接近已存在的半胱氨酸的残基位置处导入半胱氨酸,或者导入可以形 成二硫键的成对半胱氨酸,可以改变CBH1变异体的稳定性。
[0119](2)通过增加侧链疏水性来减少内部空腔,可以改变酶的稳定性。通过最 大化疏水作用和减少堆积(packing)缺陷来降低内部空腔的数量和体积,可以增 加酶的稳定性(参见,例如,Matthews,Ann.Rev.Biochem.62:139-160(1993);Burley, et al.,Science 229:23-29(1985);Zuber,Biophys.Chem.29:171-179(1988);Kellis,et al.,Nature 333:784-786(1988))。已知来自嗜热生物的多聚体蛋白与其嗜温的对应 物相比,常常具有更多的疏水亚基界面,具有更大程度的表面互补(Russel,et al., supra)。认为此原则也适用于单聚体蛋白的结构域界面。特定的取代可以通过增加 疏水性而改善稳定性,包括赖氨酸变为精氨酸、丝氨酸变为丙氨酸、苏氨酸变为 丙氨酸(Russel,et al.,supra)。取代为丙氨酸或者脯氨酸的修饰可以增加侧链的尺 寸,导致减少的空腔、更好的堆积和增加的疏水性。可以减小腔的尺寸、增加疏 水性和改善CBH1结构域之间的界面互补的取代,可以改善酶的稳定性。特别地, 将这些位置的特定残基改变为选自苯丙氨酸、色氨酸、酪氨酸、亮氨酸和异亮氨 酸的不同残基,可以改善性能。
[0120](3)在刚性的二级结构即α-螺旋和β-转角中平衡电荷,可以改善稳定性。 例如,用天冬氨酸上的负电荷中和α-螺旋N末端的部分正电荷,可以改善该结构 的稳定性(参见,例如,Eriksson,et al.,Science 255:178-183(1992))。相似地,用 正电荷中和螺旋C末端的部分负电荷,可以改善稳定性。去除正电荷与β-转角的 肽N末端的相互作用,应该可以有效地赋予三级结构稳定性。用非正电荷残基进 行取代,可以去除不适宜的正电荷与转角中酰胺氮的相互作用。
[0121](4)通过导入盐键和氢键来稳定三级结构,可以是有效的。例如,离子对 相互作用,例如,在天冬氨酸或谷氨酸和赖氨酸、精氨酸或组氨酸之间的相互作 用,可以引起强烈的稳定效应,并且可以被用来粘附不同的三级结构元件,导致 热稳定性增加。此外,带电荷残基/不带电荷残基氢键作用数目的增加,和氢键数 目的增加,通常可以改善热稳定性(参见,例如,Tanner,et al.,Biochemistry 35: 2597-2609(1996))。用天冬氨酸、天冬酰胺、谷氨酸或者谷氨酰胺进行取代,可以 导入与骨架酰胺的氢键。用精氨酸进行取代,可以改善盐桥和导入氢键到碳骨架 碳酰基中。
[0122](5)避免耐敏性残基通常可以增加热稳定性。例如,在高温下天冬酰胺和 谷氨酰胺易发生脱酰胺作用,半胱氨酸易发生氧化。减少这些残基在敏感部位的 数量,可以导致改善的热稳定性(Russel,et al.,supra)。由除谷氨酰胺或者半胱氨 酸之外的任意残基造成的取代或者删除,可以通过避免热敏性残基而增加稳定性。
[0123](6)配体结合的稳定化和去稳定化致使CBH1变异体的稳定性发生改变。 例如,在应用了本发明的CBH1变异体的基质中,一种成分可以结合于CBH1变 异体的特定表面活性剂敏感位点/热敏性位点。通过借助于取代来修饰该位点,该 成分与变异体的结合可以被加强或者减弱。例如,CBH1结合裂隙中的非芳香族残 基,可以被苯丙氨酸或者酪氨酸取代,以导入芳香族侧链稳定化作用,其中,纤 维素底物的作用可以和苯环顺利地发生,这增加了CBH1变异体的稳定性。
[0124](7)增加任意的表面活性剂/热敏感配体的电负性,可以改善在表面活性剂 或者热应激条件下的稳定性。例如,用苯丙氨酸或者酪氨酸取代,可以通过改善 对溶液的遮蔽而增加D(天冬氨酸)残基的电负性,从而改善稳定性。
C.同源CBH1核酸和多肽
[0125]将来自微生物体的基因组DNA固定在膜上。用基因特异性探针杂交该基因 组DNA,并应用PCR进行筛选。应用本领域公知的技术,将PCR产物分离,并 对PCR产物进行测序。
VI.重组CBH1同源物和变异体的表达
[0126]本发明的方法依赖于应用细胞来表达所需纤维素酶,而不是要求某种特定 的表达方法。
[0127]本发明提供了用含有编码所需纤维素酶的核酸序列的表达载体转导、转化 或者转染的宿主细胞。培养条件,如温度、pH和类似条件,是在转导、转化或者 转染之前用于亲代宿主细胞的那些条件,这对于本领域的技术人员将是显而易见 的。
[0128]在一种方法中,用能在宿主细胞系中发挥作用的表达载体转染丝状真菌细 胞或者酵母细胞,所述的表达载体具有启动子或者生物活性启动子片段或者一个 或多个(例如,一系列)增强子,其有效连接于编码所需纤维素酶的DNA片段, 这样,所需的纤维素酶表达于该细胞系中。
A.核酸构建物/表达载体
[0129]编码所需纤维素酶的天然或者合成的多核苷酸片段(“编码所需纤维素酶的 核酸序列”)可以被并入异源的核酸构建物或者载体,它们能够导入到丝状真菌或 者酵母细胞中并在其中复制。此处公开的载体和方法适于在宿主细胞中应用以便 表达所需纤维素酶。任何载体都可以被应用,只要它能够在导入的细胞中复制和 存活。大量的合适载体和启动子对本领域的技术人员是已知的,并且是商业上可 得到的。在Sambrook et al.,1989,Ausubel FM et al.,1989和Strathern et al.,1981中 也描述了克隆载体和表达载体,其每一个在此特意地并入作为参考。van denHondel, C.A.M.J.J.et al.(1991)In:Bennett,J.W.and Lasure,L.L.(eds.)More Gene Manipulations in Fungi.Academic Press,pp.396-428中描述了用于真菌的合适表达 载体。通过各种方法,可以将合适的DNA序列插入质粒或者载体(此处统称为“载 体”)。一般地,通过标准方法,将DNA序列插入合适的限制性酶切位点。相信这 样的方法和相关的亚克隆方法是在本领域技术人员的知识范围内。
[0130]通过将含有所需纤维素酶的编码序列的异源核酸构建物导入经选择的丝状 真菌株系的细胞中,可以产生包含所需纤维素酶的编码序列的重组丝状真菌。
[0131]一旦所需纤维素酶核酸序列的期望形式被获得,其可以通过各种方法被修 饰。当该序列包括非编码侧翼区域时,侧翼区域可以被切除、突变等等。因此, 转换、颠换、删除和插入可以在天然发生的序列上被进行。
[0132]选出的编码所需纤维素酶的序列可以按照已知的重组技术插入到合适的载 体中,并用于转化能够表达纤维素酶的丝状真菌。由于遗传密码的固有简并性, 编码基本上相同的或者功能上等价的氨基酸序列的其它核酸序列,可以被用来克 隆和表达所需的纤维素酶。因此,应该理解到,编码区域中的这种取代在本发明 覆盖的序列变异体的范围内。
[0133]本发明也包括重组核酸构建物,其包含如上所描述的一个或者多个编码所 需纤维素酶的核酸序列。所述构建物包括载体,例如质粒载体或者病毒载体,本 发明的序列被插入其中,方向为正向或者反向。
[0134]异源核酸构建物可以包括所需纤维素酶的编码序列,该编码序列可以处于 如下的状态:(i)处于分离状态;(ii)与另外的编码序列组合,例如融合蛋白或者 信号肽编码序列,其中所需纤维素酶的编码序列是主要的编码序列;(iii)与非编 码序列组合,例如内含子和调控元件,如启动子和终止子元件或者5’和/或3’非翻 译区,它们对合适宿主中编码序列的表达是有影响的;和/或(iv)在载体或者宿主 环境中,其中所需纤维素酶的编码序列是异源基因。
[0135]在本发明的一个方面,应用异源核酸构建物,在体外将所需纤维素酶的编 码核酸序列转移到细胞中,已确立的丝状真菌和酵母系是优选的。对于所需纤维 素酶的长期生产,稳定的表达是优选的。可以有效地生成稳定的转化子的任何方 法都可以被用于实施本发明。
[0136]合适的载体典型地带有编码选择性标记的核酸序列、插入位点和合适的控 制元件,如启动子和终止序列。载体可以包括调节序列,包括,例如,非编码序 列,如内含子和调控元件,即,启动子和终止元件或者5’和/或3’非翻译区,它们 对宿主细胞中(和/或在修饰的可溶性蛋白抗原编码序列不被正常表达的载体或者 宿主细胞环境中)编码序列的表达是有影响的,并有效连接于编码序列。大量的 合适载体和启动子对于本领域技术人员是已知的,它们中的许多可以从商业渠道 获得和/或描述于Sambrook,et al.,(supra)。
[0137]代表性的启动子包括组成型启动子和诱导型启动子,其例子包括CMV启动 子、SV-40早期启动子、RSV启动子和EF-1α启动子,在tet开启和tet关闭系统 中含有tet应答元件(TRE)的启动子(ClonTech and BASF)、β-肌动蛋白启动子 和金属硫蛋白启动子,其可以通过加入某些金属盐而上调。启动子序列是用于表 达目的而被特定的丝状真菌识别的DNA序列。它可有效连接于编码变异体CBH1 多肽的DNA序列。这样的连接包括在所公开的表达载体中将启动子相对于编码变 异体CBH1多肽的DNA序列的起始密码子进行定位。启动子序列含有转录和翻译 调控序列,其介导变异体CBH1多肽的表达。例子包括来自下列基因的启动子: 黑曲霉、泡盛曲霉或米曲霉葡糖淀粉酶、α-淀粉酶或α-葡糖苷酶编码基因;构巢 曲霉gpdA或trpC基因;粗糙脉孢菌cbh1或trp1基因;黑曲霉或Rhizomucor miehei 天冬氨酸蛋白酶编码基因;红褐肉座菌cbh1、cbh2、egl1、egl2或其他纤维素酶编 码基因。
[0138]合适的选择性标记的选择将取决于宿主细胞,不同宿主细胞的合适的标记 是本领域熟知的。典型的选择性标记基因包括argB,来自构巢曲霉或红褐肉座菌; amdS,来自构巢曲霉;pyr4,来自粗糙脉孢菌或红褐肉座菌;pyrG,来自黑曲霉 或构巢曲霉。其他的示范性选择性标记包括但不限于trpc、trp1、oliC31、niaD或 leu2,它们可以被纳入用于转化突变菌株诸如trp-、pyr-、leu-和类似菌株的异源核 酸构建物中。
[0139]这样的选择性标记赋予转化子利用通常不被丝状真菌代谢的代谢物的能 力。例如,红褐肉座菌的编码乙酰胺酶的amdS基因使得转化细胞可以以乙酰胺作 为氮源来生长。选择性标记(如pyrG)可以恢复营养缺陷型突变菌株在选择性基 本培养基中生长的能力,或者选择性标记(如olic31)可以赋予转化子在抑制性药 物或抗生素存在的条件下生长的能力。
[0140]使用本领域中通常使用的方法,将选择性标记的编码序列克隆到任何合适 的质粒中。示范性的质粒包括pUC18、pBR322、pRAX和pUC100。pRAX质粒包 含来自构巢曲霉的AMA1序列,这使得它能在黑曲霉中进行复制。
[0141]除非另有指明,本发明的实践将应用分子生物学、微生物学、重组DNA和 免疫学的传统技术,它们在本领域技术人员的知识范围内。这样的技术在文献中 有充分的描述。参见,例如,Sambrook et al.,1989;Freshney,1987;Ausubel,et al., 1993和Coligan et al.,1991。此处提及的所有的专利、专利申请、论文和出版物在 此特意地通过引用方式并入。
B.用于产生CBH1的宿主细胞和培养条件
(i)丝状真菌
[0142]因此,本发明提供了丝状真菌,其包括的细胞已经被修饰、选择和培养, 相对于对应的非转化亲代真菌,它们可以有效地生产或表达所需的纤维素酶。
[0143]可以被处理和/或修饰以表达所需的纤维素酶的亲代丝状真菌的种系的例子 包括但不限于,木霉、青霉菌属某种(Penicillium sp.)、腐质霉属某种(Humicola sp.)包括异常腐质霉;曲霉属某种(Aspergillus sp.)包括黑曲霉、金孢菌某种 (Chrysosporium sp.)、镰孢菌某种(Fusarium sp.)、肉座菌某种(Hypocrea sp.) 和裸孢壳属某种(Emericella sp.)。
[0144]将表达所需纤维素酶的细胞在典型地用于培养亲代真菌株系的条件下培 养。通常地,将细胞在含有生理盐和营养物的标准培养基中培养,如Pourquie,J.et al.,Biochemistry and Genetics of Cellulose Degradation,eds.Aubert,J.P.et al., Academic Press,pp.71-86,1988和llmen,M.et al.,Appl.Environ.Microbiol.63: 1298-1306,1997中所描述。培养条件也是标准的,例如,将培养物在28℃,在振 荡培养器或者发酵器中培育,直至获得所需水平的所需纤维素酶。
[0145]对于给定的丝状真菌的优选培养条件可以在科学文献中找到,和/或从真菌 的来源处例如美国典型培养物保藏中心(ATCC;www.atcc.org)找到。真菌的生 长条件被确立后,将细胞暴露于可有效引起或允许所需纤维素酶表达的环境中。
[0146]当所需纤维素酶的编码序列处于诱导型启动子的调控之下时,诱导剂例如 糖、金属盐或者抗生素,被加入到培养基,其浓度足以有效诱导所需纤维素酶的 表达。
[0147]在一种实施方案中,菌株包括黑曲霉,该菌株是获得过量表达的蛋白质的 有用菌株。例如,已经知道,黑曲霉泡盛变种(A.niger var awamori)dgr246分泌 数量提高的分泌型纤维素酶(Goedegebuur et al,Curr.Genet(2002)41:89-98)。黑曲 霉泡盛变种的其他菌株,诸如GCDAP3、GCDAP4和GAP3-4也是已知的,参见 Ward等(Ward,M,Wilson,L.J.and Kodama,K.H.,1993,Appl.Microbiol.Biotechnol. 39:738-743)。
[0148]在另一实施方案中,菌株包括里氏木霉,其是获得过量表达的蛋白质的有 用菌株。例如,已经知道,被Sheir-Neiss,et al.,Appl.Microbiol.Biotechnol.20:46-53 (1984)描述的RL-P37分泌数量提高的纤维素酶。RL-P37的功能等同物包括里氏木 霉菌株RUT-C30(ATCC号:56765)和菌株QM9414(ATCC号:26921)。预期 这些菌株在过量表达变异体CBH1方面,也是有用的。
[0149]当希望在没有潜在不利的天然纤维素水解活性的情况下获得想要的纤维素 酶时,在导入含有编码所需纤维素酶的DNA片段的DNA构建物或质粒之前,获 得一个或多个纤维素酶基因已被剔除的宿主细胞是有用的。此类菌株可以用美国 专利5,246,853和WO 92/06209中公开的方法制备得到,其公开内容通过引用方式 并入本文。通过在缺失一种或多种纤维素酶基因的宿主微生物中表达所需的纤维 素酶,鉴定和随后的纯化程序可以被简化。
[0150]基因的剔除可以这样来完成:应用本领域中已知的方法,将待剔除或破坏 的基因的一种形式插入质粒。然后,将该剔除质粒(deletion plasmid)在位于基因 编码区域内部的合适的(多个)限制性酶切位点处进行切割,并用选择性标记置 换该基因编码序列或者其部分。待剔除或破坏的基因的基因座的侧翼DNA序列— —优选地在大约0.5至2.0kb——位于选择性标记基因的两侧。合适的剔除质粒通 常具有独特的限制性酶切位点,这样的位点的存在使得含有包括侧翼DNA序列在 内的被剔除基因和选择性标记基因可以作为单个线性片段被移走。
[0151]选择性标记的选择必须能够便于检测转化的微生物。任何在选择的微生物 中表达的选择性标记基因是合适的。例如,对于曲霉,选择性标记的选择要保证 该选择性标记在转化子中的存在不会明显影响其性质。这样的选择性标记可以是 编码可测定的产物的基因。例如,一种曲霉基因的功能拷贝可以被使用,如果在 宿主菌株中缺少该基因拷贝,则会导致宿主菌株表现出营养缺陷型表型。
[0152]在一种优选的实施方案中,用功能性pyrG基因转化曲霉的pyrG-衍生株, 这便提供了在转化中有用的选择性标记。pyrG-衍生株可以通过对抵抗氟乳清酸 (FOA)的曲霉菌株进行选择而获得。pyrG基因编码乳清苷-5’-单磷酸脱羧酶,这 是生物合成尿嘧啶核苷所需的一种酶。带有完整的pyrG基因的菌株在缺乏尿嘧啶 核苷的培养基中生长,但是对氟乳清酸敏感。通过对FOA抗性的选择,便有可能 选出缺乏功能性乳清苷单磷酸脱羧酶的pyrG-衍生株,这样的衍生株需要尿嘧啶核 苷才能生长。应用FOA选择技术,也可能获得需要尿嘧啶核苷、缺乏功能性的焦 磷酸核糖乳清酯转移酶(orotate pyrophosphoribosyl transferase)的菌株。用编码此 酶的基因的功能性拷贝转化这些细胞是可能的(Berges & Barreau,Curr.Genet.19: 359-365(1991)和van Hartingsveldte et al.,(1986)Development of a homologous transformation system for Aspergillus niger based on the pyrG gene.Mol.Gen.Genet. 206:71-75)。使用上面提及的FOA抗性技术,容易地进行衍生菌株的选择,因此, pyrG基因优选用作选择性标记物。
[0153]为了转化pyrG-曲霉,以便它不能表达一种或多种纤维素酶基因,包含被破 坏或剔除的纤维素酶基因的单个DNA片段从剔除质粒中分离出来,并用于转化合 适的pyr-曲霉宿主。然后基于它们表达pyrG基因产物和改变宿主菌株尿苷营养缺 陷型的能力,鉴定和选择转化子。然后对所获得的转化子进行DNA印迹分析,以 鉴定和确认双交换整合(double crossover integration)事件的发生,在该事件中pyr4 选择性标记替换了待剔除的基因的基因组拷贝的部分或所有的编码区域。
[0154]尽管上面描述的特定质粒载体是涉及pyr-转化子的制备,但本发明不限于这 些载体。应用上面的技术,可以对曲霉菌株中的各种基因进行剔除和替换。此外, 如上面所讨论,可以使用任何可利用的选择性标记。事实上,应用上面描述的策 略,可以将任何已被克隆和鉴定的曲霉基因从基因组中剔除。
[0155]如上所述,所使用的宿主菌株是曲霉属某种的衍生菌株,其缺少或者具有 与所选的选择性标记相对应的一种或多种非功能基因。例如,如果选择pyrG选择 性标记,那么特定的pyrG-衍生菌株在转化程序中用作接受体。类似地,也可使用 包括曲霉属某种基因的选择性标记,该曲霉属某种基因等同于构巢曲霉基因amdS、 argB、trpC、niaD。相应的接受体菌株因此必须是衍生菌株,诸如分别是argB-、 trpC-、niaD-。
[0156]然后,编码所需纤维素酶的DNA被制备,用于插入到合适的微生物中。根 据本发明,编码所需纤维素酶的DNA包括编码具有功能上的纤维水解活性的蛋白 所必需的DNA。编码所需纤维素酶的DNA片段可以功能性地连接于真菌启动子 序列,例如,glaA基因的启动子。
[0157]也考虑到,编码所需纤维素酶的DNA的多于一个的拷贝可以被再组合到菌 株中以帮助过量表达。编码所需纤维素酶的DNA可以通过携带编码纤维素酶的 DNA的表达载体的构建而制备。携带编码所需纤维素酶的插入DNA片段的表达 载体,可以是能够在特定宿主生物体中自我复制或者能够整合入宿主DNA的任何 载体,典型地为质粒。在优选的实施方案中,用于获得基因的表达的两类表达载 体被考虑。第一类含有DNA序列,其中启动子、基因编码区域和终止子序列均起 源于将要被表达的基因。如果需要的话,可以通过删除不需要的DNA序列(例如, 编码不需要的结构域的DNA序列),留下将要表达的结构域使其处于它自己的转 录和翻译调控序列的控制之下,由此获得截短的基因。选择性标记物也被包含在 载体中,以便整合到宿主中的多个拷贝的新基因序列得以选择。
[0158]第二类表达载体是预先装配的,并且含有高水平转录所需的序列和选择性 标记。已预期到,基因的编码区域或其一部分可以被插入到这种通用的表达载体 中,这样,它便处于表达序列盒启动子和终止子序列的转录调控之下。例如,pRAX 是这样的一种通用表达载体。基因或者其一部分可以被插入到glaA强启动子的下 游。
[0159]在该载体中,编码本发明的所需纤维素酶的DNA序列可以被有效连接于转 录和翻译序列,即,合适的启动子序列和处于结构基因的阅读框架中的信号序列。 启动子可以是在宿主细胞中表现出转录活性的任何DNA序列,可以是来自编码与 宿主细胞同源或者异源的蛋白的基因。可任选的信号肽可用来使所需纤维素酶在 细胞外出现。编码信号肽的DNA优选是,与所要表达的基因有天然联系的DNA, 然而,来自任何合适来源的信号序列均在本发明的预期中。
[0160]用于将编码本发明的所需纤维素酶的DNA序列和启动子融合进入合适载体 的方法,在本领域中是已知的。
[0161]根据已知的技术例如转化、转染、显注射、电穿孔、生物弹道轰击(biolistic bombardment)和类似技术,可以将上面描述的DNA载体或者构建物导入到宿主 细胞中。
[0162]本发明中制备用于转化的曲霉属某种的优选方法,包括由真菌菌丝体制备 原生质体。参见,Campbell et al.Improved transformation efficiency of A.niger using homologous niaD gene for nitrate reductase.Curr.Genet.16:53-56;1989。菌丝体可以 从出芽的营养孢子获得。用消化细胞壁的酶处理菌丝体,得到原生质体。然后, 通过在悬浮培养基中加入渗压稳定剂,原生质体得以被保护。这些稳定剂包括山 梨糖醇、甘露醇、氯化钾、硫酸镁和类似物。通常地,这些稳定剂的浓度在0.8M 到1.2M之间变化。优选地在悬浮培养液中应用大约1.2M的山梨醇溶液。
[0163]宿主曲霉菌株对DNA的摄取依赖于钙离子浓度。通常大约10mM CaCl2至 50mM CaCl2之间的CaCl2被应用于摄取溶液中。在该摄取溶液中,除了对钙离子 的需求之外,其它通常被纳入的物质是缓冲系统如TE缓冲液(10Mm Tris,pH7.4; 1mM EDTA)或者10mM MOPS,pH6.0缓冲液(吗啉代丙烷磺酸)和聚乙二醇 (PEG)。聚乙二醇的作用被认为是融合细胞膜,从而使培养基的成分传送到曲霉 菌的胞浆,并且质粒DNA被传送至核。该融合常常使得多拷贝的质粒DNA温和 地整合入宿主染色体。
[0164]通常地,在转化中使用含有曲霉菌原生质体或者细胞的悬浮液,所述的原 生质体或者细胞已经经历过渗透性处理,密度为105至106/mL,优选2×105/mL。 体积为100μl的含有这些原生质体或者细胞的合适溶液(例如,1.2M山梨醇; 50mM CaCl2)与所需DNA混合。通常地,高浓度的PEG被加入到摄取溶液。0.1 至1倍体积的25%PEG 4000可以被加入到原生质体悬浮液。然而,优选地向原生 质体悬浮液中加入大约0.25个体积。添加剂如二甲基亚砜、肝素、亚精胺、氯化 钾和类似物质,也可以被加入到该摄取溶液,并协助转化。
[0165]通常地,然后在大约0℃温育该混合物,持续10至30分钟。之后,将另外 的PEG加入该混合物,以进一步增强所需基因或DNA序列的摄取。通常地,将 25%PEG4000以等同于转化混合物的体积的5至15倍的体积加入;然而,更大或 者更小的体积可以是适合的。25%PEG4000的体积优选是转化混合物体积的大约 10倍。将PEG加入之后,在加入山梨醇和CaCl2溶液之前,将转化混合物在室温 或者冰上温育。然后,将原生质体悬浮液进一步加入到生长培养基的熔化等份中。 此生长培养基仅允许转化子生长。适于培养所需的转化子的任何生长培养基可以 被用于本发明。然而,如果正在选择的是Pyr+转化子,则优选地使用不含有尿嘧 啶核苷的生长培养基。随后获得的克隆被转移到无尿苷的生长培养基中,并被纯 化。
[0166]在此阶段,可以将稳定的转化子与不稳定的转化子区分开来,前者具有更 快的生长速度,在缺乏尿苷的固体培养基上所形成的环状克隆具有平滑的而非粗 糙的轮廓。此外,在一些情形下,可以对稳定性作进一步的测试,这通过在非选 择性固体培养基(即,含有尿嘧啶核苷)上培养转化子、从该培养基中收获孢子 并测定这些孢子随后在缺乏尿嘧啶核苷的选择性培养基中出芽并生长的百分数来 完成。
[0167]在上述方法的具体实施方案中,在用液体培养基进行培养之后,从宿主细 胞中回收活性形式的所需纤维素酶,它们可以经历适当的翻译后加工。
(ii)酵母
[0168]本发明也预期了将酵母细胞用作用于生产所需纤维素酶的宿主细胞。编码 水解酶的几个其它的基因已经被表达于酿酒酵母的各种菌株中。这些包括编码来 自里氏木霉的两种内切葡聚糖酶(Penttila et al.,1987)、两种纤维二糖水解酶 (Penttila et al.,1988)和一种β-葡糖苷酶(Cummings and Fowler,1996)的序列, 编码来自出芽短梗霉(Aureobasidlium pullulans)的木聚糖酶的序列(Li and Ljungdahl,1996),编码来自小麦的α-淀粉酶的序列(Rothstein et al.,1987),等等。 此外,编码溶纤维丁酸弧菌(Butyrivibrio fibrisolvens)[β]-1,4-内切葡聚糖酶 (END1)、黄孢原毛平革菌(Phanerochaete chrysosporium)纤维二糖水解酶 (CBH1)、生黄瘤胃球菌(Ruminococcus flavefaciens)纤维糊精酶(CEL1)和 Endomyces fibrilizer纤维二糖酶(Bgl1)的纤维素酶基因序列盒在酿酒酵母的实验 室菌株中被成功表达(Van Rensburg et al.,1998)。
C.将编码所需纤维素酶的核酸序列导入宿主细胞
[0169]本发明进一步提供了细胞和细胞组合物,其已经经过遗传修饰而含有外源 提供的编码所需纤维素酶的核酸序列。亲代细胞或细胞系可以利用克隆载体或表 达载体来进行遗传修饰(即,被转导、被转化或者被转染)。载体可以是,例如, 质粒、病毒颗粒、噬菌体等的形式,如上面描述的。
[0170]本发明的转化方法可以导致转化载体的全部或者部分被稳定地整合到丝状 真菌的基因组中。然而,转化也可以导致自我复制的染色体外转化载体的维持, 这也被本发明预期。
[0171]许多标准的转染方法可以被用来产生表达大量异源蛋白的里氏木霉细胞 系。用于将DNA构建物导入木霉的产纤维素酶菌株的一些已公开的方法包括, Lorito,Hayes,DiPietro and Harman,1993,Curr.Genet.24:349-356;Goldman, VanMontagu and Herrera-Estrella,1990,Curr.Genet.17:169-174;Penttila,Nevalainen, Ratto,Salminen and Knowles,1987,Gene 6:155-164,对于曲霉菌,Yelton,Hamer and Timberlake,1984,Proc.Natl.Acad.Sci.USA 81:1470-1474,对于镰刀菌,Bajar, Podila and Kolattukudy,1991,Proc.Natl.Acad.Sci.USA 88:8202-8212,对于链霉 菌,Hopwood et al.,1985,The John Innes Foundation,Norwich,UK,以及对于芽孢 杆菌,Brigidi,DeRossi,Bertarini,Riccardi and Matteuzzi,1990,FEMS Microbiol.Lett. 55:135-138。
[0172]用于将外源核苷酸序列导入宿主细胞的任何已知的方法都可以被应用。这 些方法包括应用磷酸钙转染、凝聚胺法(polybrene)、原生质体融合、电穿孔、生 物弹射、脂质体、微注射、等离子体载体、病毒载体和用于将克隆的基因组DNA、 cDNA、合成的DNA或其它外源遗传物质导入宿主细胞的任何其它已知的方法(参 见,例如,Sambrook et al.,supra)。也可以应用美国专利6,255,115中描述的农杆菌 介导的转染方法。这里的要求仅是所使用的具体遗传工程方法能够成功地将至少1 个基因导入能够表达该异源基因的宿主细胞。
[0173]此外,含有编码所需纤维素酶的核酸序列的异源核酸构建物可以在体外被 转录,得到的RNA通过已知的方法被导入宿主细胞,例如,通过注射。
[0174]本发明进一步包括新的和有用的丝状真菌转化子,例如红褐肉座菌和黑曲 霉转化子,它们可用于生产真菌纤维素酶组合物。本发明包括丝状真菌的转化子, 特别是包含编码所需纤维素酶的序列或者剔除了内源性cbh编码序列的真菌。
VII.对CBH1核酸编码序列和/或蛋白表达的分析
[0175]在用编码所需纤维素酶的核酸构建物转化细胞系之后,为了评价该细胞系 对所需纤维素酶的表达,可以在蛋白水平、RNA水平进行分析,或者应用特异于 纤维二糖水解酶活性和/或表达的功能性生物分析进行分析。
[0176]在本文描述的所需纤维素酶核酸和蛋白序列的一个代表性应用中,丝状真 菌例如里氏木霉的遗传修饰菌株,被加以改造以产生增加量的所需纤维素酶。这 样的遗传修饰的丝状真菌对产生纤维水解能力大大增强的纤维素酶产物是有用 的。在一种方法中,这是通过将所需纤维素酶的编码序列导入合适的宿主来完成 的,合适的宿主例如丝状真菌,如黑曲霉。
[0177]因此,本发明包括用于在丝状真菌或者其它合适的宿主中表达所需纤维素 酶的方法,这可以通过将含有编码所需纤维素酶的DNA序列的表达载体导入丝状 真菌或者其它合适的宿主的细胞中来实现。
[0178]在另一个方面,本发明包括用于修饰所需纤维素酶在丝状真菌或者其它合 适的宿主中的表达的方法。这样的修饰包括,降低或者消除内源性CBH的表达。
[0179]一般地,用来分析所需纤维素酶的表达的分析包括,RNA印迹(Northern blotting)、斑点印迹(DNA或者RNA分析)、RT-PCR(反转录酶聚合酶链式反应) 或者原位杂交,应用被恰当标记的探针(基于核酸编码序列)和传统的DNA印迹 (Southern blotting)和放射自显影。
[0180]此外,可以在样品中直接测定所需纤维素酶的产生和/或表达,例如,分析 纤维二糖水解酶活性、表达和/或产生。例如,在Becker et al.,Biochem J.(2001)356: 19-30和Mitsuishi et al.,FEBS(1990)275:135-138中描述了这样的分析,每一篇文 献均在此清楚地引入作为参考。CBH1水解分离的可溶和不溶底物的能力可以应用 Srisodsuk et al.,J.Biotech.(1997)57:49-57和Nidetzky and Claeyssens Biotech. Bioeng.(1994)44:961-966中描述的分析方法来测定。用于分析纤维二糖水解酶活 性、内切葡聚糖酶活性或者β-葡糖苷酶活性的有用底物包括晶体状纤维素、纤维 纸、磷酸溶胀纤维素(phosphoric acid swollen cellulose)、纤维寡糖、甲基伞形酯 乳糖苷(methylumbelliferyl lactoside)、甲基伞形酯纤维二糖苷(cellobioside methylumbelliferyl)、邻硝基苯基乳糖苷(orthonitrophenyl lactoside)、对硝基苯基 乳糖苷(paranitrophenyl lactoside)、邻硝基苯基纤维二糖苷(orthonitrophenyl cellobioside)、对硝基苯基纤维二糖苷(paranitrophenyl cellobioside)。
[0181]此外,蛋白表达,可以通过免疫学方法来加以评价,例如细胞、组织切片 的免疫组织化学染色或者组织培养基的免疫测定分析,如,蛋白质印迹(Western blot)或者ELISA。这样的免疫分析可以被用于定性和定量地评价所需纤维素酶的 表达。这些方法的细节对本领域技术人员是已知的,用于实践这些方法的许多试 剂是商业渠道可获得的。
[0182]所需纤维素酶的纯化形式可以被用于产生特异于该被表达的蛋白的单克隆 或者多克隆抗体,它们可以用于各种免疫分析。(参见,例如,Hu et al.,1991)。代 表性的分析包括ELISA、竞争性免疫测定、放射免疫测定、蛋白质印迹、间接免 疫荧光测定和类似的方法。总之,通过商业渠道获得的抗体和/或试剂盒可以被用 于纤维二糖水解酶蛋白的表达水平的定量免疫测定。
VIII.重组CBH1蛋白的分离和纯化
[0183]一般地,在细胞培养物产生的所需纤维素酶蛋白被分泌入培养基,并且可 以被纯化或分离,例如,将细胞培养基中不需要的成分除去。然而,在一些情形 下,所需纤维素酶蛋白可以以细胞内的形式产生,这就使得必须从细胞裂解液中 进行回收。在这样的情形下,应用本领域技术人员常规应用的技术,将所需纤维 素酶蛋白从产生它的细胞中纯化出来。例子包括但不限于,亲和层析(Tilbeurgh et al.,1984)、离子交换层析方法(Goyal et al.,1991;Fliess et al.,1983;Bhikhabhai et al., 1984;Ellouz et al,1987),包括应用了具有高分辨能力的材料的离子交换层析 (Medve et al.,1998)、疏水作用层析(Tomaz and Queiroz,1999)和两相分配 (two-phase partitioning)(Brumbauer,et al.,1999)。
[0184]典型地,所需纤维素酶蛋白被分级,以分离出具有选择的性质的蛋白,所 述的性质例如对特定的结合试剂如抗体或受体的结合亲和性;或者具有选择的分 子量范围或等电点范围。
[0185]一旦实现了特定的所需纤维素酶蛋白的表达,由此产生的所需纤维素酶蛋 白从细胞或者细胞培养物中纯化出来。适于这样的纯化的代表性方法包括:抗体- 亲和柱层析、离子交换层析;乙醇沉淀;反相HPLC;在硅上或在阳离子交换树脂 如DEAE上进行的层析;层析聚焦;SDS-PAGE;硫酸氨沉淀;以及应用例如 Sephadex G-75的凝胶过滤。可以应用各种蛋白纯化方法,这些方法在本领域中是 已知的,在例如Deutscher,1990;Scopes,1982中有描述。所选择的纯化步骤将取决 于,例如,所使用的生产工艺的性质和所产生的具体蛋白。
IX.cbh1和CBH1的效用
[0186]应该了解,所需纤维素酶核酸、所需纤维素酶蛋白和含有所需纤维素酶蛋 白活性的组合物,在广泛的各种用途中具有应用价值,下面描述了其中的一些。
[0187]含有变化数量的所需纤维素酶的新的和改进的纤维素酶组合物在洗涤剂组 合物中是有用的,其表现出增强的清洗能力、充当柔软剂和/或改善棉织物的手感 (例如,“石磨洗”或者“生物抛光”),它们还可以用在将木浆降解为糖的组合物 中(例如,用于生物乙醇生产),和/或用在饲料组合物中。对每种类型的纤维素酶 的分离和表征使得能够控制这样的组合物的各个方面。
[0188]具有降低的热稳定性的所需纤维素酶在某些情况中是有用的,例如,需要 该酶的活性在较低温度时便被中和,以便可能存在的其它酶不受影响。此外,酶 可以在纤维质的限制性转变中起作用,例如,可以用于控制结晶程度和纤维素链 长度。在达到所需的转变程度之后,糖化过程的温度可以升至该去稳定化的CBH1 的存活温度以上。由于CBH1活性对于晶体状纤维素的水解是必需的,所以晶体 状纤维素的转变在升高的温度下会停止。
[0189]在一种方法中,本发明的纤维素酶用于洗涤剂组合物或者织物的处理,以 改善手感和外观。
[0190]由于纤维素产品的水解速率可以通过使用具有至少一个额外拷贝的所需纤 维素酶基因的转化子来实现——所述的额外拷贝是作为可复制的质粒而存在或者 被插入到基因组中,所以含有纤维素或者杂多糖的产品可以以更快的速度和更大 的程度被降解。在垃圾中由纤维素制成的产品如纸、棉布、纤维质尿布和类似物 可以被更有效的降解。因此,从多个转化子或者单独的转化子获得的发酵产物可 以被用于组合物中,以通过液化的方法来帮助降解在过度拥挤的填埋垃圾中的各 种纤维素产品。
[0191]分开进行的糖化和发酵过程可以用来将存在于生物材料例如玉米杆中的纤 维素转变为葡萄糖,随后酵母菌株将葡萄糖转变为乙醇。同时进行的糖化和发酵 过程可以将存在于生物材料例如玉米杆中的纤维素转变为葡萄糖,同时在同一反 应器中,酵母菌株将葡萄糖转变为乙醇。因此,在另一种方法中,本发明的所需 纤维素酶可以在将生物材料降解为乙醇的过程中起作用。利用可容易地获得的纤 维素来源进行乙醇生产,提供了稳定的、可更新的燃料资源。
[0192]基于纤维素的供给料由农业废物、草和木材和其它低价值的生物材料如城 市废物(例如,回收纸、院落修剪物等等)组成。乙醇可以通过对任何这些纤维 素质供给料进行发酵而产生。然而,在转变为乙醇之前,纤维素必须首先转变为 糖。
[0193]各种不同的供给料可以与本发明的一种或者多种所需纤维素酶联合应用, 具体选择哪一种可能取决于实施转变过程的地区。例如,在美国中西部,农业废 物如麦杆、玉米茎和甘蔗渣是主要的,而在加利福尼亚,稻杆是主要的。然而, 应该理解,任何可获得的纤维素质生物材料可以被用于任何地区。
[0194]含有增加数量的纤维二糖水解酶的纤维素酶组合物,在乙醇生产中有用。 由该方法获得的乙醇可以进一步用作辛烷助剂或者直接作为替代汽油的燃料,它 的好处在于,乙醇作为燃料来源,比石油衍生产品更加环保。已知知道,乙醇的 应用会改善空气质量,并且可能降低局部臭氧水平和烟雾。而且,乙醇替代汽油 的应用在缓冲由不可再生能源和石油化学品供应的突然变化造成的影响方面,具 有战略上的重要性。
[0195]利用纤维素质生物材料例如树、草本植物、城市固体废物和农业残留物及 林业残留物的糖化和发酵过程可以产生乙醇。然而,由微生物产生的天然发生的 纤维素酶混合物中各纤维素酶的比例对于生物材料中的纤维素至葡萄糖的快速转 变,可能不是最有效的。已知,内切葡聚糖酶的作用是,生成新的纤维素链末端, 而这样的末端本身又是纤维二糖水解酶的作用底物,由此可以改善整个纤维素酶 系统的水解效率。因此,应用增加的和优化的纤维二糖水解酶活性,可以大大提 高乙醇的产量。
[0196]因此,本发明的一种或者多种纤维二糖水解酶可以用于将纤维素水解为其 糖组分。在一种实施方案中,在加入发酵生物之前,将所需纤维素酶加入到生物 材料(biomass)中。在另一种实施方案中,所需纤维素酶与发酵生物体同时被加 到生物材料中。可任选地,在每种实施方案中,可以存在其它的纤维素酶成分。
[0197]在另一种实施方案中,纤维素质的供给料可以被预处理。预处理可以是通 过升高温度和加入稀酸、浓酸或者稀碱溶液中的任意一种。加入预处理溶液处理 一段时间,这足以至少部分地水解半纤维素成分,然后再进行中和。
[0198]除了纤维素酶组合物(不论纤维二糖水解酶的含量为多少,即,没有纤维 二糖水解酶、基本上没有纤维二糖水解酶,或者具有增加的纤维二糖水解酶),本 发明的洗涤剂组合物还可以使用表面活性剂包括阴离子、非离子和两性表面活性 剂、水解酶、增洁剂、漂白剂、蓝色漂白剂和荧光染料、抗结块剂、增溶剂、阳 离子表面活性剂和类似物。所以这些成分在洗涤剂领域中是已知的。上面描述的 纤维素酶组合物可以被加入洗涤剂组合物,以液体稀释液、颗粒、乳剂、凝胶、 浆糊或者类似的任意形式。这些形式对本领域技术人员是已知的。当使用的是固 体洗涤剂组合物时,纤维素酶组合物优选地被配制为颗粒。优选地,配制的颗粒 可以含有纤维素酶保护剂。对于更全面的讨论,参见美国专利6,162,782,标题是 “Detergent compositions containing cellulase compositions deficient in CBH1 type components”,在此并入作为参考。
[0199]优选地,被使用的纤维素酶组合物相对于整个洗涤剂组合物的重量百分数 为大约0.00005至大约5。更优选地,被使用的纤维素酶组合物相对于整个洗涤剂 组合物的重量百分数为大约0.0002至大约2。
[0200]另外,所需纤维素酶核酸序列可以用于鉴定和表征相关的核酸序列。可以 用于确定(预测或证实)相关基因或基因产物的功能的众多技术包括但不限于,(A) DNA/RNA分析,如(1)过量表达、异常表达和在其它物种中的表达;(2)基因敲 除(反向遗传学、靶向敲除(targeted knock-out)、病毒诱导的基因沉默(VIGS, 参见Baulcombe,1999);(3)基因甲基化状况的分析,特别是侧翼调控区域;和(4) 原位杂交;(B)基因产物分析,诸如(1)重组蛋白表达;(2)抗血清产生;(3)免疫 定位;(4)催化活性或其他活性的生物化学测定;(5)磷酸化作用状况;和(6)通 过酵母双杂交分析与其他蛋白质的相互作用;(C)通路分析,诸如基于基因过量表 达的表型或与相关基因的序列同源性,将基因或基因产物置于特定的生物化学或 信号通路中;和(D)其他分析,也可以被实施以便确定或证实分离出的基因和它的 产物参与特定的代谢或信号通路的情况,并帮助确定基因功能。
实施例
[0201]下面的实施例进一步详细描述了本发明,这些实施例的意图并不在于以任 何方式限制本发明的范围。附图被认为是本发明的说明书和描述的一个部分。所 有引用的参考文献在此特意地并入作为参考,用于在此描述的所有内容。
实施例1
CBH1同源物的鉴定
[0202]本实施例阐释了发现于各种真菌中的新的CBH1同源物。几种不同微生物 的基因组DNA被制备,用于进行PCR反应,以确定特定生物体的DNA是否编码 同源CBH1纤维素酶。
基因组DNA的分离
[0203]基因组DNA可以应用本领域中已知的任何方法来分离。在本组试验中,我 们从协作的Technical University ofVienna(TUV)收到了来自于不同的肉座菌和木 霉菌种,施韦尼兹肉座菌(CBS 243.63)、东方肉座菌(PPRI 3894)、假康宁木霉 (CBS 408.91)和康长木霉(分离物isolate 1)的48份基因组DNA溶液。然而, 下列的方案可以被应用:
[0204]细胞在30℃,20ml马铃薯葡萄糖肉汤(Potato Dextrose Broth,PDB)中生 长24小时。按1∶20的比例用新鲜的PDB培养基将细胞稀释,过夜生长。将2 毫升细胞离心,用1ml KC(60g KCl、2g柠檬酸每升,用1M KOH调pH至6.2) 清洗沉淀。用900μl KC重悬浮细胞沉淀。加入100μl(20mg/ml)Novozyme, 轻轻混合,于37℃在显微镜下操作原生质体形成(protoplastation),直到超过95% 的原生质体被形成,最长的时间为2小时。以1500rpm(460g)的速度离心细胞 10分钟。加入200μl TES/SDS(10mM Tris,50mM EDTA,150mM NaCl,1%SDS), 混合并室温温育5分钟。应用Qiagen小量制备分离试剂盒(Qiagen)分离DNA。 用100μl milli-Q水洗脱柱子,并收集DNA。
[0205]可以期望应用其它的方法,其中可以使用FastPrep。该系统由用于分离核 酸的FastPrep仪器和FastPrep试剂盒组成。可以从Qbiogene获得FastPrep。
引物的构建
[0206]利用标准的PCR仪例如来自MJ Research Inc.的PCT-200 Peltier Thermal Cycler,进行PCR反应,条件如下:
1)96℃ 1分钟,1个循环
2)94℃ 30秒
45℃ 90秒(每个循环+1℃)
72℃ 2分钟
3)重复第二步10个循环
4)94℃ 30秒
55℃ 90秒
72℃ 2分钟
5)重复第四步20个循环
6)72℃ 7分钟,1个循环,和
7)降低温度至15℃,用于保存和进行进一步分析。
[0207]构建下面的DNA引物,其用于从由各种微生物分离出的基因组DNA中扩 增出同源CBH1基因。此处针对蛋白和DNA使用的所有符号与IUPAC IUB生物 化学命名委员会代码(Biochemical Nomenclature Commission codes)相符。
[0208]同源的5’(FRG192)引物和3’(FRG193)引物是基于里氏木霉的CBH1 的序列开发出来的。两个引物在其5’端均含有来自Invitrogen的入门(Gateway) 克隆序列。引物FRG192含有attB1序列,引物FRG193含有attB2序列。
FRG192序列,未显示aatB1:
ATGTATCGGAAGTTGGCCG(CBH1红褐肉座菌的信号序列)
FRG193序列,未显示aatB2:
TTACAGGCACTGAGAGTAG(CBH1红褐肉座菌的纤维素结合模块)
[0209]PCR条件如下:10μL 10×反应缓冲液(10×反应缓冲液包括100mM Tris HCl, pH8-8.5;250mM KCl;50mM(NH4)2SO4;20mM MgSO4);dATP、dTTP、dGTP、 dCTP的每一种0.2mM(终浓度),100ng/μL基因组DNA 1μL,1单位/uL的PWO 聚合酶(Boehringer Mannheim,Cat#1644-947)0.5μL,各引物FRG192和FRG193 0.2μM(终浓度),4μL DMSO,加水至100μL。
[0210]按照这些条件最终从下列的不同种获得4个基因:
1.施韦尼兹肉座菌(CBS 243.63)
2.东方肉座菌(PPRI 3894)
3.假康宁木霉(CBS 408.91)
4.康长木霉
Cel7A基因序列的分离
[0211]通过应用N末端引物(FRG192)和C末端引物(FRG193)直接获得了全 长序列。应用Vector NTI软件,该全长DNA序列按照3个开放阅读框架被翻译。 与红褐肉座菌Cel7A进行DNA和蛋白序列比较,以鉴定出假定的内含子序列。不 带有内含子序列的基因组DNA序列的翻译,揭示了同源性CBH1的蛋白序列。全 长基因已经获得,并显示在图3、5、7和9中。
实施例2
Cbh1同源物的表达和热稳定性
[0212]将实施例1的全长基因转移至黑曲霉入门相容性目标载体(Gateway compatible destination vector),该载体由Genencor开发。根据GatewayTM Cloning Technology:version 1 page 34-38给出的指南,应用如图11所示的pRAX1作为骨 架,构建出该载体。
[0213]图12显示了新开发的表达载体;这是将新基因转移到目标载体pRAXdes2 中得到的产物。结果得到了被称为pRAXdesCBH1(用种系名来特异化)的最终表 达载体。
[0214]根据Cao等人描述的方法,将构建物转化到黑曲霉泡盛变种(Cao Q-N, Stubbs M,Ngo KQP,Ward M,Cunningham A,Pai EF,Tu G-C and Hofmann T(2000) Penicillopepsin-JT2 a recombinant enzyme from Penicillium janthinellum and contribution of a hydrogen bond in subsite S3 to kcat Protein Science 9:991-1001)。
[0215]将转化子在基本培养基平板上划线(Ballance DJ,Buxton FP,and Turner G (1983)Transformation of Aspergillus nidulans by the orotidine-5′-phosphate decarboxylase gene of Neurospora crassa Biochem Biophys Res Commun 112:284-289),在30℃生长4天。使用本领域已知的方法,收集孢子(参见 www.fgsc.net/fgn48/Kaminskyj.htm)。在水中收获构巢曲霉分生孢子(用无菌弯曲 玻璃棒刮擦产分生孢子的培养物的表面,以刮下孢子),这些分生孢子可以在4℃ 保藏数周至数月而没有活力的严重丧失。然而,新鲜获得的孢子以更强的繁殖能 力发芽。对于长期的保藏,孢子可以保藏在-20℃,50%的甘油中,或-80℃,15-20% 的甘油中。当为80%的水溶液时,甘油可以更容易用吸管吸取。将800μl的分生孢 子含水悬液(制备后可4℃保存)加入到200μl 80%甘油中,用于-80℃保藏;将 400μl悬浮液加入到600μl 80%甘油中,用于-20℃保藏。冷冻之前,进行涡旋混合。 为了收集突变体,小部分的产分生孢子培养物可以被移离,置于20%甘油中,涡 旋混合,-80℃冷冻保存。在我们的实施中,我们将它们保藏在-80℃,50%甘油中。
[0216]将黑曲霉泡盛变种转化子培养在无尿苷的基本培养基上(Ballance et al. 1983)。通过将来自产孢子生长琼脂平板(sporulated grown agar plate)的1cm2的 孢子悬浮物接种到100ml摇瓶中,在37℃培育3天,筛选出具有纤维素酶活性的 转化子,如Cao et al.(2000)中所述。
[0217]CBH1活性测定是基于非荧光4-甲基伞形酯-β-乳糖苷被水解成乳糖和7- 羟基-4-甲基香豆素产物,后一产物导致产生荧光信号。移取170μl 50mM NaAc缓 冲液,pH4.5,加入到适于进行荧光分析的96孔微量滴定板(MTP)(Greiner, Fluotrac 200,art.nr.655076)中。加入10μl的上清液,然后加入10μl的MUL(溶 于milli Q水中的1mM的4-甲基伞形酯-β-乳糖苷(MUL)),将该MTP放到Fluostar Galaxy(BMG Labtechnologies;D-77656 Offenburg)中。在50℃,使用λ320nm(激 发光)和λ460nm(发射光),测量动力学数据,该测量进行16分钟(8个循环,每 循环120秒)。然后对具有CBH活性的上清液进行疏水作用层析,如下面实施例5 中所述。
[0218]按实施例1中所述,推导出氨基酸序列。CBH1同源物的氨基酸序列显示在 图4(东方肉座菌)、图6(施韦尼兹肉座菌)、图8(康长木霉)和图10(假康宁 木霉)。
[0219]测定上述同源物的热稳定性,如下面的实施例5所述。 CBH1同源物 %同一性 Tm △Tm 红褐肉座菌 62.5 施韦尼兹肉座菌(CBS 243.63) 96.5 61.4 -1.1 东方肉座菌(PPRI 3894) 97.1 62.8 0.3 假康宁木霉(CBS 408.91) 94.9 57.5 -5.0 康长木霉 93.0 59.4 -3.1
表1:Tm测定和不同的CBH1同源序列之间的比较
[0220]可以看出,与野生型相比,CBH1纤维素酶同源物对CBH1纤维素酶变体的 热稳定性具有轻微影响或者负影响。同源物与红褐肉座菌CBH1密切相关;红褐 肉座菌和同源物之间的热稳定性差异可以提示,带有不同于红褐肉座菌CBH1中 发现的氨基酸残基的残基的位点,可能涉及热稳定性。
实施例3
对稳定性具有重要意义的位点的鉴定
[0221]利用Clustal W算法,应用Vecter NTI软件将在上面的实施例2中表征的 CBH1同源物的氨基酸序列与红褐肉座菌序列进行联配比较(Nucleic Acid Research, 22(22):4673-4680,1994)。图2显示了该联配。
[0222]基于同源物与CBH1的序列联配,用三种不同的方法确定了涉及CBH1酶 的稳定性的可能位点。在第一种方法中,红褐肉座菌CBH1催化结构域和具有更 低稳定性的至少一个同源物(即,仅排除东方肉座菌)的催化结构域之间不同的 位点,被鉴定为涉及CBH1的热稳定性的可能位点。被鉴定出的位点是红褐肉座 菌CBH1的L6、P13、T24、Q27、S47、T59、T66、G88、N89、T160、Q186、S195、 T232、E236、E239、G242、D249、N250、T281、E295、F311、E325、N327、D329、 T332、A336、K354、V407、P412、T417和/或F418。
[0223]在第二种方法中,红褐肉座菌或东方肉座菌中的残基与在所有稳定性降低 的同源酶中发现的残基相同的位点,揭示了与Tm缺乏联系的位点。如此被鉴定为 与稳定性有关联的位点是红褐肉座菌CBH1的L6、T24、Q27、S47、T59、T66、 T160、Q186、S195、T232、E236、G242、D249、T281、E295、E325、N327、D329、 T332、K354和/或P412。
[0224]在最后的方法中,在红褐肉座菌和东方肉座菌中是相同的、在施韦尼兹肉 座菌中的对应残基相同或者不同于这两者中的任何一个,而在康长木霉或者假康 宁木霉的对应位点具有不同氨基酸的位点,被认为是涉及酶的热稳定性的可能位 点。经验性地显示为与Tm稳定性最相关的这些位点,被鉴定为Q186、S195、E325、 T332和P412。
[0225]鉴定出带有不同于在红褐肉座菌CBH1中发现的氨基酸残基的残基的位点, 对它们进行位点饱和诱变(site saturated mutagenesis)。
实施例4
CBH1变体的表达
[0226]应用实施例1中描述的引物和方案,获得PCR片段。应用Qiagen胶纯化试 剂盒在琼脂糖凝胶上纯化所述片段。按照Invitrogen的入门克隆技术指导手册 (GatewayTM Technology instruction manual)(版本C),利用Invitrogen的 pDONRTM201载体,对纯化的片段进行clonase反应,上述参考文献在此并入作为 参考。然后,将基因从该ENTRY载体转移至目标载体(pRAXdes2),获得表达载 体pRAXCBH1。
[0227]用含有编码所需纤维素酶的核酸的表达载体转化细胞。然后,让宿主细胞 黑曲霉在允许所需纤维素酶被表达的条件下生长,如实施例2所描述。
[0228]按实施例3所描述,不同于红褐肉座菌CBH1的位点,可以参与变体的热 稳定性,从而对其进行位点饱和诱变。
实施例5
CBH1变体的热稳定性
[0229]CBH1纤维素酶变体按如上所述地被克隆和表达(参见实施例4)。然后, 通过柱层析,将Cel7A野生型和变体从这些培养物的无细胞上清中纯化出来。使 用疏水作用层析(HIC)纯化蛋白。柱子安装于BioCAD Sprint Perfusion Chromatography System上,其中应用Poros 20 HP2树脂,两者均由Applied Biosystems制造。
[0230]HIC柱用5个柱体积的pH6.8的0.020M磷酸钠、0.5M硫酸胺来平衡。将 硫酸胺加入上清液,至终浓度为大约0.5M,并将pH调节为6.8。过滤后,将上清 液上样到柱上。上样后,用10个柱体积的平衡缓冲液清洗柱子,然后,用10个 柱体积的pH6.8的0.02M磷酸钠进行洗脱,所用的洗脱液具有0.5M至0M的硫 酸铵梯度。Cel7A在大约中间梯度被洗脱下来。基于还原性SDS-PAGE凝胶分析, 收集级分并将它们汇合在一起。
[0231]按照Luo,et al.,Biochemistry 34:10669和Gloss,et al.,Biochemistry 36:5612 的方法,测定熔点。
[0232]利用Aviv 215圆二色谱分光光度计收集数据。在25℃,变异体在210至260 纳米之间的光谱被获取。缓冲条件是50mM Bis Tris丙烷/50mM醋酸铵/冰醋酸, pH5.5。蛋白浓度保持在0.25至0.5mgs/mL之间。在确定了监测去折叠的最佳波 长之后,通过在相同的缓冲条件下,将温度从25℃升至75℃,使样品热变性。每 2度,收集一次数据,时间为5秒。在0.1厘米路径长度的样品池中,用230纳米 波长来监测部分可逆的去折叠。
[0233]与野生型相比,导入到CBH1纤维素酶变体中的突变,对该CBH1纤维素 酶变体的热稳定性具有正效应。
[0234]应该理解,此处描述的实施例和实施方案仅是为了阐述的目的,本领域技 术人员可以对其进行各种修改和变化,而这些修改和变化包含在本申请的精神和 范围之内,并包含在权利要求的范围内。此处引用的所有出版物、专利和专利申 请以其整体在此并入作为参考,用于各个论题。