书签 分享 收藏 举报 版权申诉 / 133

改进微生物中产物生产的方法和组合物.pdf

  • 上传人:xia****o6
  • 文档编号:8982264
  • 上传时间:2021-01-25
  • 格式:PDF
  • 页数:133
  • 大小:3.02MB
  • 摘要
    申请专利号:

    CN200980138193.4

    申请日:

    20090728

    公开号:

    CN102224249A

    公开日:

    20111019

    当前法律状态:

    有效性:

    失效

    法律详情:

    IPC分类号:

    C12P7/06,C12N1/21,C12N15/52,C12R1/145

    主分类号:

    C12P7/06,C12N1/21,C12N15/52,C12R1/145

    申请人:

    马萨诸塞大学,特瑞斯有限公司

    发明人:

    杰弗里·布兰查德,苏珊·莱申,埃尔莎·珀蒂,约翰·费伯尔,马蒂亚斯·施马利士

    地址:

    美国马萨诸塞州

    优先权:

    61/084,233,61/225,184,61/228,922

    专利代理机构:

    北京邦信阳专利商标代理有限公司

    代理人:

    金玺

    PDF完整版下载: PDF下载
    内容摘要

    本发明提供在微生物中改进产物生产的方法和组合物,所述产物如燃料产物如乙醇。更具体地,本文描述了用于利用在Clostridium phytofermentans中鉴定的基因改进乙醇生产的方法和组合物。

    权利要求书

    1.一种用于生物燃料生产的产物,包括:木质纤维生物质、能够直接水解和发酵所述生物质的微生物,其中所述微生物被改良以提高一种或多种纤维素酶的活性。 2.根据权利要求1所述的产物,其特征在于,所述微生物能够直接发酵五碳糖和六碳糖。 3.根据权利要求2所述的产物,其特征在于,所述微生物是细菌。 4.根据权利要求1所述的产物,其特征在于,所述微生物是梭菌属的种。 5.根据权利要求1所述的产物,其特征在于,所述微生物是Clostridium phytofermentans。 6.根据权利要求1所述的产物,其特征在于,所述微生物是非重组体或重组体。 7.根据权利要求2所述的产物,其特征在于,所述微生物包含一种或多种能够提高所述一种或多种纤维素酶活性的异源多核苷酸。 8.一种用于生物燃料生产的产物,包括:含碳的生物质、能够直接水解和发酵所述生物质的微生物,其中所述微生物被改良以提高一种或多种纤维素酶的活性。 9.根据权利要求8所述的产物,其特征在于,所述微生物能够生产发酵终产物,其实质部分是乙醇。 10.根据权利要求8所述的产物,其特征在于,所述微生物能够生产包括乳酸、乙酸和蚁酸的发酵终产物。 11.根据权利要求8所述的产物,其特征在于,所述微生物能够吸收一种或多种复杂碳水化合物。 12.根据权利要求8所述的产物,其特征在于,所述生物质包含比单体碳水化合物更高浓度的寡聚碳水化合物。 13.根据权利要求8所述的产物,其特征在于,所述一种或多种纤维素酶选自由Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163组成的组。 14.根据权利要求8所述的产物,其特征在于,所述一种或多种纤维素酶是Cphy3367。 15.用于生产生物燃料的方法,所述方法包括:(a)用能够直接水解和发酵含碳的生物质的微生物接触含碳的生物质,其中所述微生物被改良以提高一种或多种纤维素酶的活性;以及(b)对所述水解和发酵给予足够时间以生产生物燃料。 16.根据权利要求15所述的方法,其特征在于,所述一种或多种纤维素酶选自由Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163组成的组。 17.根据权利要求15所述的方法,其特征在于,所述微生物能够吸收一种或多种复杂碳水化合物。 18.根据权利要求15所述的方法,其特征在于,所述生物质包含比单体碳水化合物更高浓度的寡聚碳水化合物。 19.根据权利要求18所述的方法,其特征在于,所述水解产生比单体碳水化合物更高浓度的纤维二糖和/或更大的寡聚体。 20.根据权利要求15所述的方法,其特征在于,所述一种或多种纤维素酶是Cphy3367。 21.根据SEQ ID NO:1的分离核苷酸。

    说明书

    

    优先权的要求

    本申请要求2008年7月28日提交的美国临时专利申请号61/084,233、2009年7月13日提交的美国临时专利申请号61/225,184和2009年7月27日提交的美国临时专利申请号61/228,922的优先权,以上申请的全部内容通过引用的方式结合至本文。

    技术领域

    本发明涉及微生物学、分子生物学和生物技术领域。更具体地,本发明涉及改进微生物中产物如乙醇和氢的生产的方法和组合物。

    背景技术

    开发从可再生和可持续生物质资源生产可用能源的方法和组合物是有利的。碳水化合物形式的能源可以在废弃生物质和专用能源作物例如,谷物如玉米或小麦,或草如柳枝稷中找到。

    目前的挑战是开发将碳水化合物转化成可用能源形式的可行的和经济的策略。从碳水化合物得到有用能源的策略包括生产乙醇和其它醇,将碳水化合物转化成氢,和通过燃料电池将碳水化合物直接转化成电能。得到乙醇形式生物质的策略的例子由DiPardo,Journal of Outlook for Biomass Ethanol Production and Demand(EIA Forecasts),2002;Sheehan,Biotechnology Progress,15:8179,1999;Martin,Enzyme Microbes Technology,31:274,2002;Greer,BioCycle,61-65,April 2005;Lynd,Microbiology and Molecular Biology Reviews,66:3,506-577,2002;和Lynd等在″Consolidated Bioprocessing of Cellulosic Biomass:An Update,″Current Opinion in Biotechnology,16:577-583,2005中描述。

    发明内容

    本申请特别基于Clostridium phytofermentans基因的鉴定,所述基因编码预测涉及在产物产量有用的培养基上生长的产物,所述产物如燃料,例如乙醇和氢。本文中所鉴定的基因可以在其它微生物中异源表达以提供新的或增强的功能。同样,这些基因可以在C.phytofermentans中,例如由外源引进的核酸表达,以提供增强的功能。

    一些实施方式包括含有编码至少一种在C.phytofermentans中鉴定的水解酶的分离核酸的多核苷酸。在这样的实施方式中,所述分离核酸可以从表6中选择。在具体的实施方式中,所述水解酶选自Cphy3367、Cphy3368、Cphy0430、Cphy3854、Cphy0857、Cphy0694和Cphy1929组成的组。名称Cphy3367代表JGI号码,其指的是Genbank记载的C.phytofermentans的美国国家生物技术信息中心(NCBI)基因座标签。在更多实施方式中,所述多核甘酸可以包含可操作地连接至编码所述水解酶的分离核酸的调控序列。

    一些实施方式包括含有编码至少一种在C.phytofermentans中鉴定的ATP结合盒(ABC)转运子的分离核酸的多核苷酸。在这些实施方式中,所述分离核酸可以从表7中选择。在具体实施方式中,所述ABC转运子选自Cphy3854、Cphy3855、Cphy3857、Cphy3858、Cphy3859、Cphy3860、Cphy3861和Cphy3862组成的组。在更多实施方式中,所述多核苷酸可以包含可操作地连接至编码ABC转运子的分离核酸的调控序列。

    一些实施方式包括含有编码至少一种在C.phytofermentans中鉴定的转录调节因子的分离核酸的多核苷酸。在这些实施方式中,所述分离核酸可以从表8中选择。在更多实施方式中,所述多核苷酸可以包含可操作地连接至编码转录调节因子的分离核酸的调控序列。

    一些实施方式包括含有编码本文描述的水解酶、ABC转运子和转录调节因子的核酸的任何组合的多核苷酸盒。在一种实施方式中,多核苷酸盒可以包含编码至少一种水解酶的分离核酸和编码至少一种ABC转运子的分离核酸。在另一种实施方式中,多核苷酸盒可以包含编码至少一种水解酶的分离核酸和编码至少一种转录调节因子的分离核酸。在另一种实施方式中,多核苷酸盒可以包含编码至少一种ABC转运子的分离核酸和编码至少一种转录调节因子的分离核酸。在另一种实施方式中,多核苷酸盒可以包含编码至少一种水解酶的分离核酸和编码至少一种ABC转运子的分离核酸和编码至少一种转录调节因子的分离核酸。

    一些实施方式包括含有本文描述的任何多核苷酸的表达盒和可操作地连接至所述多核苷酸盒的调控序列。

    一些实施方式包括含有任何本文描述的多核苷酸、多核苷酸盒和/或表达盒的重组微生物。在具体实施方式中,所述重组微生物可以选自Clostridium cellulovorans、Clostridium cellulolyticum、Clostridium thermocellum、Clostridium josui、Clostridium papyrosolvens、Clostridium cellobioparum、Clostridium hungatei、Clostridium cellulosi、Clostridium stercorarium、Clostridium termitidis、Clostridium thermocopriae、Clostridium celerecrescens、Clostridium polysaccharolyticum、Clostridium populeti、Clostridium lentocellum、Clostridium chartatabidum、Clostridium aldrichii、Clostridium herbivorans、Acetivibrio cellulolyticus、Bacteroides cellulosolvens、Caldicellulosiruptor saccharolyticum、Ruminococcus albus、Ruminococcus flavefaciens、Fibrobacter succinogenes、Eubacterium cellulosolvens、Butyrivibrio fibrisolvens、Anaerocellum thermophilum、Halocella cellulolytica、Thermoanaerobacterium thermosaccharolyticum和Thermoanaerobacterium saccharolyticum组成的组。

    一些实施方式包括编码在C.phytofermentans中鉴定的水解酶的分离蛋白。在一些实施方式中,提供生产乙醇的方法。这些方法包括培养微生物、提供培养基和提供本文描述的任何分离蛋白。

    一些实施方式包括分离的多核苷酸盒,所述分离的多核苷酸盒包括一个或多个、两个或多个、或全部三个:编码Clostridium phytofermentans水解酶的序列、编码C.phytofermentans ATP结合盒(ABC)转运子的序列和编码C.phytofermentans转录调节因子的序列。在一些实施方式中,所述水解酶选自Cphy3368、Cphy3367、Cphy1799、Cphy1800、Cphy2105、Cphy1071、Cphy0430、Cphy1163、Cphy3854、Cphy1929、Cphy2108、Cphy3158、Cphy3207、Cphy3009、Cphy3010、Cphy2632、Cphy3586、Cphy0218、Cphy0220、Cphy1720、Cphy3160、Cphy2276、Cphy1714、Cphy0694、Cphy3202、Cphy3862、Cphy0858、Cphy1510、Cphy2128、Cphy1169、Cphy1888、Cphy2919和Cphy1612组成的组。在一些实施方式中,所述ABC转运子选自Cphy1529、Cphy1530、Cphy1531、Cphy3858、Cphy3859、Cphy3860、Cphy2569、Cphy2570、Cphy2571、Cphy2654、Cphy2655、Cphy2656、Cphy3588、Cphy3589、Cphy3590、Cphy3210、Cphy3209、Cphy3208、Cphy2274、Cphy2273、Cphy2272、Cphy2268、Cphy2267、Cphy2266、Cphy2265、Cphy2012、Cphy2011、Cphy2010、Cphy2009、Cphy1717、Cphy1716、Cphy1715Cphy1451、Cphy1450、Cphy1449、Cphy1448、Cphy1134、Cphy1133和Cphy1132组成的组。

    一些实施方式包括重组微生物,所述重组微生物包括本文公开的核酸,如一个或多个、两个或多个、或全部三个:编码Clostridium phytofermentans水解酶的外源核酸、编码C.phytofermentans ATP结合盒(ABC)转运子的外源核酸和编码C.phytofermentans转录调节因子的外源核酸。在一些实施方式中,所述水解酶选自Cphy3368、Cphy3367、Cphy1799、Cphy1800、Cphy2105、Cphy1071、Cphy0430、Cphy1163、Cphy3854、Cphy1929、Cphy2108、Cphy3158、Cphy3207、Cphy3009、Cphy3010、Cphy2632、Cphy3586、Cphy0218、Cphy0220、Cphy1720、Cphy3160、Cphy2276、Cphy1714、Cphy0694、Cphy3202、Cphy3862、Cphy0858、Cphy1510、Cphy2128、Cphy1169、Cphy1888、Cphy2919和Cphy1612组成的组。在一些实施方式中,所述ABC转运子选自Cphy1529、Cphy1530、Cphy1531、Cphy3858、Cphy3859、Cphy3860、Cphy2569、Cphy2570、Cphy2571、Cphy2654、Cphy2655、Cphy2656、Cphy3588、Cphy3589、Cphy3590、Cphy3210、Cphy3209、Cphy3208、Cphy2274、Cphy2273、Cphy2272、Cphy2268、Cphy2267、Cphy2266、Cphy2265、Cphy2012、Cphy2011、Cphy2010、Cphy2009、Cphy1717、Cphy1716、Cphy1715 Cphy1451、Cphy1450、Cphy1449、Cphy1448、Cphy1134、Cphy1133和Cphy1132组成的组。在一些实施方式中,所述微生物选自Clostridium cellulovorans、Clostridium cellulolyticum、Clostridium thermocellum、Clostridium josui、Clostridium papyrosolvens、Clostridium cellobioparum、Clostridium hungatei、Clostridium cellulosi、Clostridium stercorarium、Clostridium termitidis、Clostridium thermocopriae、Clostridium celerecrescens、Clostridium polysaccharolyticum、Clostridium populeti、Clostridium lentocellum、Clostridium chartatabidum、Clostridium aldrichii、Clostridium herbivorans、Acetivibrio cellulolyticus、Bacteroides cellulosolvens、Caldicellulosiruptor saccharolyticum、Ruminococcus albus、Ruminococcus flavefaciens、Fibrobacter succinogenes、Eubacterium cellulosolvens、Butyrivibrio fibrisolvens、Anaerocellum thermophilum、Halocella cellulolytica、Thermoanaerobacterium thermosaccharolyticum和Thermoanaerobacterium saccharolyticum组成的组。

    一些实施方式包括生产乙醇的方法,所述方法包括培养至少一种本文描述的重组微生物。这样的实施方式同样可以包括向微生物提供培养基。在具体实施方式中,所述培养基可以选自锯末、木粉、木浆、纸浆、纸浆废汽、草如柳枝稷、生物质植物和农作物,如海甘蓝、海藻、稻壳、甘蔗渣、黄麻、树叶、大型藻类物质、微藻类物质、草屑(grass clippings)、玉米杆、玉米棒子、玉米粒、玉米粉、蒸馏谷物和果胶组成的组。在具体实施方式中,所述培养基可以是果胶。

    一些实施方式包括处理水解酶培养基的方法,包括提供外源表达Clostridium phytofermentans水解酶的微生物和向所述微生物提供水解酶的培养基,使得所述培养基被处理以形成产物。在一些实施方式中,所述微生物外源表达转运(如:输入或输出)产物的Clostridium phytofermentans ATP结合盒(ABC)转运子。

    一些实施方式包括用于生物燃料生产的产物,包括木质纤维生物质和能够直接水解和发酵所述生物质的微生物,其中所述微生物被改良以提高一种或多种纤维素酶(如在本文中公开的一种或多种纤维素酶,如Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163)的活性。在一些实施方式中,所述微生物能够直接发酵五碳和六碳糖。在一些实施方式中,所述微生物是细菌,如梭菌属的种,如Clostridium phytofermentans。在一些实施方式中,所述微生物包含一种或多种提高一种或多种纤维素酶活性的异源多核苷酸。

    一些实施方式包括用于生物燃料生产的产物,包括碳质生物质和能够直接水解和发酵所述生物质的微生物,其中所述微生物被修饰以提高一种或多种纤维素酶(如在本文中公开的一种或多种纤维素酶,如Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163)的活性。在一些实施方式中,所述微生物能够生产发酵终产物。在一些实施方式中,发酵终产物的实质部分是乙醇。在一些实施方式中,所述发酵终产物包括乳酸、乙酸和/或蚁酸。在一些实施方式中,所述微生物能够吸收一种或多种复杂碳水化合物。在一些实施方式中,所述生物质具有比单体碳水化合物更高浓度的低聚体碳水化合物。

    一些实施方式包括生产生物燃料的方法,包括:

    (a)用能够直接水解和发酵碳质生物质的微生物接触碳质生物质,其中所述微生物被改良以提高一种或多种纤维素酶(如在本文中公开的一种或多种纤维素酶,如Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163)的活性;和

    (b)对上述水解和发酵给予充分时间以生产生物燃料。在一些实施方式中,所述微生物能够吸收一种或多种复杂碳水化合物。在一些实施方式中,所述生物质具有比单体碳水化合物更高浓度的低聚体碳水化合物。在一些实施方式中,所述水解导致相对单体碳水化合物更高浓度的纤维二糖和/或更大的低聚物。

    本文中使用的抬头仅出于结构目的,并不能被解释为以任何方式限定所描述的主题。本申请中引用的所有文献和相似的材料,包括但不限于专利、专利申请、论文、书籍、论述和因特网网页,特别地出于任何目的通过引用的方式全部结合至本文。如果术语在结合的参考文献中的定义与本申请中提供的定义不同,以本申请提供的定义为准。应当意识到,在本申请讨论的度量如温度、浓度和时间之前有隐含的“大约”,因此稍微的和非实质的偏差包括在本申请的范围内。在本申请中,除另有明确说明,单数包括复数。同样,“包含”、“包括”的使用并不意味限定。应当理解,前述的一般性描述和之后的具体描述都仅是示例和说明性的,而不是限制本发明。本文中使用的术语“一”指的是一或多于一(即至少一)的文章的文法对象。例如,“一个元件”意味着一个元件或多于一个元件。

    除非另有限定,用于与本文所描述的发明相关的科技术语应当具有本领域普通技术人员通常理解的含义。此外,除非文中另有要求,单数术语应当包括复数并且复数术语应当包括单数。通常,与本文描述的细胞和组织培养、分子生物学和蛋白和寡聚或多聚核苷酸化学和杂交相关使用的术语和技术是本领域中已知和通常使用的那些。例如,标准技术被用于核酸纯化和制备、化学分析、重组核酸和寡核苷酸合成。根据生产商的说明书或如本领域通常使用的或如本文描述的方式实施酶反应和纯化技术。本文描述的技术和工作程序一般根据本领域已知的常规方法和如在多个一般和更具体的参考文件中描述的方式实施,所述参考文件在本说明书中贯穿引用和讨论。见,如Sambrook等,Molecular Cloning:A Laboratory Manual(第三版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.2000)。所使用的与本文有关的术语和本文所描述的实验室工作程序和技术是本领域已知和通常使用的那些。

    为与本文提供的实施方式使用一致,除非有其它说明,以下术语应当被理解为具有以下含义:

    “核苷酸”指核苷的磷酸酯,作为单体单位或核酸内。“5’-三磷酸核苷酸”指三磷酸酯基团的5’位置有核苷酸,其有时被表示为“NTP”或“dNTP”和“ddNTP”以具体指出核糖的结构特征。所述三磷酸酯基团可以包括对于不同氧的硫取代物,如α-硫代-5′-三磷酸核苷酸。核酸化学的综述见:Shabarova,Z.和Bogdanov,A,Advanved Organic Chemistry of Nucleic Acids,VCH,New York,1994。

    术语“核酸”和“核酸分子”指如DNA(脱氧核糖核酸)和RNA(核糖核酸)的天然核酸序列、人工核酸、它们的类似物或它们的组合。

    如本文中所用的,术语“多核苷酸”和“寡核苷酸”可交替使用,意思是核苷酸单体(核酸)的单链或双链聚合体,包括但不限于由如3’-5’和2’-5’的核苷间磷酸二酯键所连接的、如5’-5’的反向连接的2’-脱氧核糖核苷酸(核酸)和核糖核苷酸(RNA),分枝结构,或核酸类似物。多核苷酸具有缔合的反离子,如H+、NH4+、三烷基铵、Mg2+、Na+等等。多核苷酸可以完全由脱氧核糖核苷酸、完全由核糖核苷酸或它们的混合物组成。多核苷酸可以由核苷碱基和糖类似物组成。多核苷酸典型的大小范围在几个单体单元(例如在本领域当它们更通常普遍被指定为寡核苷酸时,为5-40)至几千个单体核苷酸单元。除非另有指定,只要出现多核苷酸序列,应当理解所述核苷酸从左至右是按照5’到3’顺序,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,“T”表示胸苷。

    本文使用的“燃料和/或其它化学品”指的是适于作为液体或气体燃料的化合物,包括但不限于烃、氢、甲烷、羟基化合物如醇(如乙醇、丁醇、丙醇、甲醇等)、羰基化合物如醛和酮(如丙酮、甲醛、1-丙醛等)、有机酸、有机酸衍生物如酯(如蜡酯、甘油酯等)和其它官能化合物,包括但不限于1,2-丙二醇、1,3-丙二醇、乳酸、蚁酸、乙酸、琥珀酸和丙酮酸,所述化合物由纤维素酶、多糖酶、脂肪酶、蛋白酶、木质素酶和半纤维素酶等酶产生。

    术语“质粒”指环形核酸载体。通常,质粒包含复制起点,使得在细菌(或有时真核的)细胞中质粒产生许多拷贝而没有整合至宿主细胞DNA中。

    本文中使用的术语“构建体”指重组核苷酸序列,通常是重组核酸分子,它的产生出于表达特异核苷酸序列的目的,或被用在其它重组核苷酸序列的构建中。大体上,本文中使用的“构建体”指重组核酸分子。

    “表达盒”指一组允许多核苷酸在宿主细胞中转录的多核苷酸元件。典型地,所述表达盒包括启动子和被转录的异源或本身的多核苷酸序列。表达盒或构建体同样可以包括,如转录终止信号、多腺苷酸化信号和增强子元件。

    “表达载体”意思是使得多核苷酸在细胞内表达的载体。多核苷酸的表达包括转录和/或转录后事件。“表达构建体”是插入有目标核苷酸序列的载体,所述目标核苷酸序列以使得所述目标核苷酸序列置于可操作地连接至表达载体中存在的表达序列的方式插入。

    “操纵子”指一组产生信使RNA(mRNA)的多核苷酸元件。典型地,所述操纵子包括启动子和一个或多个结构基因。典型地,操纵子包含一个或多个被转录至一个多顺反子mRNA(编码多于一个蛋白的单一mRNA分子)的结构基因。在一些实施方式中,操纵子也可以包括调节操纵子结构基因活性的操纵基因。

    本文中使用的术语“宿主细胞”指使用本发明的方法和组合物转化的细胞。大体上,本文中使用的宿主细胞意思是引入有目标核酸的微生物细胞。

    本文中使用的术语“转化”指在细胞中随着非宿主核酸序列的融合而诱导的永久或瞬时遗传改变,如永久遗传改变。

    本文中使用的术语“转化的细胞”指通过重组核酸技术手段已经将编码目标基因产物(如RNA和/或蛋白)的核酸分子引入细胞(或其祖先细胞)的细胞。

    本文中使用的术语“基因”指宿主基因组的任何和所有不连续的编码区,或者仅编码功能性RNA(如tRNA、rRNA、调控RNA如核酶)的区和包括相关的非编码区和调控区。术语“基因”的范围包括编码特异多肽的开放阅读框、内含子和涉及表达调控的邻近的5’和3’非编码核苷酸序列。在这点上,基因可以进一步包含控制信号如启动子、增强子和/或与给出基因天然相关的终止信号,或异源控制信号。基因序列可以是cDNA或基因组核酸或它们的片段。基因可以被引入至合适的载体以在染色体外存在或整合至宿主。

    本文中使用的术语“目标基因”、“目标核苷酸序列”、“目标多核苷酸”或“目标核酸”指任何编码期望在宿主细胞中表达的蛋白或其它分子(如在靶细胞中生产蛋白或其它生物分子(如RNA产物))的核苷酸或核酸序列。所述目标核苷酸序列可以可操作地连接至促进表达的其它序列,如启动子。

    本文中使用的术语“启动子”指足以引导与其可操作连接的核酸序列转录的最小的核酸序列。本文中使用的术语“诱导型启动子”指当结合转录激活剂时有转录活性的启动子,其进而在特定条件下被激活,如存在影响转录激活剂与诱导型启动子结合和/或影响转录激活剂本身的功能的特定化学信号或化学信号的组合时。

    本文中使用的术语“操纵子”、“控制序列”或“调控序列”指调控可操作地连接的编码序列在特定宿主生物体中表达的核酸序列。适合原核生物的控制序列包括例如启动子、任选地操纵基因序列和核糖体结合位点。

    “可操作地连接”等的意思是多核苷酸元件具有功能关系的连接。当核酸序列被置于与另一核酸序列具有功能关系,则所述核酸序列是“可操作地连接”。例如,如果启动子或增强子影响编码序列的转录,则它是可操作地连接至编码序列。在一些实施方式中,可操作地连接意思是被连接的核酸序列典型地是邻近的,其中有必要使两个蛋白编码区,邻近的并在读码框中连接。编码序列“可操作地连接至”另一编码序列,RNA聚合酶将转录所述两条编码序列至单一mRNA,其然后被翻译成具有源自两条编码序列的氨基酸的单一多肽。所述编码序列不需要彼此邻近,只要表达序列最终被加工产生需要的蛋白。

    “可操作地连接”启动子至可转录的多核苷酸意思是将可转录的多核苷酸置于启动子的调控控制下,其然后控制多核苷酸的转录和可选地多核苷酸的翻译。在异源启动子/结构基因化合物的构建中,典型地将启动子或它的变异体远离可转录的多核苷酸的转录起始位点放置,大约与该启动子和它在自然情况下控制的基因,即启动子起源的基因之间的距离相同。如本领域所知,可以在这个距离设置一些变异体而不丧失功能。相似地,与处于调控序列元件控制下的可转录的多核苷酸相关的调控序列元件如操纵子、增强子的典型放置由所述元件在它的自然情况下,即它所源于的基因的放置限定。

    “培养”表示在细胞或生物能够进行一些(如果不是全部)生物学过程的条件下孵育细胞或生物。例如,培养细胞使之生长或繁殖,或者它可能是非活性的但仍然能够进行生物学和/或生物化学过程如复制、转录、翻译等。

    “转基因生物”意思是在其部分细胞中存在有非内源性(即异源)核酸序列或非内源性(即异源)核酸序列稳定整合至其种系核酸中的非人类生物(如单细胞生物(如微生物)、哺乳动物、非哺乳动物(如线虫或果蝇))。

    本文中使用的术语“生物质”指大量活的或生物材料并包括天然的或加工的,以及更宽泛地天然有机材料。

    “重组”指合成的或其它体外操作的多核苷酸(重组多核苷酸)和在细胞或其它生物系统中使用重组多核苷酸生产由那些多核苷酸编码的基因产物的方法。例如,可以将克隆的多核苷酸插入至合适的表达载体中,例如细菌质粒,所述质粒可以用于转化合适的宿主细胞。包含重组多核苷酸的宿主细胞被称为“重组宿主细胞”或“重组细菌”。然后所述基因在重组宿主细胞中被表达以产生如“重组蛋白”。另外,重组多核苷酸可以提供非编码功能,例如启动子、复制起点或核糖体结合位点。

    术语“异源重组”指基于核酸序列相似性两个核酸分子之间的重组过程。该术语包括交互重组和非交互重组(也被称为基因转变)。此外,所述重组可以是等价或非等价的交叉事件的结果。等价交叉发生在两个等价序列或染色体区之间,而非等价的交叉发生在非等价序列或染色体区的相同(或基本上相同)片段之间。非相等的交叉典型地导致基因重复或删除。涉及同源重组的酶和机制的描述见Watson等,Molecular Biology of the Gene 313-327页,The Benjamin/Cummings Publishing Co.第4版(1987)。

    术语“非同源或随机整合”指不包括同源重组的、核酸被整合至基因组的任何过程。它表现出是整合可以发生在很多基因组定位的任意一个的随机过程。

    “异源多核苷酸序列”或“异源核酸”是相对术语,指与另一多核苷酸(如启动子序列)以使得两条多核苷酸序列没有被设置成如在自然中彼此一样的关系的方式而功能相关的多核苷酸。异源多核苷酸序列包括如可操作地连接至异源核酸的启动子,和包含它天然启动子的多核苷酸序列,其被插入至异源载体中用于转化至重组宿主细胞。异源多核苷酸序列被认为是“外源”因为它们通过转化技术被引入至宿主细胞。但是异源多核苷酸可以来自不同来源或来自相同来源。异源多核苷酸序列的改变可以发生,例如,通过用限制性酶处理所述多核苷酸以产生能够可操作地连接至调控元件的多核苷酸序列。改变也可以通过如定点突变发生。

    术语“内源表达”指相对于宿主细胞是天生的并且在所述宿主细胞中天然表达的多核苷酸。

    “能够表达”指为内源和/或外源多核苷酸的表达提供足够的细胞环境的宿主细胞。

    本申请涉及2008年2月27日提交的美国临时申请号61/032,048、2009年2月27日提交的国际申请号PCT/US2009/35597、2009年4月6日提交的美国申请号12/419,211、2008年6月11日提交的美国临时申请号61/060,620和2009年6月11日提交的美国申请号12/483,118,每一个的全部内容都出于任何目的通过引用的方式结合至本文。

    下面的图、描述和实施例详细说明了本发明的一些具体实施方式。本领域技术人员将意识到许多变化和修改形式都包括在它的范围内。因此,一些具体实施方式的描述不应当被认为限制本发明的范围。

    附图说明

    图1是一系列多核苷酸基因组合实施例的简图。R代表转录调控序列;A、B和C代表编码ATP结合盒(ABC)转运子的序列;GH代表编码糖苷水解酶的序列;S代表信号序列。

    图2是一系列C.phytofermentans中基因组合的具体实施例的简图。数字代表特定序列在C.phytofermentans染色体上的定位。

    图3是C.phytofermentans Affymetrix微列阵设计的简图。破折号表示微列阵上合成的24碱基探针。盒子表示预测的开放阅读框,如蛋白编码区。11个24碱基探针被用于测量每一个开放阅读框(ORF)的水平。基因间区在DNA两侧均由24碱基探针覆盖,所述24碱基探针由单一DNA碱基区分。

    图4是测量mRNA转录本范围的方法的简图。假定的mRNA转录本包括延伸相应预测的ORF的5’和3’的非编码区。探针由破折号表示。在这个实施例中,ORF的左端(5’)的三个探针和ORF的右端(3’)的两个探针将指示mRNA的转录本范围。

    图5是C.phytofermentans染色体的图示。

    图6是显示1kb基因组片段中GC含量作为随C.phytofermentans基因组距离的函数的图示。6个GC含量>50%的基因组岛被编号。这6个区构成总共16个1kb区。

    图7是基于16S rRNA基因序列梭状芽胞杆菌类内的菌株C.phytofermentans和相关分类的邻接树。簇I包括引起疾病的梭状芽胞杆菌,簇III包括可水解纤维素的梭状芽胞杆菌,簇XIVa包括肠道微生物,以及梭菌属中的宏基因组序列。节点上的数字是基于1000个重复取样数据库的邻接分析的自引支持度的水平(百分比)。Bacillus subtilis被用作为外群体。条形,每个位置4个核苷酸取代。

    图8是显示Clostridium phytofermentans ISDg CDSs在其它测序的梭状芽胞杆菌类细菌基因组中的最好匹配(e值截止于0.01)的数值的环状图。

    图9A和9B是显示了使用BLASTP比较在不同生物中糖苷水解酶(GH)编码基因(9A)和所有基因(9B)的环状图。

    图10是显示了糖苷水解酶家族GH9域的分子系统发生的邻接树。

    图11是显示了糖苷水解酶家族GH5域的分子系统发生的邻接树。

    图12是显示了实施例假定水解酶的概略图。一些水解酶可以是细胞外或膜结合的。GH:水解酶;CBM:碳水化合物结合域。

    图13是C.phytofermentans中吸收和代谢戊糖的描述。

    图14是C.phytofermentans中吸收和代谢岩藻糖的描述。

    图15是C.phytofermentans中吸收和代谢鼠李糖的描述。

    图16是C.phytofermentans中调节、吸收和代谢海带多糖的描述。

    图17是C.phytofermentans中吸收和代谢纤维二糖的描述。

    图18是pIMP-Cphy质粒图的描述。

    图19是pCphyP3510-3367质粒图的描述。

    具体实施方式

    本文公开的多个实施方式一般集中在制造重组微生物的组合物和方法,在多种发酵环境下培养时所述重组微生物能够生产燃料。一般性地,重组微生物能够有效地和稳定地生产燃料,如醇,和相关化合物,从而可以从相对低廉的天然生物质材料如纤维素中得到高产量燃料。在一些实施方式中,重组微生物可以有效地和稳定地催化低廉的天然生物质材料如木质纤维素的转化,以生产糖类和多糖,和相关的化合物。

    目前,有少数几项使用能够生产燃料的重组生物的技术。许多技术通常具有导致低燃料产量、高耗费和不期望的副产品的问题。例如,一些已知技术使用玉米颗粒和其它谷类作为给料。但是,在谷物供应上竞争性饲料和食物需求以及价格可能最终限制从玉米和其它谷类生产乙醇的发展。其它给料来源包括木质纤维素,通过糖化作用和发酵其可以生产乙醇(Lynd,L.R.,Cushman,J.H.,Nichols,R.J.和Wyman,C.E.Fuel ethanol from cellulosic biomass,″Science 251,1318-1323(1991))。由于木质纤维素是生物质的主要成分,也是地球上最丰富的生物材料,因此源自木质纤维生物质的燃料是可更新能源选择,具有维持世界经济、能源和环境的潜力。但是,常规的木质纤维素乙醇产品需要昂贵的和复杂的多步过程,包括木质纤维素材料的生产和用外源糖分解酶预处理木质纤维素材料、水解存在于预处理的生物质中的多糖,和己糖和戊糖的分离发酵。

    在一种实施方式中,本发明的方法和组合物包含遗传性改良或制造微生物以提高一种或多种酶的酶活性,包括但不限于纤维素酶。这样的改良的实施例包括修改内源核酸调控元件以增加一种或多种酶的表达(如将编码目标酶的基因可操作地连接至强启动子),向微生物中引入额外的核酸分子拷贝以提供酶的增强的活性,将编码一种或多种酶的基因可操作地连接至诱导型启动子,或它们的组合。

    可以改良本发明的不同的微生物以提高一种或多种纤维素酶或与纤维素处理相关的酶的活性。纤维素酶的分类通常基于将形成具有相似或同样活性的家族的酶集合,但不需要同样的底物特异性。这些分类之一是CAZY系统(CAZY代表碳水化合物活性酶),例如,列有115种不同的糖苷水解酶(GH),命名为GH1至GH115。每一种不同的蛋白家族通常具有相应的酶活性。本数据库包括纤维素和半纤维素活性酶。此外,Clostridium phytofermentans的全部注解的基因组可以从互联网www.ncbi.nlm.nih.gov/sites/entrez上获得。

    通过提供使木质纤维素生物质可以在单一步骤中发酵成乙醇的方法和组合物,本文描述的一些实施方式简化了木质纤维素乙醇生产的常规多步过程。这被认为是综合生物过程(CBP)。由于CBP简化了整个转化过程,减少了成本和能源浪费,它被预示为唯一的经济地和环境地可持续的纤维素乙醇生物过程。

    在一些实施方式中,提供用于有效的燃料生产系统的多核苷酸和表达盒。所述多核苷酸和表达盒可以用于制备转化微生物的表达载体以赋予转化的微生物能够有效地生产极大数量的产物,如燃料。

    在一些实施方式中,微生物的新陈代谢可以通过引入和表达多种基因而被改良。根据本发明的一些实施方式,重组微生物可以使用来自Clostridium phytofermentans(ISDgT,美国模式培养物保藏所700394T)的基因作为用于促进例如纤维素转化成燃料如乙醇和氢的生物催化剂。

    在一些实施方式中,C.phytofermentans(美国模式培养物保藏所700394T)可以根据培养的菌株ISDgT的表型和基因型特征来定义(Warnick等,International Journal of Systematic and Evolutionary Microbiology,52:1155-60,2002)。Clostridium phytofermentans的全部注解的基因组可以从互联网www.ncbi.nlm.nih.gov/sites/entrez上获得。多个实施方式大体上涉及用于生产燃料和/或其它有用的有机产物的系统、方法和组合物,包括菌株ISDgT和/或源自菌株ISDgT或单独分离的C.phytofermentans种的任何其它菌株。可以使用标准的分类学因素对所述种进行定义(Stackebrandt和Goebel,International Journal of Systematic Bacteriology,44:846-9,1994):与模式株(ISDgT)相比,具有16s rRNA序列同源性值在97%和以上的菌株被认为是C.phytofermentans菌株,除非显示它们具有DNA重新组合值小于70%。相当多的证据存在显示具有70%或以上的DNA重新组合值的微生物同样具有至少96%的DNA序列一致性并共享限定种类的表型特征。C.phytofermentans菌株ISDgT的基因组序列分析表明存在大量可能涉及植物多糖发酵的机制和途径的基因和遗传基因座,导致该微生物不平常的发酵性质。基于上述分类学因素,C.phytofermentans种的所有菌株可能同样具有所有、或近似所有的这些发酵性质。C.phytofermentans菌株可以是天然分离种或遗传改良菌株。

    可以将不同表达载体引入宿主微生物中使得转化的微生物可以在不同发酵条件下产生大量的燃料。可以将重组微生物改良使得当微生物被培养在包含例如纤维素的培养基上时稳定、高产量地生产燃料。

    C.phytofermentans,单独或与一种或多种其它微生物的组合可以大规模地将纤维素生物质材料发酵成易燃的生物燃料,如乙醇、丙醇和/或氢(见如美国专利申请号2007/0178569;Warnick等,Int J Syst Evol Microbiol(2002),52 1155-1160,每一篇的全部内容都通过引用的方式结合至本文)。

    本文所公开的多核苷酸、表达盒和表达载体可以与许多不同宿主微生物一起使用以生产燃料如乙醇和氢。例如,除了Clostridium phytofermentans,水解纤维素的微生物如Clostridium cellulovorans、Clostridium cellulolyticum、Clostridium thermocellum、Clostridium josui、Clostridium papyrosolvens、Clostridium cellobioparum、Clostridium hungatei、Clostridium cellulosi、Clostridium stercorarium、Clostridium termitidis、Clostridium thermocopriae、Clostridium thermocellum、Clostridium celerecrescens、Clostridium polysaccharolyticum、Clostridium populeti、Clostridium lentocellum、Clostridium chartatabidum、Clostridium aldrichii、Clostridium herbivorans、Acetivibrio cellulolyticus、Bacteroides cellulosolvens、Caldicellulosiruptor saccharolyticum、Ruminococcus albus、Ruminococcus flavefaciens、Fibrobacter succinogenes、Eubacterium cellulosolvens、Butyrivibrio fbrisolvens、Anaerocellum thermophilum和Halocella cellulolytica都是特别有希望的宿主,因为它们能够水解纤维素。能够使用的其它微生物包括,例如糖分解微生物,如Thermoanaerobacterium thermosaccharolyticum和Thermo anaerobacterium saccharolyticum。其它潜在的宿主包括其它细菌、酵母、藻类、真菌和真核细胞。

    在多种实施方式中,本发明所公开的多核苷酸、表达盒和表达载体可以与C.phytofermentans或其它梭菌属的种一起使用以增加燃料如乙醇和氢的产量。

    如本领域技术人员将意识到的,生产能够生产燃料的重组生物可以具有非常大的益处,特别是对于有效的、划算的和对环境无破坏的燃料生产。

    例举的实施方式

    下面的描述和实施例详细描述本发明的一些实施方式。本领域技术人员将意识到它的范围包括多种变化和改良。因此,优选的实施方式的描述不能被认为限定了本发明的范围。

    本发明的多种实施方式提供了使用重组微生物生产燃料的益处。用于燃料生产最优化的多核苷酸、表达盒、表达载体和重组微生物根据本发明的一些实施方式而公开。

    水解酶

    本发明描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码水解酶的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及使用包含在C.phytofermentans中鉴定的编码水解酶的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。使用编码水解酶的核酸的优势包括改进微生物水解多聚体如多糖和多肽的能力和性能。

    水解酶可以包括降解多聚体如二糖、三糖和多糖、多肽和蛋白的酶。多聚体同样可以包括例如纤维素、半纤维素、胶质、木质素和蛋白聚糖。降解多糖的酶和酶活性的例子包括但不限于糖苷水解酶(GH)、糖基转移酶(GT)、多糖裂解酶(PL)、碳水化合物酯酶(CE)和包含碳水化合物结合模块(CBM)的蛋白(可以在互联网“cazy.org”上获得;Coutinho,P.M.和Henrissat,B.(1999)Carbohydrate-active enzymes:an integrated database approach。在“Recent Advances in Carbohydrate Bioengineering”中,H.J.Gilbert,G.Davies,B.Henrissat和B.Svensson,The Royal Society of Chemistry,剑桥,3-12页)。

    在一些实施方式中,GH、GT、PL、CE和CMB可以是具有不同活性的单独的酶。在其它实施方式中,GH、GT、PL、CE和CMB可以是具有具体催化活性的酶域。例如,具有多种活性的酶可以具有多种酶域,包括例如GH、GT、PL、CE和/或CBM催化域。

    O-糖基水解酶是广泛分布的一组酶,水解两个或多个碳水化合物之间、或碳水化合物和非碳水化合物部分之间的糖苷键。基于序列相似度的糖基水解酶分类系统已经导致鉴定85种不同家族PUBMED:7624375,PUBMED:8535779,PUBMED。该分类可以在CAZy(碳水化合物活性酶)网站PUBMED中获得。由于蛋白折叠比它的序列更保守,一些家族可以以“部族(clan)”分组。

    糖苷水解酶家族9包括具有几种已知活性的酶,如内切葡聚糖酶和纤维二糖水解酶。在C.phytofermentans中,典型的GH9纤维素酶是ABX43720。

    任何水解酶可以选自C.phytofermentans的注解的基因组中以在本发明的产物和方法中使用。例子包括如一种或多种内切葡聚糖酶、几丁质酶、纤维二糖水解酶或内进行纤维素酶(在还原端或非还原端)。

    此外,可以改良微生物如C.phytofermentans以改进一种或多种纤维素酶或水解酶的生产,或一种或多种这样的酶可以在不同的宿主(如其它细菌或酵母)中异源表达。对于异源表达,可以通过重组技术改良细菌或酵母(如Brat等,Appl.Env.Microbiol.29;75:2304-2311,公开了Saccharomyces cerevisiae中木糖异构酶的表达)。

    可以采取其它改良以提高在本发明的重组微生物中的末端产物(如乙醇)产量。例如,所述宿主可以进一步包括额外的异源DNA片段,其表达产物是涉及单糖和/或寡聚糖运输至重组宿主的蛋白。同样地,来自糖酵解途径的额外的基因可以整合至宿主。在这样的途径中,可以提高乙醇生产速度。

    C.phytofermentans基因组的最显著和意想不到的特征之一是编码碳水化合物活性酶基因的数量和多样性。这个多样性在与C.phytofermentans相关的生物中是独一无二的。表1说明了涉及其它生物的碳水化合物基因的多样性。

    表1:碳水化合物活性基因数量和多样性

    C.phytofermentans基因组包括不同系列的GH、PL、CE和CBM基因,所述基因具有广泛范围的使用本文描述的方法和本领域已知的方法预测的假定功能。表2至5分别显示了一些预测在C.phytofermentans中存在的GH、PL、CE和CBM家族成员的一些已知活性的实施例。已知活性通过活性和由国际生物化学与分子生物学联盟确定的相关的EC号列出。

    表2:糖苷水解酶家族成员的已知活性

    表3:多糖裂解酶家族成员已知活性

    表4:碳水化合物酯酶家族成员的已知活性

    表5:碳水化合物结合模块家族成员的已知活性

    一些实施方式包括编码表6中显示的水解酶的基因。JGI数表示在GenBank记录中的NCBI基因座标签。

    表6:预测C.phytofermentans中的水解酶

      JGI号  GH  GH模块结构  Cphy0191  GH43  Cphy0203  GH105  Cphy0218  GH31  Cphy0220  GH3  Cphy0288  GH88  Cphy0430  GH94  Cphy0530  GH2  Cphy0531  GH43  Cphy0607  GH20  Cphy0662  GH3  Cphy0666  GH106  Cphy0694  GH94  Cphy0699  GH3  Cphy0711  GH2  Cphy0769  GH4  Cphy0776  GH88  Cphy0857  GH94  Cphy0858  GH30  Cphy0874  GH95  Cphy0875  GH43  Cphy0934  GH88  Cphy1019  GH65

      Cphy1071  GH26  CBM35-GH26-CBM3  Cphy1125  GH3  Cphy1163  GH5  Cphy1169  GH51  Cphy1308  GH87  Cphy1395  GH95  Cphy1435  GH19  Cphy1510  GH10  Cphy1596  GH3  Cphy1612  Cphy1640  GH12  Cphy1652  GH18  Cphy1688  GH*  Cphy1711  GH28  Cphy1714  GH85  GH85-CBM32  Cphy1720  GH38  Cphy1750  GH105  Cphy1775  GH*  SLH-GH*-CBM32-CBM32  Cphy1799  GH18  CBM12-GH18  Cphy1800  GH18  GH18-CBM12  Cphy1815  GH18  GH18-LRR  Cphy1873  GH87  CBM35-CBM6-GH87  Cphy1874  GH65  Cphy1877  GH31

      Cphy1882  GH87  GH87-SORT  Cphy1888  Cphy1919  GH105  Cphy1929  GH94  Cphy1934  GH13  Cphy1936  GH36  Cphy1937  GH1  Cphy1943  GH19  CBM5-GH19  Cphy2025  GH2  Cphy2028  GH43  Cphy2058  GH5  Cphy2105  GH11  Cphy2108  GH10  CBM22-GH10-SORT  Cphy2128  GH26  CBM35-GH26-X2-X2-CBM3  Cphy2190  GH29  Cphy2276  GH26  CBM35-GH26  Cphy2304  GH13  CBM41-CBM48-GH13-SORT  Cphy2331  GH13  CBM48-GH13  Cphy2332  GH3  Cphy2341  GH13  Cphy2342  GH13  Cphy2344  GH13  Cphy2349  GH77  Cphy2350  GH13

      Cphy2567  GH28  Cphy2572  GH18  Cphy2632  GH43  Cphy2736  GH28  Cphy2848  GH4  Cphy2919  Cphy3009  GH3  Cphy3010  GH10  Cphy3011  GH43  Cphy3023  GH29  Cphy3028  GH29  Cphy3029  GH88  Cphy3056  GH36  Cphy3081  GH2  Cphy3109  GH25  Cphy3158  GH67  Cphy3160  GH2  Cphy3202  GH5  GH5-X2-CBM46-CBM2  Cphy3207  GH8  Cphy3217  GH28  Cphy3239  GH20  Cphy3310  GH28  Cphy3313  GH65  Cphy3314  GH65

      Cphy3329  GH3  Cphy3367  GH9  GH9-CBM3-X2-X2-CBM3  Cphy3368  GH48  GH48-X2-CBM3  Cphy3388  GH16  GH 16-CBM4-CBM4-CBM4-CBM4  Cphy3396  GH4  Cphy3398  GH43  Cphy3404  GH30  Cphy3466  GH73  Cphy3571  GH20  Cphy3586  GH53  GH53-CBM13  Cphy3618  GH43  Cphy3749  GH18  Cphy3785  GH31  Cphy3854  GH94  Cphy3862  GH10  GH10-GH10-CE15

    在一些实施方式中,降解多糖的酶包括降解纤维素的酶,即纤维素酶。一些纤维素酶,包括内切纤维素酶(EC 3.2.1.4)和外切纤维素酶(EC 3.2.1.91),水解β-1,4-糖苷键。

    在C.phytofermentans中预测的内切纤维素酶的例子包括GH5家族内的基因,如Cphy3368;Cphy1163和Cphy2058;GH8家族,如Cphy3207;和GH9家族,如Cphy3367。C.phytofermentans中的外切纤维素酶的例子包括GH48家族中的基因,如Cphy3368。一些外切纤维素酶水解多糖以产生葡萄糖的2-4单元寡聚糖,产生纤维糊精二糖(纤维二糖)、三糖(纤维三糖)或四糖(纤维四糖)。GH5、GH9和GH48家族的成员可以具有内切纤维素酶和外切纤维素酶活性。

    在一些实施方式中,降解多糖的酶可以包括能够降解半纤维素的酶,即半纤维素酶(Leschine,S.B.Handbook on Clostridia(ed.Dürre,P.)(CRC Press,Boca Raton,2005))。半纤维素是植物生物质的主要成分并包含戊糖和己糖混合物,例如,D-吡喃木糖、L-阿拉伯呋喃糖、D-吡喃甘露糖、D-吡喃葡萄糖、D-吡喃半乳糖、D-吡喃葡糖醛酸和其它糖(Aspinall,G.O.The Biochemistry of Plants 473,1980;Han,J.S.& Rowell,J.S.Paper and composites from agro-based resources 83,1997)。在一些实施方式中,C.phytofermentans中鉴定的预测的半纤维素酶包括对半纤维素的线性骨架起作用的酶,如内切-β-1,4-D-木聚糖酶(EC 3.2.1.8),如GH5、GH10、GH11和GH43家族成员;1,4-β-D-木糖苷木糖水解酶(EC 3.2.1.37),如GH30、GH43和GH3家族成员;和β-甘露聚糖酶(EC 3.2.1.78),如GH26家族成员。(见表6)。

    在一些实施方式中,C.phytofermentans中鉴定的预测的半纤维素酶包括对半纤维素的侧基和取代基起作用的酶,例如α-L-阿拉伯呋喃糖苷酶(EC 3.2.1.55),如GH3、GH43和GH51家族成员;α-木糖苷酶,如GH31家族成员;α-岩藻糖苷酶(EC 3.2.1.51),如GH95和GH29家族成员;半乳糖苷酶,如GH1、GH2、GH4、GH36、GH43家族成员;和乙酰-木聚糖酯酶(EC 3.1.1.72),如CE2和CE4。(见表6)。

    在一些实施方式中,降解多糖的酶可以包括能够降解果胶的酶,即果胶酶。在植物细胞壁中,交联的纤维素网可以深入至共价连接至木葡聚糖和一些结构蛋白的果胶基序中。果胶可以包括同型半乳糖醛酸聚糖(HG)或鼠李糖半乳糖醛酸聚糖(RH)。

    在一些实施方式中,C.phytofermentans中鉴定的果胶酶可以水解HG。HG可以由D-半乳糖醛酸(D-galA)单元组成,其可以被乙酰化和甲基化。水解HG的酶包括例如1,4-α-D聚半乳糖醛酸裂解酶(EC 4.2.2.2),如PL1、PL9和PL11家族成员;葡糖醛酸水解酶,如GH88和GH 105家族成员;果胶乙酰酯酶,如CE 12家族成员;和果胶甲基酯酶,如CE8家族成员(见表6)。

    在一些实施方式中,C.phytofermentans中鉴定的果胶酶可以水解RH。RH可以是由交互的1,2-α-L-鼠李糖(L-Rha)和1,4-α-D-半乳糖醛残基组成的骨架(Lau,J.M.,McNeil M.,Darvill A.G.& Albersheim P.Structure of the backbone of rhamnogalacturonan I,a pectic polysaccharide in the primary cell walls of plants.Carbohydrate research 137,111(1985))。所述骨架的鼠李糖残基可以有连接至C4的半乳聚糖、阿拉伯聚糖或阿拉伯半乳聚糖作为侧链。水解HG的酶可以包括例如,内切鼠李糖半乳糖醛酸酶,如GH28家族成员;和鼠李糖半乳糖醛酸聚糖裂解酶,如PL11家族成员。(见表6)。

    一些实施方式包括可以水解淀粉的酶。C.phytofermentans能够降解淀粉和几丁质(Warnick,T.A.,Methe,B.A.和Leschine,S.B.Clostridium phytofermentans sp.nov.,a cellulolytic mesophile from forest soil.Int.J.Syst.Evol.Microbiol.52,1155-1160(2002);Leschine,S.B.在Handbook on Clostridia中(ed Dürre,P.)(CRC Press,Boca Raton,2005);Reguera,G.& Leschine,S.B.Chitin degradation by cellulolytic anaerobes and facultative aerobes from soils and sediments.FEMS Microbiol.Lett.204,367-374(2001))。水解淀粉的酶包括α-淀粉酶、葡糖淀粉酶、β-淀粉酶、外切-α-1,4-葡聚糖酶和支链淀粉酶。C.phytofermentans中鉴定的涉及淀粉水解的预测的酶的例子包括GH13家族成员。(见表6)。

    在其它实施方式中,水解酶可以包括水解几丁质的酶。可以水解几丁质的酶的例子包括GH18和GH19家族成员。(见表6)。

    在一些实施方式中,水解酶可以包括水解地衣的酶,即地衣聚糖酶,如GH16家族成员,如Cphy3388。

    在一些实施方式中,水解酶可以包括CBM家族成员。不希望被任何理论限制,CBM域的功能是将酶复合物定位至特定底物。C.phytofermentans中鉴定的可以结合纤维素的预测的CBM家族的例子包括CBM2、CBM3、CBM4、CBM6和CBM46家族成员。C.phytofermentans中鉴定的可以结合木聚糖的预测的CBM家族的例子包括CBM2、CBM4、CBM6、CBM13、CBM22、CBM35和CBM36家族成员。(见表6)。在其它实施方式中,CBM域家族成员的功能是稳定酶复合物。

    一些实施方式包括编码至少一种在C.phytofermentans中鉴定的预测的水解酶的多核苷酸。

    ATP结合盒转运子

    本文中描述的一些实施方式涉及包含C.phytofermentans中鉴定的编码ATP结合盒转运子(ABC转运子)的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及使用这些包含C.phytofermentans中鉴定的编码ABC转运子的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。使用编码ABC转运子的核酸的优势包括增加转化的生物运输化合物至生物并在生产燃料的生化途径中使用这些化合物的能力,从而改进燃料生产。这样化合物的例子包括聚合体水解产物。

    ABC转运子蛋白利用ATP水解以越过质膜转运多种物质。这样的物质包括糖和氨基酸。可以使用本文描述的方法和本领域已知的方法鉴定ABC转运子。ABC转运子包括至少两种类型域:跨膜域和核苷酸(如ATP)结合域。一些ABC转运子同样包括协助溶解物转运调节的溶解结合域。这些域可以存在于同样的多肽链或多个多肽链上。ABC转运子家族的一些成员包括ABC_tran(pfam0005)域。ABC转运子家族的更多成员包括4个域,其中两个对称的两半由长带电荷域和高疏水片段连接(Hyde等,Nature,346:362-365(1990);Luciani等,Genomics,21:150-159(1994))。

    在更多例举的实施方式中,包含ABC转运子的多核苷酸盒、表达盒、表达载体和生物在C.phytofermentans中被鉴定。这样的基因簇可以使用本文描述的方法和本领域已知的方法鉴定。在一些实施方式中,基因和基因簇可以通过蛋白相邻类聚簇(COG)之间的相同度鉴定。这样的基因和基因簇可以包括在盒上或一起表达。包括预测的ABC转运子和ABC转运子域的例子在表7中显示。纵列“No.”表示假定簇。ABC转运子域包括信号转导域。

    表7:C.phytofermentans中的预测ABC转运子和其它蛋白/域

    一些实施方式包括编码预测的ABC转运子的核酸的应用,所述ABC转运子转运任何聚合体水解产物。这样的水解产物可以包括单糖,如葡萄糖、甘露糖、岩藻糖、半乳糖、阿拉伯糖、鼠李糖和木糖;二糖,如海藻糖、麦芽糖、乳糖、蔗糖、纤维二糖;木二糖和寡聚糖,如纤维三糖、纤维四糖、木三糖、木四糖、菊糖、蜜三糖和松三糖。

    一些实施方式包括预测的转运纤维二糖的ABC转运子,例如,由Cphy2464、Cphy2465和Cphy2466编码的预测的ABC转运子。

    转录调节因子

    本发明描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码转录调节因子的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包含在C.phytofermentans中鉴定的编码转录调节因子的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。

    在C.phytofermentans中鉴定的转录调节因子包括AraC和PurR家族成员。AraC调节因子可以包括涉及碳代谢的基因的转录激活剂(Gallegos M.T.等,AraC/XylS Family of Transcriptional Regulators.Microbiol.Mol.Biol.Rev.61,393-410(1997))。PurR调节因子包括乳糖阻遏物家族的成员(Ramos,J.L.等,The TetR family of transcriptional repressors.Microbiol.Mol.Biol.Rev.69,326-356(2005))。

    一些实施方式包括表8中显示的预测的转录调节因子。

    表8:C.phytofermentans中的预测的转录调节因子

    一些实施方式包括由Cphy2467编码的预测的转录调节因子。

    组合

    本文中描述的一些实施方式涉及包含多于一种(如两种或多种)在C.phytofermentans中鉴定的基因的多核苷酸、多核苷酸盒、表达盒、表达载体和生物。一些实施方式涉及利用包含多于一种(如两种或多种)在C.phytofermentans中鉴定的基因的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。

    组合可以包括含有多于一个在C.phytofermentans中鉴定的基因的多核苷酸盒。在这样的实施方式中,本文中描述的任何基因可以与本文中描述的任何其它基因组合利用。例如,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的任何编码ABC转运子的核酸组合利用。在进一步实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的编码认知(cognizant)ABC转运子的核酸组合利用,如编码木聚糖酶的核酸与编码木糖转运子的核酸组合。

    如本文中所使用的,认知可以指与特定的生化途径结合的至少两种基因。例如,认知可以指第一个基因的产物是第二个基因的底物的至少两种基因等等。利用认知基因的优点包括产生具有由多核苷酸盒编码的多样活性的重组生物的能力,例如,转化有包含水解酶和认知ABC转运子的多核苷酸盒的生物可以水解对于水解酶的特定底物聚合体,并通过认知ABC转运子将水解产物转运至细胞。本领域技术人员可以鉴定本文描述的认知基因的例子。

    在其它实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的任何编码转录调节因子的核酸组合使用。在更多实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的编码认知转录调节因子的核酸组合使用。

    在具体实施方式中,在C.phytofermentans中鉴定的任何编码ABC转运子的核酸可以与在C.phytofermentans中鉴定的任何编码转录调节因子的核酸组合使用。在进一步实施方式中,在C.phytofermentans中鉴定的任何编码ABC转运子的核酸可以与在C.phytofermentans中鉴定的编码认知转录调节因子的核酸组合使用。

    在一些实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的任何编码ABC转运子的核酸,和在C.phytofermentans中鉴定的任何编码转录调节因子的核酸组合使用。在更多实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的任何编码认知ABC转运子的核酸,和在C.phytofermentans中鉴定的任何编码认知转录调节因子的核酸组合使用。

    在一些实施方式中,组合可以包括连续使用多于一种在C.phytofermentans中鉴定的基因。例如,生物可以转化有包含本文中描述的任何基因的多核苷酸,随后转化有本文描述的至少一种不同基因。

    包含或主要组成为至少两种基因的多核苷酸盒的例举实施方式在图1中显示。在一种实施方式中,由Cphy2276编码的预测的水解酶可以和由Cphy2272、Cphy2273和Cphy2274编码的预测的认知ABC转运子域结合。在另一种实施方式中,由Cphy3207编码的预测的水解酶可以和Cphy3210、Cphy3209和Cphy3208编码的预测的认知ABC转运子域,以及Cphy3211编码的预测的认知转录调节因子,以及Cphy3212编码的预测的认知信号转导蛋白结合。在另一种实施方式中,由Cphy0862、Cphy0861和Cphy0860编码的预测的ABC转运子域可以和由Cphy0864编码的预测的转录调节因子,以及由Cphy0863编码的预测信号转导蛋白结合。在另一种实施方式中,由Cphy2466、Cphy2465和Cphy2464编码的预测的ABC转运子域可以和由Cphy2467编码的预测的转录调节因子结合。在另一种实施方式中,由Cphy1877编码的预测的水解酶可以和由Cphy1876编码的预测转录调节因子结合。

    在更多例举的实施方式中,包含多于一种基因的多核苷酸盒、表达盒、表达载体和生物可以包含在C.phytofermentans中鉴定的基因簇。可以使用本文中描述的方法和本领域已知的方法鉴定这样的基因簇。在一些实施方式中,基因和基因簇可以通过蛋白相邻类聚簇(COG)之间的相同度鉴定。这样的基因和基因簇可以包括在盒上或一起表达。在C.phytofermentans中鉴定的基因簇的例子在表9中显示。

    表9:C.phytofermentans中鉴定的基因簇

    涉及木糖消化的酶

    本文中描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及木糖消化的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及木糖消化的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。

    如本文中所使用的,涉及木糖消化的基因包括例如将聚合体水解成木糖的水解酶基因、将木糖转运至细胞的ABC转运子基因、调节这些编码水解酶和/或ABC转运子的转录调节因子基因和涉及戊糖(如木糖)发酵成乙醇的酶的基因。当C.phytofermentans在木糖上生长时被鉴定为上调的基因包括Cphy3419、Cphy1219和Cphy1585、Cphy1586和Cphy1587(见图13)。

    尽管许多Clostridia的种可以降解半纤维素,但是多数种不能发酵由这样的水解产生的戊糖。明显地,C.phytofermentans能够水解半纤维素至戊糖并将戊糖发酵成乙醇。C.phytofermentans可以将戊糖作为寡聚糖或作为单糖转运至细胞。C.phytofermentans基因组包含编码用于木糖消化的酶的基因,所述酶包括在涉及戊糖转变成己糖的非氧化物戊糖磷酸途径中的酶。与发酵戊糖的能力一致,细胞在木糖上生长的表达数据已经显示了在己糖磷酸途径中的关键酶,即,转醛醇酶(EC 2.2.1.1,Cphy0013)和转酮醇酶(EC 2.2.1.1,Cphy0014)存在于最多数的转录中。连接戊糖磷酸途径和引发糖酵解反应至糖酵解的能量收获步骤的甘油醛-3-磷酸脱氢酶(EC 1.2.1.12,Cphy2879)由木聚糖、纤维素、纤维二糖和葡萄糖强烈诱导。在木聚糖上生长时上调的其它基因包括Cphy2105、Cphy2106、Cphy2108、Cphy1510、Cphy3158、Cphy3009、Cphy3010、Cphy3419、Cphy1219、Cphy2632、Cphy3206、Cphy3207、Cphy3208、Cphy3209、Cphy3210、Cphy3211、Cphy3212、Cphy1448、Cphy1449、Cphy1450、Cphy1451、Cphy1132、Cphy1133、Cphy1134、Cphy1528、Cphy1529、Cphy1530、Cphy1531和Cphy1532。

    己糖和戊糖的发酵由包括NAD(P)依赖的乙醛脱氢酶(Ald)和NAD依赖的乙醇脱氢酶(Adh)的酶催化将乙酰辅酶A还原为乙醇而结束。C.phytofermentans基因组包含编码至少7个Ald(PutA域)和至少6个Adh,例如,在Cphy3925(包含Ald和Adh域)处编码的假定蛋白的假定基因。4个Ald和3个Adh由三个簇:Cphy1173-1183;Cphy1411-1430和Cphy2634-2650中的基因编码。

    涉及丙醇生产、乙醇胺和/或丙二醇新陈代谢的基因

    本文中描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及丙醇生产乙醇胺和/或丙二醇新陈代谢的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及丙醇生产、乙醇胺和/或丙二醇新陈代谢的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。

    C.phytofermentans包含似蛋白质的微室(microcompartment)(“PMC”),所述微室没有在其它相似生物技术目标的细菌,如C.cellulolyticum、C.thermocellum、C.acetobutylicum和C.beijinrincki中发现。这些微室已经通过电子显微镜观察到。涉及碳水化合物转化成乙醇的具体酶限制在这些微室,暗示了具体途径的划分和更大的代谢效率(Conrado,R.J.,Mansell,T.J.,Varner,J.D.& DeLisa,M.P.Stochastic reaction- diffusion simulation of enzyme compartmentalization reveals improved catalytic efficiency for a synt

    C.phytofermentans中三个基因座编码限制在似蛋白质室的蛋白。这些似蛋白质室与涉及二氧化碳固化及在其它生物中发现的乙醇胺和丙二醇的利用的似蛋白质室相似。每一个基因座包括用于将五碳糖和乙醇脱氢酶转化成初级乙醇的酶。

    C.phytofermentans中鉴定的7个Ald和6个Adh中,4个Ald和3个Adh被限制在似蛋白质微室。限制在似蛋白质微室的Adh显示与Fe-Adh或Zn-Adh的序列一致性,并且由三个簇的基因:Cphy1173-1183;Cphy1411-1430和Cphy2634-2650编码。

    许多限制在似蛋白质微室的酶可能涉及岩藻糖至丙醇途径,以及乙醇胺和丙二醇的新陈代谢。例如,Cphy2634-2650簇包含涉及Salmonella typhimurium中乙醇胺新陈代谢的基因的直系同源物,Cphy1411-1430簇包含Salmonella typhimurium中编码与丙二醇利用操纵子功能相关的产物的基因。

    此外,Cphy1173-1187簇包含与在Roseburia inulinovorans中发现的微室同源的基因(Scott,K.P.,Martin,J.C,Campbell,G.,Mayer,C.D.& Flint,H.J.Whole-genome transcription profiling reveals genes up-regulated by growth on fucose in the human gut bacterium Roseburia inulinivorans.J.Bacteriol.188,4340-4349(2006))和编码涉及岩藻糖和鼠李糖利用的假定酶的基因(见图14和15)。被鉴定为在岩藻糖上生长时上调或除此被预测涉及岩藻糖利用的其它基因包括Cphy0578、Cphy0579、Cphy0580、Cphy0581、Cphy0582、Cphy0583、Cphy0584、Cphy1146、Cphy1147、Cphy1148、Cphy1149(图15)。

    氢生产

    本文中描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及氢生产的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及氢生产的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。

    氢可以由多种糖的发酵而产生。在一些实施方式中,多核苷酸可以包括编码在C.phytofermentans中鉴定的铁氧还原蛋白氢化酶的核酸。编码在C.phytofermentans中鉴定的铁氧还原蛋白氢化酶的基因的例子包括Cphy0087、Cphy0090、Cphy0092、Cphy2056、Cphy3805、Cphy3798。

    多模块多糖裂解酶

    本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及果胶水解的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及果胶水解的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。编码涉及果胶水解的酶/蛋白域的基因的例子包括基因座Cphy1612的基因。所述Cphy1612基因座编码预测的PL1和PL9域。PL1包括果胶酸裂解酶(EC 4.2.2.2);外切果胶酸裂解酶(EC 4.2.2.9);和果胶裂解酶(EC 4.2.2.10)域。PL9包括果胶酸裂解酶(EC 4.2.2.2)和外切聚半乳糖醛酸裂解酶(EC 4.2.2.9)域。

    多模块木聚糖酶和酯酶

    本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码包含木聚糖酶和酯酶活性的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包括在C.phytofermentans中鉴定的编码包括木聚糖酶和酯酶活性的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。编码包括木聚糖酶和酯酶活性的酶/蛋白域的基因例子包括在Cphy3862基因座处的基因。所述Cphy3862基因座包括3个预测域,即,两个GH10域和一个CE15域,具有以下活性:GH10具有木聚糖酶(EC3.2.1.8)活性;GH10具有内切-1,3-木聚糖酶(EC 3.2.1.3)活性,以及CE15具有葡糖醛酸酯酶(EC 3.1.1-)和4-O-甲基葡糖醛酸酯酶(EC3.1.1-)活性。

    海带多糖利用

    本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及层粘连蛋白利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及层粘连蛋白利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。海带多糖是在褐藻中发现的存储葡聚糖(葡萄糖的多糖)。被鉴定在海带多糖上生长时上调的基因例子包括Cphy0857、Cphy0858、Cphy0859、Cphy0860、Cphy0861、Cphy0862、Cphy0863、Cphy0864、Cphy0865和Cphy3388(见图16)。

    纤维二糖利用

    本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及纤维二糖利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及纤维二糖利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。纤维二糖是二糖,源于以β(1→4)键连接的两个葡萄糖分子的缩合。被鉴定在纤维二糖上生长时上调的基因例子包括Cphy0430、Cphy2464、Cphy2465、Cphy2466和Cphy2467(见图17)。

    纤维素利用

    本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及纤维素利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及纤维素利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。被鉴定在纤维素上生长时上调或除此被预测涉及纤维素利用的基因例子包括Cphy3367、Cphy3368、Cphy1163、Cphy3202、Cphy3160、Cphy0430、Cphy3854、Cphy3855、Cphy3857、Cphy3858、Cphy3859、Cphy3860、Cphy3861、Cphy3862、Cphy2569、Cphy2570、Cphy2571、Cphy2464、Cphy2465、Cphy2466、Cphy2467、Cphy1528、Cphy1529、Cphy1530、Cphy1531和Cphy1532。

    果胶利用

    本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及果胶利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及果胶利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。被鉴定在果胶上生长时上调的基因例子包括Cphy3585、Cphy3586、Cphy3587、Cphy3588、Cphy3589、Cphy3590、Cphy2262、Cphy2263、Cphy2264、Cphy2265、Cphy2266、Cphy2267、Cphy2268、Cphy2269、Cphy2272、Cphy2273、Cphy2274、Cphy2275、Cphy2276、Cphy2464、Cphy2465、Cphy2466、Cphy2467、Cphy1714、Cphy1715、Cphy1716、Cphy1717、Cphy1718、Cphy1719、Cphy1720、Cphy3153、Cphy3154、Cphy3155、Cphy2010、Cphy2011、Cphy1174、Cphy1175、Cphy1176、Cphy1177、Cphy1178、Cphy1179、Cphy1180、Cphy1181、Cphy1182、Cphy1183、Cphy1929、Cphy1612、Cphy0218、Cphy0219、Cphy0220、Cphy3160和Cphy2919。

    在果胶上生长时上调的基因和被预测涉及鼠李糖半乳糖醛酸聚糖-I的阿拉伯半乳聚糖侧链的分解和转运的基因包括Cphy3585、Cphy3586、Cphy3587、Cphy3588、Cphy3589和Cphy3590。在果胶上生长时上调的基因和被预测涉及鼠李糖半乳糖醛酸聚糖-I或鼠李糖半乳糖醛酸聚糖-II侧链的分解和转运的基因包括Cphy2262、Cphy2263、Cphy2264、Cphy2265、Cphy2266、Cphy2267、Cphy2268、Cphy2269、Cphy2272、Cphy2273、Cphy2274、Cphy2275、Cphy2276、Cphy1714、Cphy1715、Cphy1716、Cphy1717、Cphy1718、Cphy1719和Cphy1720。在果胶上生长时上调的基因和被预测涉及糖转运的基因包括Cphy2464、Cphy2465、Cphy2466和Cphy2467。被预测涉及聚半乳糖醛酸的分解和转运的基因包括Cphy0288、Cphy0289、Cphy0290、Cphy0291、Cphy0292和Cphy0293。被预测涉及鼠李糖半乳糖醛酸聚糖裂解和转运的基因包括Cphy0339、Cphy0340、Cphy0341、Cphy0342、Cphy0343。被预测涉及鼠李糖转运和分解的基因包括Cphy0578、Cphy0579、Cphy0580、Cphy0581、Cphy0582、Cphy0583、Cphy0584、Cphy1146、Cphy1147、Cphy1148和Cphy1149。在果胶上生长时上调的基因和/或被预测涉及岩藻糖转运和分解的基因包括Cphy3153、Cphy3154、Cphy3155、Cphy2010、Cphy2011和Cphy2012。在果胶上生长时上调的基因和/或被预测涉及岩藻糖和鼠李糖新陈代谢的基因包括Cphy1174、Cphy1175、Cphy1176、Cphy1177、Cphy1178、Cphy1179、Cphy1180、Cphy1181、Cphy1182、Cphy1183、Cphy1184、Cphy1185、Cphy1186和Cphy1187。

    在果胶上生长时上调的基因和/或被预测涉及聚半乳糖醛酸利用的基因包括Cphy2919、Cphy0288、Cphy0289、Cphy0290、Cphy0291、Cphy0292、Cphy0293、Cphy3308、Cphy3309、Cphy3310、Cphy3311、Cphy3312、Cphy3313、Cphy3314、Cphy3315、Cphy3316、Cphy3317、Cphy1118、Cphy1119、Cphy1120、Cphy1121、Cphy1879、Cphy1880、Cphy1881、Cphy1882、Cphy1883、Cphy2736、Cphy2737、Cphy2738、Cphy2739、Cphy2740、Cphy2741、Cphy2742和Cphy2743。

    鉴定C.phytofermentans中的核酸序列

    本文描述的一些实施方式涉及鉴定C.phytofermentans中的基因的方法。这些方法可以包括鉴定核酸序列,所述核酸序列包含编码序列、非编码序列、调节序列、基因间序列、操纵子或基因簇。在一些实施方式中,鉴定C.phytofermentans中基因的方法可以包括基因组和/或微列阵分析。

    在一些实施方式中,C.phytofermentans中的基因可以通过与另一序列的基因相似性来鉴定。可以在多核苷酸序列或多肽序列之间检测相似性。在一些实施方式中,另一序列可以是存在于另一生物中的序列。其它生物的例子包括Clostridia的不同种,例如C.beijerinckii或C.acetobutylicum;或者不同属的生物,例如Bacillus subtili。

    在一些实施方式中,相似性可以作为百分比一致性测量。百分比序列一致性可以是两个或多个多肽序列或两个或多个多核苷酸序列之间的关系,通过比较序列而测定。在更多实施方式中,序列一致性可以是多肽或多核苷酸序列之间的序列关联度,视情况可以是通过这样序列系列之间的匹配而测定。典型地,序列一致性和序列相似性可以容易地通过已知方法计算,包括但不限于以下描述的那些:Computational Molecular Biology(Lesk,A.M.,ed.)Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.,ed.)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.,eds.)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.,eds.)Stockton Press,NY(1991)。检测序列一致性的方法可以被设计为给出被检测序列之间的最好匹配。一些检测序列一致性和序列相似性的方法被编辑成公众可用的计算机程序。序列比对和百分比一致性计算可以使用LASERGENE生物信息计算软件的Megalign程序(DNASTAR Inc.,Madison,Wis.)实现。序列的多重比对可以使用具有默认参数(GAP PENALTY=10,GAP LENGTH PENALTY=10)的比对的Clustal方法(Higgins和Sharp(1989)CABIOS.5:151-153)实现。使用Clustal方法的成对比对的默认参数是KTUPLE 1,GAP PENALTY=3,WIND0W=5和DIAGONALS SAVED=5。

    在其它实施方式中,在C.phytofermentans中的基因可以通过使用本领域已知的算法预测基因在核酸序列和/或假定的翻译的多肽序列中的存在而鉴定。例如,可以使用程序中的计算机算法,如GeneMarkTM(Besemer,J.和M.Borodovsky.2005.GeneMark:web software for gene finding in prokaryotes,eukaryotes and viruses.Nucleic Acids Res 33:W451-4)和Glimmer(Delcher,A.L.,K.A.Bratke,E.C.Powers和S.L.Salzberg.2007.Identifying bacterial genes and endosymbiont DNA with Glimmer.Bioinformatics 23:673-9)。

    在一些实施方式中,可以使用计算机算法或软件程序分析核苷酸或氨基酸序列。在相关的实施方式中,序列分析软件可以是商业上可用的或独自开发的。序列分析软件的例子包括程序的GCG软件(Wisconsin Package Version 9.0,Genetics Computer Group(GCG),Madison,Wis.)、BLASTP,BLASTN,BLASTX(Altschul等,J.MoI.Biol.215:403-410(1990),和DNASTAR(DNASTAR,Inc.1228 S.Park St.Madison,Wis.53715 USA),和包含Smith-Waterman算法的FASTA程序(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date 1992,111-20.Editor(s):Suhai,Sandor.Publisher:Plenum,New York,N.Y.)。典型地,可以使用程序的默认值,例如,在软件第一次初始化时原始装载的一系列值或参数。

    在其它实施方式中,可以使用保守蛋白域和蛋白家族的数据鉴定C.phytofermentans中的基因。例如,美国国家生物技术信息中心(NCBI)的保守域数据库(CDD)包括几个数据库,包括审核的NCBI保守域、SMART(smart.embl-heidelberg.de/SMART)、PFAM(可以从互联网sanger.ac.uk/Software/Pfam/PFAM上获得使用)和COGS(在完整基因组中编码的蛋白的系统分类)。

    在一些实施方式中,可以鉴定基因和可以预测由所述基因编码的假定蛋白的新陈代谢途径。在这样的实施方式中,可以使用新陈代谢途径数据库。例如,基因和基因组的京都百科全书(KEGG),其中KEGG自动注解服务器(可从互联网genome.jp/kegg/kaas/上获得使用)可以使用与KEGG GENES数据进行BLAST比较对已鉴定的基因提供功能注解。

    从C.phytofermentans中分离核酸序列

    可以使用本领域已知的技术从C.phytofermentans基因组中克隆核酸序列。例如,可以使用的重组DNA和分子克隆技术由以下描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989);和Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.,Experiments with Gene Fusions,Cold Spring Harbor Laboratory Cold Press Spring Harbor,N.Y.(1984);和Ausubel,F.M.等,Current Protocols in Molecular Biology,由Greene Publishing Assoc和Wiley-Interscience出版(1987)。此外,使用依赖序列方案分离同源或直系同源基因的方法是本领域已知的。依赖序列方案的例子包括但不限于:核酸杂交方法,和由核酸扩增技术的多种应用例示的DNA和RNA扩增方法,如聚合酶链式反应(PCR;Mullis等,U.S.Pat.4,683,202)、连接酶链式反应(LCR;Tabor,S.等,Proc.Acad.Sci.USA 82,1074,(1985))或链置换扩增(SDA;Walker等,Proc.Natl.Acad.Sci.U.S.A.,89,392,(1992))。

    典型地,在PCR类型扩增技术中,引物具有不同序列并且互相不互补。依赖于需要的检测条件,引物序列应当被设计成对目标核酸提供有效和可靠的复制。PCR引物设计的方法是本领域常规和已知的(Thein and Wallace,″The use of oligonucleotide as specific hybridization probes in the Diagnosis of Genetic Disorders″,in Human Genetic Diseases:A Practical Approach,K.E.Davis Ed.,(1986)33-50页IRL Press,Herndon,Va.;Rychlik,W.(1993)In White,B.A.(ed.),Methods in Molecular Biology,15卷,31-39页,PCR Protocols:Current Methods and Applications.Humania Press,Inc.,Totowa,N.J.)。

    通常,已鉴定序列的两个短片段可以在PCR方案中使用以从DNA或RNA扩增更长的编码同源基因的核酸片段。所述PCR可以在一库已克隆核酸片段中实施,其中一条引物序列源于已鉴定的核酸序列,另一条引物序列源于编码微生物基因的mRNA前体的特有的3’聚腺苷酸片段。可选地,所述第二条引物序列可以基于源自克隆载体的序列。例如,RACE方案(Frohman等,PNAS USA 85:8998(1988))提供了一种使用PCR产生cDNA的方法以扩增转录本单一位点和3’或5’末端之间区域的拷贝。在3’或5’方向定向的引物可以从已鉴定的序列设计。使用商业可用的3’RACE或5’RACE系统(BRL),特异的3’或5’cDNA片段可以被分离(Ohara等,PNAS USA 86:5673(1989);Loh等,Science 243:217(1989))。

    在一些实施方式中,可以通过使用一部分已鉴定核酸作为DNA杂交探针筛选C.phytofermentans DNA文库分离已鉴定的核酸序列。探针的例子可以包括通过如随机引物DNA标记、缺口翻译或末端标记技术方法标记的DNA探针,和通过如体外转录系统方法产生的RNA探针。此外,可以设计和使用特异的寡聚核苷酸以扩增部分或全长的即时序列。得到的扩增产物可以在扩增反应中直接标记或在扩增反应后标记,并可以作为探针使用以在适当严格的条件下分离全长DNA片段。

    在一些实施方式中,分离的核酸被克隆至载体。典型地,载体具有在宿主微生物中复制的能力。已知有多种载体,例如,噬菌体、质粒、病毒或它们的杂交体。载体可以在被选择的宿主细胞中作为克隆载体或表达载体操作。典型地,载体包含分离的核酸、可选择标记和允许自动复制或染色体整合的序列。更多实施方式可以包含驱动分离的核酸表达的启动子序列、增强子或终止序列。在其它实施方式中,载体可以包含允许序列删除随后整合至载体序列的染色体DNA的序列。例子包括loxP序列或FRT序列,这些序列分别对CRE重组酶和FLP重组酶反应。

    多核苷酸、多核苷酸盒、表达盒和表达载体

    本文描述的一些实施方式涉及用于在重组微生物中生产燃料或其它产物的多核苷酸、多核苷酸盒、表达盒和表达载体。

    多核苷酸盒可以包含至少一种目标多核苷酸。在一些实施方式中,多核苷酸盒可以包含多于一种目标多核苷酸。例如,多核苷酸盒可以包含两种或多种、三种或多种或任何数量本文描述的目标基因和/或多核苷酸。

    在一些实施方式中,目标多核苷酸可以包括一种或多种本文描述的在C.phytofermentans中鉴定的核酸。在一些实施方式中,目标多核苷酸可以与C.phytofermentans中鉴定的一种或多种基因具有至少50%、55%、60%、65%、70%、80%、85%、90%、95%、96%、97%、98%、99%和100%的一致性。在其它实施方式中,目标多核苷酸可以编码一种或多种包含对野生型蛋白保守取代的蛋白。在更多实施方式中,目标多核苷酸可以编码一种或多种包含改变蛋白生产燃料的效能的取代的蛋白。例如,可以使编码酶的蛋白更有效地催化反应。

    如本文使用的,表达盒可以是可操作地连接至调控序列如启动子的目标多核苷酸。适于本发明的启动子包括表达目标多核苷酸的任何启动子。在一些实施方式中,所述启动子可以是在C.phytofermentans中鉴定的启动子序列。在一些实施方式中,所述启动子可以是在宿主生物中鉴定的启动子序列。在一些实施方式中,所述启动子可以是诱导型的启动子,例如,光诱导启动子或温度敏感型启动子。在其它实施方式中,所述启动子可以是组成型启动子。在一些实施方式中,可以基于目标多核苷酸在宿主微生物中期望的表达水平选择启动子。在一些实施方式中,所述启动子可以被置于距异源转录起始位点与其在自然情况下距转录起始位点大约同样的距离。但是,如本领域已知的,可以在不失去启动子功能的情况下可以允许这个距离的一些变化。在其它实施方式中,表达盒可以进一步包含调控序列如增强子和/或终止序列。

    可以选择和在载体中(如pIMPCphy)使用启动子元件。例如,转录调节序列可操作地连接至目标基因(如在表达构建体中)。所述启动子可以是任何系列的DNA序列,所述DNA序列与细胞转录因子特异地相互作用以调节下游基因的转录。具体启动子的选择依赖表达目标蛋白使用的细胞类型。通常,有用的转录调节序列是来自宿主微生物的序列。在多种实施方式中,选择组成型或诱导型启动子在宿主细胞中使用。取决于宿主细胞,已知可能有几百种组成型和诱导型启动子并可以被设计在宿主细胞中起作用。

    启动子可以是任何系列的DNA序列,所述DNA序列与细胞转录因子特异地相互作用以调节下游基因的转录。具体启动子的选择依赖表达目标蛋白使用的细胞类型。转录调节序列可以是来自宿主微生物的那些。在多种实施方式中,可以选择在宿主细胞中使用的组成型或诱导型启动子。取决于宿主细胞,已知可能有几百种组成型和诱导型启动子并可以被设计在宿主细胞中起作用。

    在一些例子中,可以利用在重组技术中广泛使用的启动子,例如,Escherichia coli lac和trp操纵子、tac启动子、噬菌体pL启动子、噬菌体T7和SP6启动子、β-肌动蛋白启动子、胰岛素启动子、杆状病毒多角体蛋白和p10启动子。

    在其它实例中,可以使用组成型启动子。组成型启动子非限制性的例子包括λ噬菌体的int启动子、pBR322的β-内酰胺酶基因序列的bla启动子、梭菌属中的hydA或thlA、Streptomyces coelicolor hrdB或whiE、pPR325的氯霉素乙酰转移酶基因序列的CAT启动子、葡萄球菌的组成型启动子blaZ等等。

    用于本发明的启动子同样可以是在控制的方式下(如在细胞培养的特定条件下)调节下游基因表达的诱导型启动子。诱导型的原核启动子的例子包括噬菌体的较大右启动子和左启动子,E.coli的trp、recA、lacZ、AraC和gal启动子,Bacillus subtilis的α-淀粉酶(Ulmanen Ett at.,J.Bacteriol.162:176-182,1985)和σ-D-特异启动子(Gilman等,Gene sequence 32:11-20(1984)),Bacillus的噬菌体启动子(Gryczan,In:The Molecular Biology of the Bacilli,Academic Press,Inc.,NY(1982))、链霉菌启动子(Ward et at.,MoI.Gen.Genet.203:468-478,1986)等等。典型的原核启动子由Glick(J.Ind.Microtiot.1:277-282,1987)、Cenatiempo(Biochimie 68:505-516,1986)和Gottesrnan(Ann.Rev.Genet.18:415-442,1984)综述。

    在某些培养环境下组成型活跃的启动子可能在其它条件下不活跃。例如,来自Clostridium acetobutylicum的hydA基因的启动子,已知由环境pH调节表达。此外,同样已知并可以利用温度调节的启动子。因此,在一些实施方式中,取决于期望的宿主细胞,pH调节的或温度调节的启动子可以与本发明的表达构建体一起使用。已知其它pH可调节的启动子,如在美国专利申请号2002-0137140中公开的在乳酸细菌中起作用的P170。

    通常,为有效表达期望的基因/核苷酸序列,可以使用多种启动子,如基因的原始启动子、抗菌素抗性基因(如Tn5的卡那霉素抗性基因、pBR322的氨苄青霉素抗性基因)的启动子、λ噬菌体的启动子和可以在宿主细胞中起作用的任何启动子。为了表达,其它调节元件,如包含在宿主细胞中可操作的天然和合成序列的Shine-Dalgarno(SD)序列和在宿主细胞(编码序列将引入宿主细胞中以提供本发明的重组细胞)中可操作的转录终止子(包含任何天然和合成序列的反向重复结构)可以与上述的启动子一起使用。

    可与与本发明的产品和方法一起使用的启动子的例子包括在以下专利文件中公开的那些:US 2004/0171824、US 6,410,317、WO 2005/024019。几个启动子-操纵基因系统,如lac(D.V.Goeddel等,″Expression in Escherichia coli of Chemically Synthesized Genes for Human Insulin,″Proc.Nat.Acad.Sci.U.S.A.,76:106-110(1979))、trp(J.D.Windass等,″The Construction of a Synthetic Escherichia coli Trp Promoter and Its Use In the Expression of a Synthetic Interferon Gene″,Nucl.Acids.Res.,10:6639-57(1982))和λPL操纵子(R.Crowl等,″Versatile Expression Vectors for High-Level Synthesis of Cloned Gene Products in Escherichia coli″,Gene,38:31-38(1985))存在于E.coli中,并已经用于重组细胞中基因表达的调节。相应的调节基因分别是lac阻遏物、trpR和cI阻遏物。

    阻遏物是特异结合至具体操纵基因的蛋白分子。例如,lac阻遏物分子结合lac启动子-操纵基因系统的操纵基因,而cro阻遏物结合λPR启动子的操纵基因。阻遏物和操纵基因的其它组合是本领域已知的。见,如J.D.Watson等,Molecular Biology Of The Gene,373页(第4版,1987)。由阻遏物和操纵基因形成的结构阻碍了相关启动子与RNA聚合酶的有益相互作用,因此阻止转录。其它分子,定义为诱导子,结合阻遏物,因此阻止阻遏物结合它的操纵基因。因此,由阻遏物分子引起的蛋白表达的抑制可以通过降低阻遏物浓度或通过用诱导子中和阻遏物而逆转。

    类似的启动子-操纵基因系统和诱导子在其它微生物中已知。在酵母中,GAL10和GAL1启动子被细胞外葡萄糖抑制并由添加半乳糖(诱导子)激活。蛋白GAL80是系统的阻遏物,而GAL4是转录激活剂。GAL80结合半乳糖阻止GAL80结合GAL4。然后,GAL4可以结合上游激活序列(UAS)激活转录。见Y.Oshima,″Regulatory Circuits for Gene Expression:The Metabolisms Of Galactose And Phosphate″in The Molecular Biology Of The Yeast Sacharomyces,Metabolism And Gene Expression,J.N.Strathern等合编(1982)。

    在PHO5启动子控制下的转录由细胞外无机磷酸抑制,当磷酸耗尽时其被诱导至高水平。R.A.Kramer and N.Andersen,″Isolation of Yeast Genes with mRNA Levels Controlled By Phosphate Concentration,″Proc.Nat.Acad.Sci.U.S.A.,77:6451-6545(1980)。许多PHO5表达的调节基因已经被鉴定,包括一些涉及磷酸调节的调节基因。

    Matα2是酵母中温度调节的启动子系统。在这个系统中已经鉴定了阻遏物蛋白、操作基因和启动子位点。A.Z.Sledziewski等,″Construction Of Temperature-Regulated Yeast Promoters Using The Matα2 Repression System,″Bio/Technology,6:411-16(1988)。

    酵母中另一个阻遏物系统的例子是CUP1启动子,其可以被Cu2+离子诱导。所述CUP1启动子由金属硫蛋白调节。J.A.Gorman等,″Regulation of The Yeast Metallothionine Gene,″Gene,48:13-22(1986)。

    相似地,为获得一种或多种纤维素酶期望的表达,可以在本发明的产物或方法中使用更高拷贝数的质粒。可以通过染色体整合期望的基因而制备构建体。染色体整合外源基因能够比基于质粒的构建体提供几个优势,后者在商业过程中具有一些限制。产乙醇基因已经被整合至E.coli B染色体中,见Ohta等(1991)Appl.Environ.Microbiol.57:893-9。通常,这通过DNA片段的纯化完成,所述DNA片段包含(1)抗生素抗性基因上游的期望基因和(2)来自目标微生物的同源DNA片段。该DNA可以被连接成环状,没有复制子,并被用于转化。因此,目标基因可以被引入异源宿主如E.coli中,短随机片段可以被分离并可操作地连接目标基因(如编码纤维素酶的基因)以促进同源重组。

    表达载体

    表达载体可以包括本文描述的任何表达盒,并典型地包括在宿主细胞中表达一种或多种目标多核苷酸所需要的所有元件。在一些实施方式中,目标多核苷酸被引入至载体中以产生适于宿主细胞转化的重组表达载体以在重组微生物中生产燃料。在其它实施方式中,表达盒可以被引入至载体中以产生适于宿主细胞转化的重组表达载体。在一些实施方式中,提供包含一种或多种表达盒的表达载体。

    表达载体可以独立复制,或者它们可以通过被插入至宿主细胞基因组中复制。在一些实施方式中,表达盒可以是同源整合至宿主细胞基因组中。在其它实施方式中,所述基因可以是非同源整合至宿主细胞基因组中。在一些实施方式中,所述表达盒可以通过双倍同源重组整合至期望的基因座中。

    在一些实施方式中,期望载体在多于一种的宿主细胞中都可以使用。例如,载体可以用于在E.coli中克隆及在梭菌属种中表达。这样的载体将典型地包括E.coli复制起点和与梭菌属或其它革兰氏阳性菌相容的起点。已经知道几个E.coli和革兰氏阳性质粒复制起点。所述载体的其它元件可以包括,例如,选择性标记如卡那霉素抗性或氨苄青霉素抗性,其使得可以检测和/或选择转化有期望的多核苷酸序列的那些细胞。典型的梭菌穿梭载体在Mauchline等(1999):Clostridia:Manual of Industrial Microbiology and Biotechnology,AL Demain和JE Davies合编,(ASM出版),475-492页;和Heap等,J.Microbiol.Methods,78:79-85(2009)中描述。

    在一些实施方式中,所述表达载体可以包括一种或多种基因,它们的存在和/或表达使得宿主细胞对经济相关的乙醇浓度有耐受性。例如,基因如omrA、lmrA和lmrCD可以包括在表达载体中。来自酒乳酸菌Oenococcus oeni的OmrA和它的同源物,来自Lactococcus lactis的LmrA已经显示出增加tolC(-)E.coli的相对抗性100至10000倍(Bourdineaud等,A bacterial gene homologous to ABC transporters protect Oenococcus oeni from ethanol and other stress factors in wine.Int.J.Food Microbiol.2004年4月1日;92(1):1-14)。因此,合并omrA、lmrA和其它同源物可能有益于增加宿主细胞的乙醇耐受性。

    在一些实施方式中,本文提供的载体可以包括一种或多种容易靶向整合至宿主生物基因组的基因组核酸片段。用于靶向整合的基因组核酸片段可以是大约10个核苷酸至大约20000个核苷酸长。在一些实施方式中,用于靶向整合的基因组核酸片段可以是大约1000至大约10000个核苷酸长。在其它实施方式中,用于靶向整合的基因组核酸片段是大约1kb至大约2kb长。在一些实施方式中,当目标基因被克隆至邻近DNA的非编码区时,“邻近”片的核基因组核酸可以被分离成两侧翼片。这使得通过双交换重组将介入的核酸区整合至细菌染色体中。在其它实施方式中,所述侧翼片可以包括彼此不邻近的核的核酸序列片段。在一些实施方式中,在核基因组中,第一个侧翼基因组核酸片段定位于距离第二个侧翼基因组核酸片段大约0至大约10000个碱基对。

    在一些实施方式中,基因组核酸片段可以被引入至载体以产生用于将本文公开的任何表达盒靶向整合至宿主生物的核基因组中的骨架表达载体。可以使用任何本领域已知的多种引入核酸序列的方法。例如,可以使用合适的引物和PCR从分离的核基因组核酸中扩增核酸片段。然后可以通过例如连接将上述扩增产物引入任何多种合适的克隆载体中。一些有用的载体包括,例如但不限于:pGEM13z、pGEMT和pGEMTEasy(Promega,Madison,WI);pSTBluel(EMD Chemicals Inc.San Diego,CA);和pcDNA3.1、pCR4-TOPO、pCR-TOPO-II、pCRBlunt-II-TOPO(Invitrogen,Carlsbad,CA)。在一些实施方式中,至少一种来自核的核酸片段被引入至载体中。在其它实施方式中,两种或多种来自核的核酸片段被引入至载体中。在一些实施方式中,两种核酸片段可以在载体中互相邻近。在一些实施方式中,被引入至载体中的两种核酸片段可以通过例如大约1至30个碱基对分开。在一些实施方式中,分离两种核酸片段的序列可以包含至少一种限制性内切核酸酶识别位点。

    在多种实施方式中,调节序列可以包括在本发明的载体中。在一些实施方式中,调节序列包含用于调节引入至核基因组中的基因(如目标基因)表达的核酸序列。在多种实施方式中,调节序列可以被引入至骨架表达载体中。例如,可以从宿主微生物基因组中鉴定多种调节序列。所述调节序列可以包含例如核基因的启动子、增强子、内含子、外显子、5’UTR、3’UTR或任何上述序列的任何部分。使用标准的分子生物学技术,所述调节序列可以被引入至期望的载体中。在一些实施方式中,所述载体包括克隆载体或包含用于靶向整合的核酸片段的载体。

    在一些实施方式中,用于调节引入至核基因组中的基因表达的核酸序列可以通过PCR扩增一种或多种基因的5’UTR、3’UTR、启动子和/或增强子、或它们的一部分、一种或多种核基因被引入至载体中。使用合适的PCR循环条件,位于被扩增序列侧翼的引物被用于扩增调节序列。在一些实施方式中,所述引物可以包括任何多种限制性酶的识别序列,因此将那些识别序列引入至PCR扩增产物中。所述PCR产物可以用合适的限制性酶消化并引入至载体的相应位点。

    在其它实施方式中,可以使用商业上可利用的系统或相似方法将被表达的一种或多种基因整合至微生物基因组中。已经证明了这些方法对Clostridia的适用性,包括外源基因在梭菌属细胞中的整合和表达(见,如Heap等(2007).J.Microbiol.Methods.70:452-464;Chen等(2007).Plasmid.58:182-189)。

    微生物宿主

    一些实施方式涉及包含本文描述的任何多核苷酸、多核苷酸盒、表达盒或表达载体的微生物。宿主细胞可以包括但不限于:真核细胞如动物细胞、昆虫细胞、真菌细胞和酵母及原核细胞如细菌。在一些实施方式中,所述宿主是C.phytofermentans。在一些实施方式中,可能的宿主微生物可以包括重组生物。

    在一些实施方式中,所述重组微生物可以是水解纤维素微生物或糖分解微生物。在一些实施方式中,所述微生物可以是Clostridium cellulovorans、Clostridium cellulolyticum、Clostridium thermocellum、Clostridium josui、Clostridium papyrosolvens、Clostridium cellobioparum、Clostridium hungatei、Clostridium cellulosi、Clostridium stercorarium、Clostridium termitidis、Clostridium thermocopriae、Clostridium celerecrescens、Clostridium polysaccharolyticum、Clostridium populeti、Clostridium lentocellum、Clostridium chartatabidum、Clostridium aldrichii、Clostridium herbivorans、Acetivibrio cellulolyticus、Bacteroides cellulosolvens、Caldicellulosiruptor saccharolyticum、Ruminococcus albus、Ruminococcus flavefaciens、Fibrobacter succinogenes、Eubacterium cellulosolvens、Butyrivibrio fibrisolvens、Anaerocellum thermophilum、Halocella cellulolytica、Thermoanaerobacterium thermosaccharolyticum或Thermoanaerobacterium saccharolyticum。

    在一些实施方式中,可以从例如更多种类的革兰氏阴性菌如Xanthomonas种和革兰氏阳性菌中选择宿主微生物,所述革兰氏阳性菌包括Bacillus属的成员如B.pumilus、B.subtilis和B.coagulans;Clostridium属成员如C.acetobutylicum、C.aerotolerans、C.thermocellum、C.thermohydrosulfuricum和C.thermosaccharolyticum;Cellulomonas种如Cellulomonas uda;和Butyrivibrio fibrisolvens。除了E.coli,可以使用其它肠道细菌,例如Erwinia属如E.chrysanthemi,和Klebsiella属如K.planticola和K.oxytoca。在一些实施方式中,所述宿主微生物可以是Zymomonas mobilis。类似的可接受的宿主生物是多种酵母,典型的是Cryptococcus的种如Cr.Albidus,Monilia的种Pichia stipitis和Pullularia pullulans,和Saccharomyces cerevisiae;和其它寡聚糖代谢细菌,包括但不限于Bacteroides succinogenes,Thermoanaerobacter种如T.ethanolicus,Thermoanaerobium种如T.brockii,Thermobacteroides种如T.acetoethylicus和Ruminococcus属的种(例如R.flavefaciens)、Thermonospora属的种(如T.fusca)和Acetivibrio属的种(如A.cellulolyticus)。在一些实施方式中,宿主生物可选自例如藻类,如Amphora、Anabaena、Anikstrodesmis、Botryococcus、Chaetoceros、Chlorella、Chlorococcum、Cyclotella、Cylindrotheca、Dunaliella、Euglena、Hematococcus、Isochrysis、Monoraphidium、Nannochloris、Nannnochloropsis、Navicula、Nephrochloris、Nephroselmis、Nitzschia、Nodularia、Nostoc、Oochromonas、Oocystis、Oscillartoria、Pavlova、Phaeodactylum、Playtmonas、Pleurochrysis、Porhyra、Pseudoanabaena、Pyramimonas、Stichococcus、Synechococcus、Tetraselmis、Thalassiosira、Trichodesmium。涉及满足该主题标准的微生物的文献,例如在Biely,Trends in Biotech.3:286-90(1985),在Robsen等,Enzyme Microb.Technol.11:626-44(1989),和在Beguin Ann.Rev.Microbiol.44:219-48(1990)中反映,它们中的每一篇的全部通过引用的方式结合至本文。合适的转化方法学对于每一种这些不同类型的宿主都是可用的并在下文详细描述。同样见如Brat等,Appl.Env.Microbiol.29;75:2304-2311,公开了木糖异构酶在Saccharomyces cerevisiae中的表达。

    在一些实施方式中,宿主微生物可以通过如它生产将寡聚糖转运至细胞中所必需的蛋白的能力和它的细胞内代谢那些寡聚糖的酶的水平而选择。这样的微生物的例子包括肠内细菌如E.chrysanthemi和其它Erwinia,以及天然地生产β-木糖苷酶的Klebsiella种如K.oxytoca,以及K.planticola。一些E.coli是有希望的宿主,因为它们转运并代谢纤维二糖、麦芽糖和/或麦芽三糖。见,如Hall等,J.Bacteriol.169:2713-17(1987)。

    在一些实施方式中,可以通过筛选以测定被检测的微生物是否转运和代谢寡聚糖而选择宿主细胞。这样的筛选可以以多种方式完成。例如,可以筛选微生物以测定哪种在合适的寡聚糖培养基上生长,所述筛选被设计成选择那些不仅仅将单体转运至细胞的微生物。见,如Hall等(1987),同上。可选地,可以检测微生物的合适的细胞内酶活性,如β-木糖苷酶活性。潜在的宿主微生物的生长可以进一步被筛选乙醇耐受性、盐耐受性和温度耐受性。见Alterhum等,Appl.Environ.Microbiol.55:1943-48(1989);Beall等,Biotechnol.& Bioeng.38:296-303(1991)。

    在一些实施方式中,宿主微生物可以展现一种或多种以下特征:在乙醇浓度大约1%的乙醇中生长的能力,耐受盐水平如0.3摩尔的能力,耐受醋酸盐水平如0.2摩尔的能力,以及耐受温度如40℃的能力,和生产高水平的酶的能力,所述酶以最小蛋白酶活性有益于纤维素、半纤维素和果胶的解聚。在一些实施方式中,宿主微生物也可以包含天然木聚糖酶或纤维素酶。在一些实施方式中,在引入用于燃料生产的表达载体后,宿主可以用多种糖生产乙醇,被检测具有高于如90%的理论产量而保留一种或多种上述的有用特征。

    宿主细胞转化

    一些实施方式涉及将本文描述的任何多核苷酸、多核苷酸盒、表达盒和表达载体引入至宿主微生物细胞中的方法。这样的实施方式因此生产在多种发酵条件下培养时能够生产燃料的重组微生物。转化细胞的方法是本领域已知的并可以包括例如电转化、脂质转染、转染、结合、化学转化、注射、粒子基因枪轰击和磁泳(magnetophoresis)。磁泳使用磁泳和纳米技术构建微尺寸线形磁铁将核酸引入至细胞中(Kuehnle等,美国专利号6,706,394;2004;Kuehnle等,美国专利号5,516,670;1996)。在一些实施方式中,甲基化的质粒电转化至C.phytofermentans可以根据Mermelstein(Mermelstein等,Bio/Technology 10:190-195(1992))开发的方案实现。更多的方法可以包括结合转化。在其它实施方式中,阳性转化体可以在补充有合适的抗生素的琼脂固化的CGM上分离。

    在多种实施方式中,转化方法可以与一种或多种显现或量化核酸引入一种或多种微生物中的方法联合。此外,被教导这可以与任何显示与未改变的显型有统计学差异的方法的鉴定联合,所述统计学差异如生长、荧光性、碳代谢、异戊二烯通量或脂肪酸含量。所述转化方法同样可以与由引入的核酸的表达得来的产物的显现或量化联合。

    典型地,转化至C.phytofermentans之前,包含质粒DNA的载体可以被甲基化以防止被Clostridial内切核酸酶消化(Mermelstein和Papoutsakis.Appl.Environ.Microbiol.59:1077-1081(1993))。在一些实施方式中,甲基化可以通过phi3TI甲基转移酶实现。在更多实施方式中,质粒DNA可以被转化至包含载体pDHKM的DH10β.E.coli中(Zhao等,Appl.Environ.Microbiol.69:2831-41(2003)),所述载体携带有phi3TI甲基转移酶基因的活性拷贝。

    通常,C.phytofermentans株可以在37℃下在Clostridial生长培养基(CGM)中厌氧性生长,所述培养基补充有合适的抗生素,如40μg/ml红霉素/氯霉素或25μg/ml甲砜氯霉素(Hartmanis和Gatenbeck.Appl.Environ.Microbiol.47:1277-83(1984))。此外,C.phytofermentans株可以在37℃、FORMA SCIENTIFICTM无氧室中(THERMO FORMATM,Marietta,Ohio),100ml补充有合适抗生素的CGM的批封闭发酵中培养。

    在其它实施方式中,可以根据Hungate(Hungate,R.E.(1969).A roll tube method for cultivation of strict anaerobes.Methods Microbiol 3B,117-132.)的技术培养C.phytofermentans。培养基GS-2C可以用于富集、分离和常规培养C.phytofermentans株,并源自Johnson等的GS-2(Johnson,E.A.,Madia,A.& Demain,A.L.(1981).Chemically defined minimal medium for growth of the anaerobic cellulolytic thermophile Clostridium thermocellum.Appl Environ Microbiol 41,1060-1062)。GS-2C可以包含以下内容:6.0g/l球磨的纤维素(Leschine,S.B.& Canale-Parola,E.(1983).Mesophilic cellulolytic Clostridia from freshwater environments.Appl Environ Microbiol 46,728-737);6.0g/l酵母提取物;2.1g/l尿素;2.9g/lK2HPO4;1.5g/l KH2PO4;10.0g/l MOPS;3.0g/l柠檬酸钠二水合物;2.0g/l半胱氨酸盐酸盐;0.001g/l刃天青;pH调整至7.0。肉汤培养可以在30℃下在无O2的N2气氛中孵育。琼脂培养基的平板培养可以在室温下在N2/CO2/H2(83∶10∶7)气氛中在无氧室(Coy Laboratory Products)中孵育。

    生长、表达和燃料生产

    一些实施方式涉及利用本文描述的任何重组微生物生产燃料。在一些实施方式中,一种或多种不同重组微生物可以组合使用以生产燃料。这样的组合可以包括在单一发酵反应中多于一种不同类型的重组微生物。其它组合可以包括一种或多种不同类型的用于方法的顺序步骤中以从生物质生产燃料的重组微生物。在一些实施方式中,单一的重组微生物可以用于从生物质中生产燃料。在一些实施方式中,重组微生物可以用于催化从木质纤维素和其它底物生产产物如糖和多糖。

    在一些实施方式中,可以在适于包含在表达盒中的基因表达和适于燃料生产的条件下培养重组微生物。在一些实施方式中,孵育条件可以根据使用的宿主微生物而变化。在一些实施方式中,孵育条件可以根据与表达盒相关的调节元件的类型而变化。例如,包含含有连接至核酸的诱导型启动子的表达盒的重组微生物可能需要向培养基中添加特定试剂用于核酸表达。

    在其它实施方式中,重组微生物可以是C.phytofermentans株,用于高效率地将宽谱范围的材料发酵成燃料,如在2008年2月28日提交的同时待审的美国专利申请号2007/0178569和美国临时专利申请号61/032,048中所描述的,这两篇文献全部清楚地结合至本文。在一些实施方式中,C.phytofermentans株可以是美国模式培养物保藏所700394T。

    在一些实施方式中,用于发酵底物(如,木质纤维素给料)的过程可以包括:(1)提供预处理的包含植物多糖的生物质源材料(其中处理可以是剪切、剁碎、研磨等等);(2)在氧存在下用包含水解纤维素的厌氧微生物(如本文公开的微生物)的第一培养物接种预处理的生物质源材料以产生需氧肉汤,其中厌氧微生物能够至少部分地水解植物多糖;和(3)发酵已接种的厌氧肉汤直到部分植物多糖已经被转化至乙醇。在其它实施方式中,所述使用发酵底物的方法包括:(1)提供预处理的包含植物多糖生物质源材料(其中预处理可以是剪切、剁碎、研磨等等);(2)在氧存在下用包含水解纤维素的需氧微生物(如本文公开的微生物)的第一培养物接种预处理的生物质源材料以产生需氧肉汤,其中需氧微生物能够至少部分地水解植物多糖;(3)孵育需氧肉汤直到水解纤维素的需氧微生物消耗至少部分氧并水解至少部分植物多糖,从而将需氧肉汤转化成包含含有可发酵糖的水解产物的厌氧肉汤;(4)用包含厌氧微生物(如本文公开的微生物)的第二培养物接种厌氧肉汤,所述厌氧微生物能够将可发酵糖转化成乙醇;以及(5)发酵已接种的厌氧肉汤直到部分可发酵的糖已经被转化成乙醇。

    发酵效率可以通过多种方式测量,例如,效率变化可以通过与野生型生物比较而测量。同样,效率变化可以以每单位时间在重组生物和野生型生物之间的从底物(如纤维素)生产燃料的产量的比例而测量。在一些实施方式中,重组生物和野生型生物之间的效率变化可以是多于1%、多于5%、多于10%、多于15%、多于20%、多于25%、多于30%、多于35%、多于40%、多于45%、多于50%、多于55%、多于60%、多于65%、多于70%、多于75%、多于80%、多于85%、多于90%、多于95%、多于100%和多于200%。

    用于生长多种微生物的多种培养基是本领域已知的。生长培养基可以是最小的和/或定义的,或完全的和/或复合的。可发酵的碳源可以包括预处理的或非预处理的给料,所述给料包含纤维素材料、半纤维素材料和/或木质纤维素材料,如锯末、木屑、木浆、纸浆、纸浆废汽、草如柳枝稷、生物质植物和农作物,如海甘蓝、海藻、稻壳、甘蔗渣、黄麻、树叶、草屑、玉米杆、玉米棒子、玉米粒、玉米粉、蒸馏谷物和果胶。

    发酵反应中可以存在其它营养物,包括含氮化合物包括氨基酸、蛋白、水解蛋白、氨、尿素、硝酸盐、亚硝酸盐、大豆、大豆衍生物、酪蛋白、酪蛋白衍生物、奶粉、奶衍生物、乳清、酵母提取物、水解酵母、自溶酵母、玉米浆、玉米浸渍物、谷氨酸单钠和/或其它发酵氮源、维生素和/或矿物补充物。在一些实施方式中,一种或多种额外的更低分子量碳源可以添加或存在,如葡萄糖、蔗糖、麦芽糖、玉米糖浆、乳酸等。在一些实施方式中,一种可能形式的生长培养基可以是如Miller J.H.(1992)描述的改良的Luria-Bertani(LB)肉汤(每升具有10g Difco胰蛋白胨、5g Difco酵母提取物和5g氯化钠)。

    在有能力生产燃料的宿主细胞转化有本文描述的表达载体和重组微生物在合适的条件下生长之后可以观察到提高的燃料生产。可以通过本领域技术人员已知的标准方法观察到提高的燃料生产。

    在一些实施方式中,本文公开的重组微生物的生长和生产可以在常规的分批发酵、补料分批发酵或连续发酵中完成。在一些实施方式中,对于一些宿主期望在少氧或厌氧条件下完成发酵。在其它实施方式中,燃料生产可以在氧水平足以使得需氧生物生长的条件下实现;以及,可选地在使用气升发酵罐或相当的发酵罐的条件下实现。在一些实施方式中,所述重组微生物使用分批培养物生长。在一些实施方式中,重组微生物使用生物反应器发酵生长。在一些实施方式中,改变所述重组微生物生长的生长培养基,因此使得燃料生产水平增加。培养基变化数可以变化。

    发酵的pH可以是足够高以使宿主生长和燃料生产。可以使用中和试剂如碳酸钙或氢氧化钙调节发酵肉汤的pH。任何上述发酵方法的选择和结合高度取决于宿主菌株和下游使用的方法。

    在一些实施方式中,可以通过多种方式从C.phytofermentans发酵的生物质中纯化有机溶剂。在一些实施方式中,有机溶剂通过蒸馏纯化。在例举的实施方式中,大约96%乙醇可以从发酵的混合物中蒸馏得来。在更多的实施方式中,燃料品级乙醇,即大约99-100%乙醇,可以从大约96%乙醇通过共沸蒸馏而获得。可以通过将苯添加至大约96%乙醇然后复蒸馏所述混合物而实现共沸蒸馏。可选地,大约96%乙醇可以从分子筛通过以去除水分。

    在一些实施方式中,生产燃料的方法可以包括培养本文描述的任何微生物并向培养基中补充由包含本文描述的在C.phytofermentans中鉴定的任何编码预测基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体表达的蛋白。在具体实施方式中,所述核酸可以编码水解酶。在一些实施方式中,可以向培养基中补充分离的蛋白。

    以下实施例出于例示的目的而不是限制的目的。

    实施例

    实施例1、C.phytofermentans中的DNA序列的鉴定

    插入库的构建、分离和测序。使用常规的全基因组鸟枪法策略对基因组DNA测序。简要地,随机的2-3kb DNA片段在机械剪切后被分离。这些凝胶提取的片段被浓缩、末端修补并克隆至pUC18。使用PEBigDyeTM Terminator chemistry(Perkin Elmer)完成双末端质粒测序反应,测序梯溶解在PE 3700自动DNA测序仪上。一轮(x读取)小插入库测序完成,产生x倍冗余。

    序列装配和缺口关闭。用Phrap(P.Green,University of Washington,Seattle,Washington,USA)装配和用Consed45显像之前用Phred43,44进行序列追踪以召集碱基和评估数据质量。

    序列分析和注释。使用Critica47、Glimmer48和Generation(compbio.ornl.gov/generation/index.shtml)建模包进行基因建模,结合所得结果,并进行所述翻译相对于GenBank的非冗余数据库(NR)的蛋白质基本本地比对搜索工具(BLASTP)搜索。每个基因模型的N末端相对于最好的NR匹配的比对被用于选择基因模型。如果没有送回BLAST匹配,将保留Critica模型。互相交叠多于它们长度10%的基因模型被标记,优先选择用BLAST匹配的基因。除BLASTP相对于NR之外,修订的基于/蛋白组用KEGG GENES、InterPro(incorporating Pfam,TIGRFams,SmartHMM,PROSITE,PRINTS and ProDom)和Clusters of Orthologous Groups of proteins(COGs)数据库搜索。从这些结果中,使用KEGG和COG等级进行分类。自动化的功能性分配的最初标准需要在BLASTP比对的80%匹配长度上最低50%残基同一性,加上从模型或图形方法同时发生的迹象。在80%的长度上同一性降至30%形成假定分配。

    使用BLASTP,在从测序的基因组的所有基因上检索每一个C.phytofermentans基因,提取每一个预测蛋白的第一次比对。使用PSORT(psort.hgc.jp/form.html)完成理论的亚细胞定位分析和信号肽分裂位点。CAZy域由Cazy((碳水化合物活性酶,www.cazy.org))注释。使用TransportDB(www.membranetransport.org)对转运子注释。2007年8月可以利用C.phytofermentans全部序列(编号NC_010001)。

    实施例2、C.phytofermentans中DNA序列的表达分析

    微阵列设计。C.phytofermentans常规Affymetrix微阵列设计(图3)使得可以进行所有被鉴定的开放阅读框(ORF)的表达水平测量、mRNA的5’和3’非翻译区的评价、操纵子测量、tRNA发现和可选择基因模型之间的区别(主要区别在于起始密码子的选择)。

    使用GeneMarkTM(Besemer,J.和M.Borodovsky.2005.GeneMark:web software for gene finding in prokaryotes,eukaryotes and viruses.Nucleic Acids Res 33:W451-4)和Glimmer(Delcher,A.L.,K.A.Bratke,E.C.Powers和S.L.Salzberg.2007.Identifying bacterial genes and endosymbiont DNA with Glimmer.Bioinformatics 23:673-9)预测程序鉴定假定蛋白编码序列。这两个预测的联合被用作表达组。如果两个蛋白的N-末端区不同,两个蛋白中较小的那个被用于转录分析,但是延长的区域被探针表现以说明真实的N-末端。这些列阵设计导致包含在GenBank记录中描述的所有蛋白和包括在GenBank记录中没有发现的其它ORF。遵循标准的Affymetrix阵列设计方案以保证每一个探针是唯一的以最小化交叉杂交。所述阵列设计在具有11μ特征的49-5241型Affymetrix GeneChipTM阵列上实现。

    细胞培养生长和RNA分离。30℃、100%N2下在GS2培养基中、在试管或500ml锥形烧瓶中培养C.phytofermentans,所述GS2培养基中补充有0.3%(wt/vol)的14种具体碳源之一(葡萄糖、木聚糖、纤维二糖、纤维素、D-阿拉伯糖、L-阿拉伯糖、岩藻糖、半乳糖、海带多糖、甘露糖、果胶、鼠李糖、木糖或酵母提取物)。用分光光度计通过监测660nm处光密度变化测量生长。

    从指数中期培养物(OD660=0.5)中纯化RNA。1ml的样品通过沉浸在液氮中速冻。4℃下通过8000rpm离心5分钟收集细胞,并使用Qiagen RNeasyTM Mini Kit及用无RNA酶的DNA酶I处理以分离总RNA。使用NanodropTM分光光度计在260/280nm处的吸光率测量RNA浓度。

    微阵列处理。在马萨诸塞大学医学中心的基因组核心设施上实现cDNA合成、阵列杂交和成像。使用Affymetrix GeneChipTM DNA标记试剂盒,来自每一样品的10μg总RNA被用作合成标记的cDNA的模板。所述标记的cDNA样品根据Affymetrix指导用Affymetrix GeneChipTM阵列杂交。所述杂交的阵列用GeneChipTM扫描器3000扫描。使用微阵列组5.0版(MAS 5.0)将得到的原始样点(spot)影像数据文件处理成中心(pivot)、影像报告和规格化的探针强度文件。使用实现GCRMA方法的常规软件包计算表达值。

    使用在BioConductor(Gentleman,R.C,V.J.Carey,D.M.Bates,B.Bolstad,M.Dettling,S.Dudoit,B.Ellis,L.Gautier,Y.Ge,J.Gentry,K.Hornik,T.Hothorn,W.Huber,S.Iacus,R.Irizarry,F.Leisch,C.Li,M.Maechler,A.J.Rossini,G.Sawitzki,C.Smith,G.Smyth,L.Tierney,J.Y.Yang和J.Zhang.2004.Bioconductor:open software development for computational biology and bioinformatics.Genome Biol 5:R80)中由affyPLM包(Bolstad,B.M.,F.Collin,J.Brettschneider,K.Simpson,L.Cope,R.Irizarray和T.P.Speed.2005.Quality Assessment of Affymetrix GeneChip Data,p.33-47.在R.Gentleman,V.Carey,W.Huber和S.Dutoit(ed.),Bioinformatics and Computational Biology Solutions Using R and Bioconductor.Springer,Heidelberg)提供的探针水平建模程序分析微阵列数据的质量。没有观察到由于微阵列制造或处理产生的图像伪影。34(葡萄糖)、32(纤维二糖)、30(木糖)和34(纤维素)的微阵列背景值处于用于Affymetrix阵列的典型的20-100平均背景值之内。适合在C.phytofermentans中使用的方法的质量控制校验,即,RNA纯化、cDNA合成、标记和杂交指示了高质量数据。

    mRNA转录范围的估定。为鉴定假定的启动子序列,估计mRNA转录本的长度,错误范围在+/-24个碱基。使用特异探针比较邻近ORF的基因间区和ORF内区域的表达水平(图4)。1000A.U.之上的读数表示特异探针代表部分表达区。相反地,250A.U.以下的读数表示探针和表达区之间没有特异杂交。表示假定表达区的探针具有的读数大于:

    平均(基因1)-stdev(基因1)或平均(基因2)-stdev(基因2)

    为避免来自单一探针的错误,使用来自至少两个连续探针的读数以表示表达区。但是,由于一些探针可能有不反应的性质,读数低于阈值的单一探针包括在绘制表达区域,其中在不反应探针的上游和下游连续探针符合标准。这使得更好地量化低表达水平基因的转录范围以及合并了邻近表达的基因间区要求。

    通过每一个检测的探针对C.phytofermentans基因组运行BLAST,BLAST被用于鉴定交叉杂交的潜在来源。对于任何E值小于0.01的匹配,检测探针在阵列上相应于BLAST匹配的强度。如果任何匹配展示了表达值高于被讨论的探针,所述探针被标签为交叉杂交的可能来源。对于每一个假定表达区,报导了阳性探针数和被认为是可能的交叉杂交的这些阳性探针数。报导了每一个预测的糖苷水解酶相关蛋白和假定的乙醇脱氢酶的转录范围。

    对应于与在葡萄糖上生长相比,在D-阿拉伯糖上生长时多于4倍差异表达的转录本的基因在表10中列出。

    表10、在阿拉伯糖上的表达

    差异表达(log2)  JGI号  COG描述5.1  Cphy1174  丙酮酸甲酸裂解酶5.0  Cphy1175  甘氨酰自由基酶激活蛋白家族4.9  Cphy1176  微室蛋白6.1  Cphy1177  II类缩醛酶/内收蛋白家族蛋白5.9  Cphy1178  醛脱氢酶5.3  Cphy1179  醇脱氢酶锌结合域蛋白5.6  Cphy1180  微室蛋白5.7  Cphy1181  微室蛋白5.0  Cphy1182  微室蛋白4.5  Cphy1183  丙二醇利用蛋白3.9  Cphy1184  乙醇胺利用蛋白EutN/羧酶体结构蛋白Ccml3.4  Cphy1185  呼吸链NADH脱氢酶域51kDa亚单元3.9  Cphy3153  RbsD或FucD转运子4.4  Cphy3154  碳水化合物激酶FGGY4.4  Cphy3155  L-岩藻糖异构酶2.6  Cphy3367  纤维素1,4-β-纤维二糖糖苷酶2.8  Cphy3368  纤维素1,4-β-纤维二糖糖苷酶

    对应于与在葡萄糖上生长相比,在L-阿拉伯糖上生长时多于4倍差异表达的转录本的基因在表11中列出。

    表11、在L-阿拉伯糖上的表达

    对应于与在葡萄糖上生长相比,在纤维二糖上生长时多于4倍差异表达的转录本的基因在表12中列出。

    表12、在纤维二糖上的表达

    差异表达(log2)  JGI号  COG描述3.5  Cphy0430  糖基转移酶362.1  Cphy1586  ABC转运子相关的2.3  Cphy1587  转运单糖ATP酶2.0  Cphy2264  糖苷酶PH1107相关的1.9  Cphy2265  胞外溶质结合蛋白家族12.0  Cphy2266  假定蛋白2.2  Cphy2267  依赖结合蛋白的转运系统,内膜成分2.3  Cphy2268  依赖结合蛋白的转运系统,内膜成分2.3  Cphy2269  假定蛋白2.3  Cphy2270  -2.0  Cphy2271  -2.1  Cphy2272  依赖结合蛋白的转运系统,内膜成分2.2  Cphy2273  依赖结合蛋白的转运系统,内膜成分4.3  Cphy2464  依赖结合蛋白的转运系统,内膜成分3.8  Cphy2465  依赖结合蛋白的转运系统,内膜成分2.7  Cphy2466  胞外溶质结合蛋白家族13.4  Cphy2467  转录调节蛋白,LacI家族

    对应于与在葡萄糖上生长相比,在纤维素上生长时多于4倍差异表达的转录本的基因在表13中列出。

    表13、在纤维素上的表达

      差异表达(log2)  JGI号  COG描述  3.4  Cphy0430  糖基转移酶36  3.1  Cphy1071  糖苷水解酶家族26  3.0  Cphy1163  纤维素酶  4.1  Cphy1529  胞外溶质结合蛋白家族1  3.2  Cphy1530  依赖结合蛋白的转运系统,内膜成分  3.6  Cphy1531  依赖结合蛋白的转运系统,内膜成分  2.1  Cphy1586  ABC转运子相关的  2.3  Cphy1587  转运单糖ATP酶  6.2  Cphy1799  糖苷水解酶家族18  6.2  Cphy1800  糖苷水解酶家族18  2.0  Cphy1929  糖基转移酶36  3.2  Cphy2105  内切-1,4-β-木聚糖酶  2.6  Cphy2263  假定蛋白  2.0  Cphy2264  糖苷酶PH1107相关的  2.9  Cphy2265  胞外溶质结合蛋白家族1  2.0  Cphy2266  假定蛋白  2.2  Cphy2267  依赖结合蛋白的转运系统,内膜成分  2.3  Cphy2268  依赖结合蛋白的转运系统,内膜成分  2.3  Cphy2269  假定蛋白  3.0  Cphy2270  -  2.7  Cphy2271  -  2.1  Cphy2272  依赖结合蛋白的转运系统,内膜成分  2.2  Cphy2273  依赖结合蛋白的转运系统,内膜成分

      2.3  Cphy2274  胞外溶质结合蛋白家族1  4.0  Cphy2464  依赖结合蛋白的转运系统,内膜成分  3.5  Cphy2465  依赖结合蛋白的转运系统,内膜成分  2.5  Cphy2466  胞外溶质结合蛋白家族1  3.0  Cphy2467  转录调节蛋白,LacI家族  2.9  Cphy2569  胞外溶质结合蛋白家族1  3.9  Cphy2570  依赖结合蛋白的转运系统,内膜成分  3.9  Cphy2571  依赖结合蛋白的转运系统,内膜成分  2.0  Cphy3209  依赖结合蛋白的转运系统,内膜成分  2.0  Cphy3210  假定的多糖转运系统底物结合蛋白  4.8  Cphy3367  纤维素1,4-β-纤维二糖糖苷酶  5.5  Cphy3368  纤维素1,4-β-纤维二糖糖苷酶  2.5  Cphy3854  糖基转移酶36  3.1  Cphy3855  磷酸甘露糖变位酶  2.5  Cphy3858  胞外溶质结合蛋白家族1  3.8  Cphy3859  依赖结合蛋白的转运系统,内膜成分  3.7  Cphy3860  依赖结合蛋白的转运系统,内膜成分  2.9  Cphy3861  两个成分转录调节蛋白,AraC家族  2.3  Cphy3862  内切-1,4-β-木聚糖酶

    对应于与在葡萄糖上生长相比,在岩藻糖上生长时多于4倍差异表达的转录本的基因在表14中列出。

    表14、在岩藻糖上的表达

      差异表达(log2)  JGI号  COG描述  2.7  Cphy0580  ABC转运子相关的  2.6  Cphy0581  转运单糖的ATP酶  2.8  Cphy0582  转运单糖的ATP酶  2.2  Cphy0583  假定糖ABC转运子,底物结合蛋白  2.2  Cphy0584  L-阿拉伯糖异构酶  2.8  Cphy1071  糖苷水解酶家族26  2.8  Cphy1163  纤维素酶  5.6  Cphy1174  丙酮酸盐酸裂解酶  6.2  Cphy1175  甘氨酰自由基酶活化蛋白家族  5.8  Cphy1176  微室蛋白  6.5  Cphy1177  II类缩醛酶/内收蛋白家族蛋白  6.4  Cphy1178  醛脱氢酶  6.3  Cphy1179  醇脱氢酶锌结合域蛋白  6.4  Cphy1180  微室蛋白  6.4  Cphy1181  微室蛋白  6.0  Cphy1182  微室蛋白  5.9  Cphy1183  丙二醇利用蛋白  5.4  Cphy1184  乙醇胺利用蛋白EutN/羧酶体结构蛋白Ccm1  5.2  Cphy1185  呼吸链NADH脱氢酶域51kDa亚单元  4.7  Cphy1186  微室蛋白  4.9  Cphy1799  糖苷水解酶家族18  5.2  Cphy1800  糖苷水解酶家族18  6.1  Cphy2010  ABC转运子相关的  6.6  Cphy2011  转运单糖ATP酶

      5.9  Cphy2012  周质结合蛋白/LacI转录调节蛋白  2.0  Cphy2105  内切-1,4-β-木聚糖酶  2.4  Cphy2569  胞外溶质结合蛋白家族1  3.3  Cphy2570  依赖结合蛋白的转运系统,内膜成分  3.0  Cphy2571  依赖结合蛋白的转运系统,内膜成分  2.5  Cphy2919  未知功能蛋白DUF1565  4.9  Cphy3153  RbsD或FucU转运子  5.3  Cphy3154  碳水化合物激酶FGGY  5.3  Cphy3155  L-岩藻糖异构酶  2.3  Cphy3308  假定蛋白  4.2  Cphy3367  纤维素1,4-β-纤维二糖糖苷酶  4.7  Cphy3368  纤维素1,4-β-纤维二糖糖苷酶  2.1  Cphy3854  糖基转移酶36  2.3  Cphy3855  磷酸甘露糖变位酶  2.3  Cphy3858  胞外溶质结合蛋白家族1  3.3  Cphy3859  依赖结合蛋白的转运系统,内膜成分  3.2  Cphy3860  依赖结合蛋白的转运系统,内膜成分  2.3  Cphy3861  两个成分转录调节蛋白,AraC家族

    对应于与在葡萄糖上生长相比,在半乳糖上生长时多于4倍差异表达的转录本的基因在表15中列出。

    表15、在半乳糖上的表达

      差异表达(log2)  JGI号  COG描述  2.1  Cphy3367  纤维素1,4-β-纤维二糖糖苷酶  2.0  Cphy3368  纤维素1,4-β-纤维二糖糖苷酶

    对应于与在葡萄糖上生长相比,在海带多糖上生长时多于4倍差异表达的转录本的基因在表16中列出。

    表16、在海带多糖上的表达

    差异表达(log2)  JGI号  COG描述5.4  Cphy0857  纤维二糖磷酸化酶样蛋白5.1  Cphy0858  糖苷水解酶家族304.9  Cphy0859  假定蛋白5.7  Cphy0860  依赖结合蛋白的转运系统,内膜成分5.8  Cphy0861  依赖结合蛋白的转运系统,内膜成分3.9  Cphy0862  胞外溶质结合蛋白家族13.8  Cphy0863  组氨酸激酶内区域3.8  Cphy0864  两个成分转录调节蛋白,AraC家族4.0  Cphy0865  假定蛋白2.2  Cphy1448  膦酸ABC转运子,周质膦酸结合蛋白1.8  Cphy1449  膦酸ABC转运子,ATP酶亚单元1.9  Cphy1450  膦酸ABC转运子,内膜亚单元2.0  Cphy1451  膦酸ABC转运子,内膜亚单元2.0  Cphy1929  糖基转移酶364.9  Cphy3388  葡聚糖内切-1,3-β-D-葡糖苷酶

    对应于与在葡萄糖上生长相比,在甘露糖上生长时多于4倍差异表达的转录本的基因在表17中列出。

    表17、在甘露糖上的表达

      差异表达(log2)  JGI号  COG描述  2.6  Cphy1071  糖苷水解酶家族26

      2.5  Cphy1585  假定的ABC转运子的溶质结合成分  2.5  Cphy1586  ABC转运子相关的  2.9  Cphy1587  转运单糖ATP酶  3.9  Cphy1799  糖苷水解酶家族18  4.2  Cphy1800  糖苷水解酶家族18  2.5  Cphy2105  内切-1,4-β-木聚糖酶  3.1  Cphy2569  胞外溶质结合蛋白家族1  3.6  Cphy2570  依赖结合蛋白的转运系统,内膜成分  3.4  Cphy2571  依赖结合蛋白的转运系统,内膜成分  3.8  Cphy3367  纤维素1,4-β-纤维二糖糖苷酶  4.1  Cphy3368  纤维素1,4-β-纤维二糖糖苷酶  2.1  Cphy3855  磷酸甘露糖变位酶  2.4  Cphy3858  胞外溶质结合蛋白家族1  3.3  Cphy3859  依赖结合蛋白的转运系统,内膜成分  3.1  Cphy3860  依赖结合蛋白的转运系统,内膜成分  2.4  Cphy3861  两个成分转录调节蛋白,AraC家族

    对应于与在葡萄糖上生长相比,在果胶上生长时多于4倍差异表达的转录本的基因在表18中列出。

    表18、在果胶上的表达

      差异表达(log2)  JGI号  COG描述  2.7  Cphy0218  糖苷水解酶家族31  2.2  Cphy0219  假定蛋白  2.5  Cphy0220  糖苷水解酶家族3域蛋白  3.5  Cphy0430  糖基转移酶36

      2.2  Cphy1071  糖苷水解酶家族26  2.3  Cphy1174  丙酮酸盐酸裂解酶  2.4  Cphy1175  甘氨酰自由基酶活化蛋白家族  2.1  Cphy1176  微室蛋白  3.3  Cphy1177  II类缩醛酶/内收蛋白家族蛋白  2.9  Cphy1178  醛脱氢酶  2.3  Cphy1179  醇脱氢酶锌结合域蛋白  2.9  Cphy1180  微室蛋白  2.8  Cphy1181  微室蛋白  2.2  Cphy1182  微室蛋白  2.1  Cphy1183  丙二醇利用蛋白  2.0  Cphy1219  木糖异构酶  3.2  Cphy1612  果胶酸裂解酶/Amb过敏原  2.0  Cphy1714  糖苷水解酶家族85  3.6  Cphy1715  依赖结合蛋白的转运系统,内膜成分  3.4  Cphy1716  依赖结合蛋白的转运系统,内膜成分  2.3  Cphy1717  胞外溶质结合蛋白家族1  2.7  Cphy1718  糖苷酶PH1107相关的  2.5  Cphy1719  假定蛋白  2.4  Cphy1720  糖苷水解酶家族38  2.4  Cphy1888  假定蛋白  3.4  Cphy1929  糖基转移酶36  2.1  Cphy2010  ABC转运子相关的  2.1  Cphy2011  转运单糖ATP酶

      2.1  Cphy2262  N-乙酰葡糖胺-2-差向异构酶  3.1  Cphy2263  假定蛋白  3.3  Cph y2264  糖苷酶PH1107相关的  3.1  Cphy2265  胞外溶质结合蛋白家族1  3.1  Cphy2266  假定蛋白  4.0  Cphy2267  依赖结合蛋白的转运系统,内膜成分  3.8  Cphy2268  依赖结合蛋白的转运系统,内膜成分  3.9  Cphy2269  假定蛋白  3.6  Cphy2270  -  3.6  Cphy2271  -  4.0  Cphy2272  依赖结合蛋白的转运系统,内膜成分  4.0  Cphy2273  依赖结合蛋白的转运系统,内膜成分  3.2  Cphy2274  胞外溶质结合蛋白家族1  2.4  Cphy2275  假定蛋白  2.1  Cphy2276  甘露聚糖-1,4-β-甘露糖苷酶  3.9  Cphy2464  依赖结合蛋白的转运系统,内膜成分  3.5  Cphy2465  依赖结合蛋白的转运系统,内膜成分  2.4  Cphy2466  胞外溶质结合蛋白家族1  2.9  Cphy2467  转录调控蛋白,LacI家族  2.9  Cphy2919  未知功能蛋白DUF1565  2.4  Cphy3153  RbsD或FcuU转运  2.5  Cphy3154  碳水化合物激酶FGGY  2.6  Cphy3155  L-岩藻糖异构酶  2.2  Cphy3160  糖苷水解酶家族2糖结合

      3.4  Cphy3367  纤维素1,4-β-纤维二糖糖苷酶  3.5  Cphy3368  纤维素1,4-β-纤维二糖糖苷酶  4.2  Cphy3585  转录调控蛋白,LacI家族  6.5  Cphy3586  阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶  6.8  Cphy3587  假定蛋白  6.5  Cphy3588  依赖结合蛋白的转运系统,内膜成分  6.1  Cphy3589  依赖结合蛋白的转运系统,内膜成分  6.7  Cphy3590  胞外溶质结合蛋白家族1  2.2  Cphy3859  依赖结合蛋白的转运系统,内膜成分  2.0  Cphy3860  依赖结合蛋白的转运系统,内膜成分

    对应于与在葡萄糖上生长相比,在鼠李糖上生长时多于4倍差异表达的转录本的基因在表19中列出。

    表19、在鼠李糖上的表达

    对应于与在葡萄糖上生长相比,在木聚糖上生长时多于4倍差异表达的转录本的基因在表20中列出。

    表20、在木聚糖上的表达

      差异表达(log2)  JGI号 COG描述  2.4  Cphy1132 假定的ABC转运子的溶质结合成分  2.7  Cphy1133 转运单糖ATP酶  2.6  Cphy1134  ABC转运子相关的

      2.2  Cphy1177  II类缩醛酶/内收蛋白家族蛋白  2.1  Cphy1178  醛脱氢酶  2.0  Cphy1181  微室蛋白  3.6  Cphy1219  木糖异构酶  2.7  Cphy1448  膦酸ABC转运子,周质膦酸结合蛋白  2.3  Cphy1449  膦酸ABC转运子,ATP酶亚单元  2.5  Cphy1450  膦酸ABC转运子,内膜亚单元  2.6  Cphy1451  膦酸ABC转运子,内膜亚单元  2.8  Cphy1528  转录调节蛋白,AraC家族  6.7  Cphy1529  胞外溶质结合蛋白家族1  6.8  Cphy1530  依赖结合蛋白的转运系统,内膜成分  6.7  Cphy1531  依赖结合蛋白的转运系统,内膜成分  5.3  Cphy1532  未知功能DUF1801的域  4.5  Cphy2105  内切-1,4-β-木聚糖酶  4.6  Cphy2106  未知功能蛋白DUF323  4.8  Cphy2108  内切-1,4-β-木聚糖酶  2.4  Cphy2632  糖苷水解酶家族43  2.4  Cphy2654  糖ABC转运子底物结合蛋白  4.2  Cphy2655  依赖结合蛋白的转运系统,内膜成分  4.3  Cphy2656  依赖结合蛋白的转运系统,内膜成分  4.3  Cphy3009  糖苷水解酶家族3域蛋白  4.1  Cphy3010  内切-1,4-β-木聚糖酶  4.6  Cphy3158  α-葡糖苷酸酶  4.3  Cphy3206  接受甲基趋化性感官转导蛋白

      4.5  Cphy3207  糖苷水解酶家族8  4.4  Cphy3208  依赖结合蛋白的转运系统,内膜成分  4.3  Cphy3209  依赖结合蛋白的转运系统,内膜成分  4.6  Cphy3210  假定的多糖转运系统底物结合蛋白  3.3  Cphy3211  两个成分转录调节蛋白,AraC家族  3.0  Cphy3212  组氨酸激酶内区域  3.4  Cphy3419  木酮糖激酶

    对应于与在葡萄糖上生长相比,在木糖上生长时多于4倍差异表达的转录本的基因在表21中列出。

    表21、在木糖上的表达

    对应于与在葡萄糖上生长相比,在酵母提取物上生长时多于4倍差异表达的转录本的基因在表22中列出。

    表22、在酵母提取物上的表达

    差异表达(log2)  JGI号  COG描述2.4  Cphy0857  纤维二糖磷酸化酶样蛋白2.2  Cphy0858  糖苷水解酶家族303.2  Cphy0860  依赖结合蛋白的转运系统,内膜成分3.6  Cphy0861  依赖结合蛋白的转运系统,内膜成分3.0  Cphy1448  膦酸ABC转运子2.0  Cphy1449  膦酸ABC转运子2.1  Cphy1450  膦酸ABC转运子2.0  Cphy1451  膦酸ABC转运子

    实施例3、C.phvtofermentans基因组的基因组剖析

    基因组构成。C.phytofermentans ISDg ATCC 700394具有单一环状4,847,594bp染色体且没有质粒。使用GC倾斜的转变点位置和特有的复制蛋白danA的存在定义复制起点(图5)。G+C含量是35.3%。描绘的1kb范围内的G+C含量作为基因组中位置的函数(图6)显示了几个具有更高G+C含量的分离的基因组岛。6个平均G+C含量>50%的具体岛被定义为1kb区域,在图6中显示。在每一个这些基因组岛中或周围鉴定基因(表3)。

    表23、C.phytofermentans基因组的一般特征

    总之,这些高G+C岛显示具有低基因密度。在16个G+C含量>50%的1kb区域(包括6个基因组岛)中,12个区域不包含基因。在高G+C岛中发现的唯一的基因是两个成分系统(组氨酸激酶和应答调节蛋白)和具有假定胶原质三倍螺旋重复的蛋白。环绕这些高G+C区域的大多数基因是功能未知的。邻近区域V的基因之一编码噬菌体蛋白(图6)。基因组编码3,926预测的编码序列(CDS)(表23)。

    Clostridial基因组典型地展示出强烈的编码倾向,但是在C.phytofermentans中,所述CDS均等地在前导链(52%)和后随链(48%)上编码(Seedorf,H.等。The genome of Clostridium kluyveri,a strict anaerobe with unique metabolic features.Proc.Natl.Acad.Sci.U.S.A.105,2128-2133(2008))。73%的CDS被指定为假定功能,而11%与未知功能基因具有相似性,16%是C.phytofermentans唯一的。

    61个tRNA基因在基因组中被预测,覆盖20种氨基酸(表23、表24)。

    表24、C.phytofermentans的tRNA基因

    8个核糖体操纵子,其中3个朝向前导链,5个朝向后随链,一般靠近复制起点成簇。C.phytofermentans中大量的rRNA操纵子可能是经历了变动的生长环境的生物的进化的适应和有益之处,如具有更高数量操纵子的细菌对有利生长环境具有提高的快速反应能力所暗示的(Schmidt,T.M.在Bacterial genomes:physical structure and analysis.221(Chapman and Hall Co.,New York,N.Y.,1997);Klappenbach,J.A.,Dunbar,J.M.& Schmidt,T.M.rRNA operon copy number reflects ecological strategies of bacteria.Appl.Environ.Microbiol.66,1328-1333(2000);Condon,C,Liveris,D.,Squires,C,Schwartz,I.& Squires,C.L.rRNA operon multiplicity在Escherichia coli and the physiological implications of rrn inactivation.J.Bacteriol.177,4152-4156(1995)中)。

    根据成簇的噬菌体相关基因的存在显示,在基因组中似乎有假定的前噬菌体。所述噬菌体簇跨越大约39kb并包括40种基因(Cphy2953-2993)。导致头和尾结构成分和装配的15种基因与Clostridium difficile噬菌体ФC2的基因同源(Goh,S.,Ong,P.F.,Song,K.P.,Riley,T.V.& Chang,B.J.The complete genome sequence of Clostridium difficile phage phiC2 and comparisons to phiCD1 19 and inducible prophages of CD630.Microbiology 153,676-685(2007))。还不清楚噬菌体必需的完成它生命循环(即DNA包装、尾部装配、细胞溶解、溶原控制和DNA复制、重组和改良)的功能相等的基因是否存在于基因组中(Id)。存在27种插入序列相关的基因(转座酶),低于在密切相关的基因组中(表25)。

    表25、Clostridia基因组的比较

    C.phytofermentans与植物腐殖质关联的土壤微生物在进化上相关。为说明C.phytofermentans和包括未测序的基因组的Clostridia种类的其它成员之间的系统发生关系,分离的和最密切相关的成员的16s rRNA基因序列(1611bp)用于邻接分析。所述系统发生证实了菌株ISDg是由多数人/大鼠/鸡肠道微生物组成的簇XIVa的成员,并仅与包含许多病原体和生溶剂型菌株(solventogenic)Clostridium acetobutylicum的簇I和包含水解纤维素细菌如Clostridium cellulolyticum和Clostridium thermocellum的簇III远相关(图7)(Warnick,T.A.,Methe,B.A.& Leschine,S.B.Clostridium phytofermentans sp.nov.,a cellulolytic mesophile from forest soil.Int.J.Syst.Evol.Microbiol.52,1155-1160(2002);Collins,M.D.等.The phylogeny of the genus Clostridium:proposal of five new genera and eleven new species combinaitons.Int.J.Syst.Bacteriol.44,812-826(1994))。在簇XIVa中,C phytofermentans是包含源于宏基因组分析厌氧水稻土壤,产甲烷废弃物渗出液生物反应器的未培养细菌的分化枝一部分(93.7-93.8%相似性)(Burrell,P.C,O′Sullivan,C,Song,H.,Clarke,W.P.& Blackall,L.L.Identification,detection,and spatial resolution of Clostridium populations responsible for cellulose degradation in a methanogenic landfill leachate bioreactor.Appl.Environ.Microbiol.70,2414-2419(2004);Hengstmann,U.,Chin,K.J.,Janssen,P.H.& Liesack,W.Comparative phylogenetic assignment of environmental sequences of genes encoding 16S rRNA and numerically abundant culturable bacteria from an anoxic rice paddy soil.Appl.Environ.Microbiol.65,5050-5058(1999)),种类Clostridium aminovalericum(92.4%相似性)以及Clostridium jejuense(92.2%相似性),从肠道微生物分化枝中分化(89.7%相似性)(图7)。

    基于rRNA分析的C.phytofermentans在种类Clostridia中的分组与根据使用BLASTP的它们与其它完整测序基因组中的基因的相似性所得的CDS C.phytofermentans基因的总体分布一致。38%的CDS与簇XIVa最相似,接着是在簇I中10%和在簇III中7%(图8)。但是,显著比例(14%)的CDS在种类Clostridia中没有明显的同源性,并展示了与系统发生上远距离菌株中的CDS的最高水平的相似性。这暗示了C.phytofermentans基因组可能包含许多从水平基因转移获得的基因。基因的这些分散的来源加强了梭菌属的多样性和在测序的基因组中C.phytofermentans的独特性。

    独特一组来自不同起源的GH的装配。在单一基因组如C.phytofermentans中具有这样大量功能的糖苷水解酶(GH)的同时存在是不寻常的。尽管用于多糖利用的微生物系统组织多样化,基本的建筑块显示了相当大的一致性。在多糖降解酶中发现的催化域可以通过它们初级序列和折叠拓扑被规划进家族中。可以在许多不同细菌和真核微生物中中找到这些家族的代表。通过量化在其它细菌GH催化域中的相似性和不同性以及它们从基因到基因组水平的组织,我们试图更好地理解它们的功能或估计C.phytofermentans的独特性。

    当使用BLASTP与其它测序的细菌中的酶比较时,C.phytofermentans的GH与广泛不同的细菌(6门和46种)相似。与C.phytofermentans中所有基因分布的期望相比,有更多GH基因相似于远相关的细菌(chi平方检测,P=0.0004998)(图9)。与期望的14%相比,大约50%的GH更相似于梭菌属外的种类(图9)。大约18%的GH更相似于Bacilli,接着是17%更相似于水解纤维素细菌的簇III(图9)。这暗示了水平基因转移在C.phytofermentans的降解植物能力的进化和装配独特一组套来自不同来源的GH中扮演重要角色。

    除了淀粉降解基因成簇在基因组上(Cphy2304-2352),总体上,半纤维素酶或纤维素酶基因几乎很少共定位。这支持了后者通过独立水平基因转移而获得的假说。但是,具有相关功能的基因串联的例子是具有β-葡萄糖苷酶Cphy3009(GH3)、内切-木聚糖酶Cphy3010(GH10)和阿拉伯呋喃糖苷酶Cphy3011(GH43)的木聚糖降解簇。这个串联是C.phytofermentans特有的。此外,编码两个主要纤维素酶的基因,Cphy3367(GH9)和Cphy3368(GH48)在基因组上是连续的。这与存在于细菌中迄今已知的所有纤维素酶系统的细菌纤维素酶GH48和GH9之间观察到的高度协同作用一致(Riedel,K.,Ritter,J.& Bronnenmeier,K.Synergistic interaction of the Clostridium stercorarium cellulases Avicelase I(CeIZ)and Avicelase II(CeIY)in the degradation of microcrystalline cellulose.FEMS Microbiol.Lett.147,239(1997))。

    在分子系统发生中,C.phytofermentans的催化域GH9和GH48(见图10和11)分别最相似于嗜热水解纤维素和xynalolytic的Clostridium stercorarium的内切葡聚糖酶Z前体(微晶纤维素酶I)(Jauris,S.等。Sequence analysis of the Clostridium stercorarium celZ gene encoding a thermoactive cellulase(Avicelase I):identification of catalytic and cellulose-binding domains.MoI.Gen.Genet.223,258-267(1990))和纤维糊精水解酶(微晶纤维素酶II)(Bronnenmeier,K.,Rucknagel,K.P.& Staudenbauer,W.L.Purification and properties of a novel type of exo-1,4-β-glucanase(avicelase II)from the cellulolytic thermophile Clostridium stercorarium.Eur.J.Biochem.200,379-385(1991))。在C.stercorarium中,GH9和GH48同样邻近(Schwarz,W.H.,Zverlov,V.V.& Bahl,H.Extracellular glycosyl hydrolases from Clostridia.Adv.Appl.Microbiol.56,215-261(2004))。这在嗜热C.stercorarium中更严重,其中GH9和GH48高度相似于C.phytofermentans和C.stercorarium中的那些,并融合至单一蛋白中。这些观察暗示了在这三种细菌中这些关键酶的共同起源和协作功能。

    既然给出的GH家族包含具有非常广范围已知活性的酶,有人可能会问在家族中的冗余是否反映了功能冗余或缺少催化域的特异性。与植物细胞壁降解相关的目标GH家族的更多详细的分子研究显示这些相关但不一样基因的序列经常有变化。应当提到,与具有反映它降解纤维素特异作用的、突出数量的GH9(16)、GH48(2)、GH5(11)纤维素酶的纤维质特异种C.thermocellum相比,C.phytofermentans总体上每个家族具有较少的冗余但具有更广范围的反映它更多面生态学的GH家族(图9)。然而C.phytofermentans中的一些GH家族仍然包含突出数量的基因。这样的情形是GH3葡萄糖苷酶,GH5纤维素酶,和GH10、GH26、GH43木聚糖降解酶。来自C.phytofermentans的GH5纤维素酶(pfam00150)的分子系统发生显示它们是不同的,分成两个亚簇(图11)。簇B包含真菌纤维素酶。这个例子加强了侧面基因转移如何已经影响GH的进化。更具体地,它强调了属于不同界的微生物之间基因转移的重要性,推测了基因转移在界中更重要的角色。C.phytofermentans的6个GH10域的系统发生暗示了C.phytofermentans中宽范围的变化和可能的功能。Cphy2108(GH10)非常相似于C.stercorarium Xyn10C的多模块木聚糖酶,热稳定性细胞范围及纤维素和木聚糖结合蛋白,因此将细胞结合至底物(AIi,M.K.,Kimura,T.,Sakka,K.& Ohmiya,K.The multidomain xylanase Xyn10B as a cellulose-binding protein in Clostridium stercorarium.FEMS Microbiol.Lett.198,79-83(2001))。在融合至CE域的单一酶上发现两个唯一但紧密相关的GH10域显示复制事件跟随着融合和分离。单一蛋白催化功能的这个具体安排是C.phytofermentans特有的。

    复制,跟随着融合和重排,和序列分离产生了C.phytofermentans中多模块酶的巨大阵列,所述酶在底物特异性和动力学性质上不同。但是大体上,C.phytofermentans的突出特征是水平基因转移的重要性,使得可以从生境社会的其它成员中获得这样的基因复合簇和基因簇。

    没有纤维素体的植物细胞壁降解。C.phytofermentans分享与产生纤维素体细菌相似的生态。但是,在这样细菌中既没有产生纤维素体的生化证据也没有遗传证据(无锚定结构、黏结素或锚定蛋白域)。纤维素体复合物被认为是涉及植物细胞壁衰竭,因为它们提供用于保留代表一系列底物特异性的、在分解植物细胞壁多糖不同连接所必须的高浓度蛋白的细菌细胞-表面构造;它们可以最大化化学计量法和不同酶催化和结合特异性之间的协同作用;并且它们可以通过在细胞膜和底物之间提供特定环境帮助限制衰竭产物扩散远离细胞(Flint,H.J.,Bayer,E.A.,Rincon,M.T.,Lamed,R.& White,B.A.Polysaccharide utilization by gut bacteria:potential for new insights from genomic analysis.Nat.Rev.Microbiol.6,121-131(2008))。C.phytofermentans利用植物细胞壁的有效衰竭并吸收没有纤维素体的产物的策略并不清楚。

    首先,令人惊讶的是,对于所有的纤维素酶GH5、GH9和GH48,在根据蛋白和纤维素体关系的系统进化树上没有分组。这暗示了锚定复合体中蛋白的锚定结构域缺失或者已多次独立地获得(图10和11)。纤维素体蛋白的显著多模块特征保存在C.phytofermentans中,其中来自GH、CE、PL的不同家族的多倍区域和碳水化合物结合模块(CBM)融合在单一蛋白上。C.phytofermentans具有19中模块GH蛋白,代表了全部GH的大约17%。在非水解纤维素细菌中,相应的GH主要在单区域多肽上被发现(Flint,H.J.,Bayer,E.A.,Rincon,M.T.,Lamed,R.& White,B.A.Polysaccharide utilization by gut bacteria:potential for new insights from genomic analysis.Nat.Rev.Microbiol.6,121-131(2008))。这可能反映了基因产物的不同的细胞定位和它们对较小的可溶性碳水化合物底物(Id.)起作用的事实。根据这个假设,似乎是来自水解纤维素种类的酶的特性的多模块组织可能主要为了异源不溶性底物如细胞壁(Id.)的胞外过程而存在。

    当缺乏纤维素体时,CBM可以紧紧地将酶固定在植物细胞壁并因此将它们保持在它们的底物附近。鉴定了代表15个CAZy家族的35个假定CBM(表5)。已经显示CBM2、CBM3、CBM4、CBM6和CBM46结合纤维素(表5)。已经证明CBM2、CBM4、CBM6、CBM13、CBM22、CBM35和CBM36结合木聚糖(表5)。具有与催化域特异性不匹配的特异性的CBM域的多种组合的存在可能提供了对不同拓扑的植物细胞壁(其中交联了多倍的多糖类型)作用的优势。具有纤维素结合CBM的木聚糖酶可能帮助C.phytofermentans在降解交联的木聚糖时连接纤维素纤维。独立于催化域的CBM的存在同样可以由在一些实例中已经表现的它们的热稳定性作用解释。另一类型域X2,可以在催化域和CBM域之间发现,或者在C.phytofermentans的一个甘露聚糖酶和三个纤维素酶的CBM域之间发现(表6)。非常少的关于X2在细菌胞外酶中的功能的信息可以利用。可以假定它们作为间隔子或连接序列起作用,使得催化模块和底物结合模块之间的最佳交互作用,适于蛋白-蛋白交互作用,或作为潜在的碳水化合物结合域起作用。

    除了结合至多糖,一些酶似乎结合细胞,使得所述细胞靠近它的底物停留。在被预测被分泌的31种GH酶中(被预测具有单一肽和/或胞外的),跨膜螺旋的循环预测,TonB盒(COG0810和PS00430),SORT域和/或细胞壁结合暗示了这些酶可能与膜或细胞壁联合(表6)。在这些蛋白中,8个GH酶被预测具有CBM和细胞连接能力以潜在地获得细胞至它们降解的底物的自然靠近。最终,特殊基因Cphy1775(SLH-GH*-CBM32-CBM32)与预测的SLH域(pfam00395)匹配以将它锚定至细胞壁以及两个免疫球蛋白样折叠(CBM32)并可能如同CBM域一样表现,其将细胞结合至它的底物。其它GH酶可能仍然通过其它未知途径锚定至细胞表面。细胞可能通过不同域如pfam07705(CARDB,细菌中的细胞粘附域)和pfamO1391(胶原质,胶原质三倍螺旋重复)粘附在一起。生物薄膜的形成可能同样在植物细胞壁多糖的降解协调安排中起作用。

    与由广泛范围的可诱导的ABC转运子引起的吸收和磷酸化联系的降解。尽管在基因组中找到一种磷酸烯醇式丙酮酸依赖的磷酸转移酶系统,初级表达模式数据表示,当细胞在植物细胞壁的任何主要成分(如木聚糖、纤维素、纤维二糖或葡萄糖)上生长时,它可能不被表达。更确切地,基因组中相当数量(137)的具有ABC_tran(pfam00005)域的蛋白与通过ATP结合盒(ABC)转运子的碳水化合物吸收一致。一贯地,与梭菌属中的它的亲缘物相比(表25),C.phytofermentans具有显著高数量(21)的溶质结合域(SBP bac 1,pfamO1547),典型地与吸收ABC转运子联合并使得不同溶质的特异结合。这暗示了对不同种类溶质亲合力的必要性,其与C.phytofermentans可以吸收多种寡聚糖的假设一致。最终,与梭菌属中的其它细菌相比,多糖ABC转运子LpIb(COG4209)域,亚组分透酶类型的一些ABC转运子在C.phytofermentans中超出比例(20)(表25)。

    该域的数量和多样性可能使得吸收广范围的寡聚糖(表25)。C.phytofermentans有0.5%的基因贡献这个功能,而同样是广幅种的C.saccharolyticus仅有0.2%,说明C.saccharolyticus吸收更多的相同类型的糖。另一显著特征是GH(109中的53)邻近41个ABC型转运子的存在,加上调节蛋白,说明了联合的吸收和降解以及特异调节(表7)。GH94(纤维二糖磷酸化酶/纤维糊精磷酸化酶)和GH65(麦芽糖磷酸化酶)的显著数量和多样性(表25)与广范围的寡聚糖类型进入细胞的假说一致。5个靠近ABC转运子的纤维二糖/纤维糊精磷酸化酶GH94膜结合蛋白中的4个的存在与通过ABC蛋白的纤维二糖和纤维糊精转运一致,这也是C.cellulolyticum中的情况(Desvaux,M.,Guedon,E.& Petitdemange,H.Cellulose catabolism by Clostridium cellulolyticum growing in batch culture on defined medium.Appl.Environ.Microbiol.66,2461-2470(2000))。

    同样有高数量的β-葡萄糖苷酶(8GH3)具有抗纤维二糖或木二糖的活性。C.phytofermentans可能通过经由纤维二糖/纤维糊精磷酸化的能量有利的磷酸化或通过能量耗费的水解β-葡萄糖苷酶作用将寡聚糖饲供给它的代谢中。很可能纤维糊精的浓度和其它生长底物(如纤维素或纤维二糖)的可用性涉及确定纤维糊精的命运以及磷酸解和水解分裂的相对重要性。假设纤维素水解微生物中纤维糊精代谢的磷酸解和水解途径的普遍发生,这个显然的冗余是选择值是可能的。调节通过这两种途径的相对流量可能使得微生物响应环境因子(如,底物的可用性)调整ATP速度。C.phytofermentans同样可以吸收单糖如木糖,由9Xy1F的存在证明,被预测吸收木糖(表25)。

    碳水化合物代谢的细微调节。与梭菌属中亲缘物相比,C.phytofermentans具有大量的AraC(70)和PurR(23)转录调节蛋白(表25)。根据序列相似性和结构和功能标准,原核转录调节蛋白被分类成家族。AraC调节蛋白典型地激活涉及碳代谢、胁迫反应和发病机制的基因转录(Ramos,J.L.等,″The TetR family of transcriptional repressors,″Microbiol.MoI.Biol.Rev.69,326-356(2005))。PurR属于乳糖阻遏物家族(lac),基因产物通常作为阻遏物,其中配基的生理浓度引起PurR-DNA复合物(Id)的解离。这些调节蛋白的丰度与广泛大量的底物利用和调节的复合体网络一致。

    在与PurR具有显著相似性的23个基因中,8个邻近于与GH酶成簇的ABC转运子。在与AraC具有显著相似性的70个基因中,发现20个接近于与GH酶成簇的ABC转运子。在已发现的与GH酶成簇的的41个ABC转运子中,20个邻近于一个AraC,8个接近于PurR。基于这些发现,我们猜测它们调节各自的基因组区表达(表7)。

    实施例4、检测水解酶活性

    可以使用多种检测预测的水解酶生物活性的方法。在一个实施例中,分离在C.phytofermentans中鉴定的编码水解酶的预测基因并将其克隆至表达载体。将所述表达载体转化至微生物中,例如,E.coli。通过以下方法测量表达基因的活性:向转化的微生物补充预测水解酶的底物,测量底物的消耗和水解产物的增加,并比较这个活性和在未转化的对照微生物中的活性水平。在一些实施方式中,表达载体被设计用于预测的水解酶的胞外表达。底物水解的增加可以说明预测的水解酶事实上是水解酶。

    实施例5、检测ABC转运子活性

    可以使用多种检测预测的ABC转运子的生物活性的方法。在一个实施例中,分离在C.phytofermentans中鉴定的编码ABC转运子的预测基因并将其克隆至表达载体。将所述表达载体转化至微生物中,例如,E.coli。通过以下方法测量表达基因的活性:向转化的微生物中补充预测的ABC转运子的底物,测量底物向细胞中的转运,并比较该吸收水平和在未转化的对照微生物中的吸收水平。吸收的增加可以说明预测的ABC转运子是ABC转运子。

    实施例6、检测转录调节蛋白活性

    可以使用多种检测预测的转录调节蛋白的生物活性的方法。在一个实施例中,分离在C.phytofermentans中鉴定的编码转录调节蛋白的预测基因并将其克隆至表达载体。将所述表达载体转化至微生物中,例如,E.coli。通过共转染的转化有含有所述转录调节蛋白的目标核酸序列的质粒的微生物和报告基因检测所述表达基因的活性。检测报告基因的活性并与对照微生物中同样的报告基因的活性水平做比较。报告基因活性的增加说明预测的转录调节蛋白可能是转录调节蛋白。

    实施例7、E.coli利用纤维二糖的改造

    许多E.coli实验室菌株和自然分离株不表达利用纤维二糖的功能基因,尽管它们特征性地在它们的染色体上包含隐藏的纤维二糖利用基因(Hall等,J Bacteriol.,1987六月;169:2713-2717)。通过Cphy2464-2466和Cphy0430的表达改造E.coli使之利用纤维二糖,其中Cphy2464-2466编码ABC转运子,Cphy0430编码将纤维二糖转化成葡萄糖和葡萄糖-1-磷酸的纤维二糖磷酸化酶。所述Cphy2464-2466和Cphy0430基因从质粒上的组成型启动子表达。Cphy2466的信号序列由内源E.coliABC转运子周质结合蛋白的信号序列取代以指导蛋白在周质中表达。改造的E.coli能够使用纤维二糖作为唯一碳源生长。

    实施例8、S.cerevisiae中改进的果胶分解的改造

    Cphy1714、Cphy1720和Cphy3586克隆至E.coli-S.cerevisiae穿梭载体,并从S.cerevisiae中的质粒异源表达。为使基因产物分泌,信号序列由S.cerevisiae蛋白的信号序列取代。改造的酵母菌表现了改良的果胶分解。

    实施例9、微生物改良

    pIMPCphy

    构建pIMPCphy载体作为C.phytofermentans的穿梭载体。它具有用于在E.coli中选择和复制的氨苄青霉素抗性盒和复制起点(ori)。它具有革兰氏阳性复制起点,使得C.phytofermentans中的质粒复制。为选择质粒的存在,所述pIMPCphy载体携带在C.phytofermentans的Cphy1029基因的启动子控制下的红霉素抗性基因。该质粒通过电转化或通过与具有诱动质粒(如pRK2020)的E.coli菌株的结合转移而转移至C.phytofermentans。pIMPCphy的质粒图谱在图18中描述。

    组成型启动子

    第一步中,选择几个来自C.phytofermentans的启动子,所述启动子表现出在所有生长阶段及不同底物上相关基因的高表达。通过选择可能必然涉及组成型通路(constitutive pathway)的关键基因选择启动子元件(如,核糖体基因,或用于乙醇生产,醇脱氢酶基因)。来自这样基因及的启动子的例子包括但不限于:

    Cphy_1029:含铁醇脱氢酶

    Cphy_3510:含Ig域蛋白

    Cphy_3925:双功能乙醛CoA/醇脱氢酶

    启动子克隆

    通过PCR扩增基因上游区的不同启动子。以这样的方式选择用于该PCR反应的引物:它们包含启动子区,但不包含下游基因的核糖体结合位点。设计所述引物以引进启动子片段末端的酶切位点,所述酶切位点存在于pIMPCphy的多克隆位点中,但不存在于它本身的启动子区中,如SalI、BamHI、XmaI、SmaI、EcoRI。

    根据生产商条件,所述PCR反应用商业可利用的PCR Kit,GoTaqTM Green Master Mix(Promega)实施。该反应在热循环仪Gene Amp System 24(Perkin Elmer)中进行。所述PCR产物用GenEluteTM PCR Clean-Up Kit(Sigma)纯化。纯化的PCR产物以及质粒pIMPCphy然后用相关酶以合适的量根据生产商的条件(来自New England Bio labs和Promega的限制酶)进行消化。所述PCR产物和质粒然后在Recovery FlashGelTM(Lonza)上分析并凝胶纯化。所述PCR产物随后用Quick Ligation Kit(New England Biolabs)连接至质粒,用连接混合物转化E.coli(DH5α)感受态细胞,并将细胞平铺在含有1μg/ml氨苄青霉素的LB平板上。37℃下过夜培养平板。

    从平板上挑选氨苄青霉素抗性E.coli克隆并在新的选择性平板上划线。在37℃下生长后,用单一菌落接种于含有1μg/ml氨苄青霉素的液体LB培养基中并在37℃下过夜生长。用Gene Elute Plasmid分离试剂盒分离液体培养基。

    小量制备试剂盒

    分别用合适引物进行PCR反应和用限制性酶进行限制消化检测质粒正确插入。为保证序列完整性,在该步骤中对所述插入物测序。

    纤维素酶基因的克隆

    一种或多种纤维素酶基因可能包括每一种基因本身的核糖体结合位点,通过PCR扩增,并随后用之前在启动子克隆中描述的合适的酶消化。得到的质粒同样用相关的限制性酶处理,得到的扩增基因通过常规的连接移动至质粒中。所述pCphyP3510-3367质粒(图19;SEQ ID NO:1)通过将Cphy_3367连接至Cphy_3510启动子下游而形成。将上述质粒转化至E.coli,从选择平板选择的转化株中确认正确的插入物。

    结合转移

    将上面描述的不同质粒转化至携带有辅助质粒pRK2030的E.coli DH5α中。37℃过夜生长之后,在含有1μg/ml氨苄青霉素和50μg/ml卡那霉素的LB平板上选择携带有两种上述质粒的E.coli菌落。37℃下在选择平板上重新划线后获得单菌落。用于E.coli的生长培养基(如,LB或补充有1%葡萄糖和1%纤维二糖的LB)接种单菌落,并在37℃需氧或35℃厌氧下过夜生长。用过夜培养物按1∶1接种新鲜的生长培养基,并生长至对数中期。A C.phytofermentans株同样在相同的培养基中生长至对数中期。

    两种不同的培养物,C.phytofermentans和具有pRK2030和所述质粒中一种的E.coli以不同的比例混合,如1∶10、1∶1、1∶10、1∶1、10∶1、1∶1、10∶1。在35℃下,在平板上液体培养基中或者在25mm NucleoporeTM Track-Etch膜(Whatman)上进行杂交。所述时间在2-24小时之间,所述杂交培养基是与在杂交之前培养物生长所使用的培养基相同的培养基。在杂交程序之后,所述细菌混合物或者直接平铺在平板上,或者首先在液体培养基中生长6-18个小时然后再平铺。所述平板包含10μg/ml的红霉素用作C.phytofermentans的选择试剂,包含10μg/ml的三甲氧苄二氨嘧啶、150μg/ml的环孢霉素和1μg/ml的萘啶酸作为E.coli的相对选择培养基。

    在35℃孵育3-5天后,从平板上挑选红霉素抗性菌落并在新鲜的选择平板上重新划线。挑选单菌落并通过PCR反应确定质粒的存在。

    纤维素酶基因表达

    然后在染色体基因座上的相应基因很少或不表达的情况下检测纤维素基因在不同质粒上的表达。阳性筛选物显示了克隆的纤维素酶的组成型表达。

    SEQ ID NO:1

    质粒-pCphyP3510-3367

    1 ccgggaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc

    61 aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc

    121 gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt

    181 attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa

    241 tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc

    301 cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga

    361 gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg

    421 tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg

    481 gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa

    541 atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga

    601 agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc

    661 ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg

    721 gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc

    781 gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat

    841 tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg

    901 acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag

    961 aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa

    1021 cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc

    1081 gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca

    1141 cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc

    1201 tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc

    1261 tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg

    1321 ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta

    1381 tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag

    1441 gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga

    1501 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc

    1561 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa

    1621 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa

    1681 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc

    1741 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt

    1801 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc

    1861 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac

    1921 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca

    1981 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg

    2041 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag

    2101 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt

    2161 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat

    2221 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc

    2281 acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt

    2341 gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag

    2401 cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca

    2461 gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga

    2521 gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt

    2581 gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca

    2641 aagctttggc taacacacac gccattccaa ccaatagttt tctcggcata aagccatgct

    2701 ctgacgctta aatgcactaa tgccttaaaa aaacattaaa gtctaacaca ctagacttat

    2761 ttacttcgta attaagtcgt taaaccgtgt gctctacgac caaaagtata aaacctttaa

    2821 gaactttctt ttttcttgta aaaaaagaaa ctagataaat ctctcatatc ttttattcaa

    2881 taatcgcatc agattgcagt ataaatttaa cgatcactca tcatgttcat atttatcaga

    2941 gctccttata ttttatttcg atttatttgt tatttattta acatttttct attgacctca

    3001 tcttttctat gtgttattct tttgttaatt gtttacaaat aatctacgat acatagaagg

    3061 aggaaaaact agtatactag tatgaacgag aaaaatataa aacacagtca aaactttatt

    3121 acttcaaaac ataatataga taaaataatg acaaatataa gattaaatga acatgataat

    3181 atctttgaaa tcggctcagg aaaagggcat tttacccttg aattagtaca gaggtgtaat

    3241 ttcgtaactg ccattgaaat agaccataaa ttatgcaaaa ctacagaaaa taaacttgtt

    3301 gatcacgata atttccaagt tttaaacaag gatatattgc agtttaaatt tcctaaaaac

    3361 caatcctata aaatatttgg taatatacct tataacataa gtacggatat aatacgcaaa

    3421 attgtttttg atagtatagc tgatgagatt tatttaatcg tggaatacgg gtttgctaaa

    3481 agattattaa atacaaaacg ctcattggca ttatttttaa tggcagaagt tgatatttct

    3541 atattaagta tggttccaag agaatatttt catcctaaac ctaaagtgaa tagctcactt

    3601 atcagattaa atagaaaaaa atcaagaata tcacacaaag ataaacagaa gtataattat

    3661 ttcgttatga aatgggttaa caaagaatac aagaaaatat ttacaaaaaa tcaatttaac

    3721 aattccttaa aacatgcagg aattgacgat ttaaacaata ttagctttga acaattctta

    3781 tctcttttca atagctataa attatttaat aagtaagtta agggatgcat aaactgcatc

    3841 ccttaacttg tttttcgtgt acctattttt tgtgaatcga tccggccagc ctcgcagagc

    3901 aggattcccg ttgagcaccg ccaggtgcga ataagggaca gtgaagaagg aacacccgct

    3961 cgcgggtggg cctacttcac ctatcctgcc cggatcgatt atgtcttttg cgcattcact

    4021 tcttttctat ataaatatga gcgaagcgaa taagcgtcgg aaaagcagca aaaagtttcc

    4081 tttttgctgt tggagcatgg gggttcaggg ggtgcagtat ctgacgtcaa tgccgagcga

    4141 aagcgagccg aagggtagca tttacgttag ataaccccct gatatgctcc gacgctttat

    4201 atagaaaaga agattcaact aggtaaaatc ttaatatagg ttgagatgat aaggtttata

    4261 aggaatttgt ttgttctaat ttttcactca ttttgttcta atttctttta acaaatgttc

    4321 tttttttttt agaacagtta tgatatagtt agaatagttt aaaataagga gtgagaaaaa

    4381 gatgaaagaa agatatggaa cagtctataa aggctctcag aggctcatag acgaagaaag

    4441 tggagaagtc atagaggtag acaagttata ccgtaaacaa acgtctggta acttcgtaaa

    4501 ggcatatata gtgcaattaa taagtatgtt agatatgatt ggcggaaaaa aacttaaaat

    4561 cgttaactat atcctagata atgtccactt aagtaacaat acaatgatag ctacaacaag

    4621 agaaatagca aaagctacag gaacaagtct acaaacagta ataacaacac ttaaaatctt

    4681 agaagaagga aatattataa aaagaaaaac tggagtatta atgttaaacc ctgaactact

    4741 aatgagaggc gacgaccaaa aacaaaaata cctcttactc gaatttggga actttgagca

    4801 agaggcaaat gaaatagatt gacctcccaa taacaccacg tagttattgg gaggtcaatc

    4861 tatgaaatgc gattaagctt agcttggctg caggtcgaca gacagcataa gtcacatcca

    4921 gacaaatgtc ctataggatg ttagtagggg tttggagaat tgcccgtaag gcaggttatt

    4981 tggctagata taatcaatcc agttacagga tagtaggatt gcaacccagt cgttttgacc

    5041 agtttgtaca agaattttaa tttgtcgaaa tattgtggca aatcaaatga agttctttga

    5101 tgaaatgttt agaaacatga cttagaatgg ggtacaaaaa gtgaatttgt aagcaaaaag

    5161 acttgacctt tcctacgata gttgttataa tcatcttgtt attggaacga ttatatttac

    5221 ttatgcacat tttagagttt ttcgaattgt taatacatca ttaacaattt aattatactc

    5281 gttatgtgac gtaagtcaat ataatacaaa accatatatt ttaagccgcg ggcagaaagg

    5341 atgagagata tgaaaaagat aataagtctt ttattagtga taacacttct gatatccatg

    5401 gcaccatcga aagctgacgc agcggaaacc aattataatt acggagaagc tcttcaaaaa

    5461 tcaatcatgt tttatgagtt tcaacgttct ggtaaactgc caagtaccat tcggaataat

    5521 tggagaggtg actctggttt aaccgatgga gcagatgttg gtttggatct aactggtggc

    5581 tggtatgatg ctggtgatca tgtaaaattt aatcttcctt tggcttatac tgtaacaatg

    5641 ttagcatggg cagtatatga agaagaggct actctttcaa aggcaggcca attaagttat

    5701 ttattagatg aaattaagtg gtctagtgat tacctaatta aatgtcatcc acaagcaaat

    5761 gtattttatt atcaggttgg taatggaaat acagatcact cttggtgggg acctgctgaa

    5821 gttatgcaga tggctagacc gtcctataag gttgatttaa ataacccagg ttctactgta

    5881 gtaggagaag cagcagcagc tcttgcagca acagcactta tatataagac aaaagaccct

    5941 acttattcag caacttgcct tcgtcatgca aaagagcttt ttaattttgc agatacaaca

    6001 aaaagcgatg ctggatatac agcagcaagt gggttctata cttcctatag tggattttat

    6061 gatgaattat cctgggcagc tacatggatt taccttgcaa gtggagaagc gacctatttg

    6121 gataaggcag aatcttatgt agccaaatgg ggaacagaac ctcaatcttc cacattaagt

    6181 tataagtggg cacaaaactg ggatgatgtt cactatggtg cagctttatt attagcaaga

    6241 attacaaata aagcaattta taagaacaat attgaaatgc atcttgacta ttggactaca

    6301 gggtataatg gtagtcgtat tacttataca ccaaaaggac ttgcttggtt agattcctgg

    6361 ggtgcattaa gatatgcgac gacaacagca tttctagcaa gtgtttatgc tgattggagc

    6421 ggatgtagtg ctggaaaagt tagtacttac aatgcatttg cgaaacagca ggtagattat

    6481 gcattaggaa gtaccggaag aagttttgtg gttggatatg gtgtaaattc tccaacaaga

    6541 cctcatcata gaactgctca tagttcatgg gcagacagtc agacggagcc aaattaccat

    6601 agacacacca tttatggtgc tttagtaggt ggacctggta ataatgatag ttatgaggat

    6661 aacattaata attatgtaaa caatgaaatc gcttgtgact ataatgcagg ttttgttggc

    6721 gcattggcta aagtttataa aacatatggc ggaacaccaa ttgcaaactt taaggcaatc

    6781 gaaacagtaa caaacgatga gttatttatt caagctggta ttaatgcctc tggtccatct

    6841 tttatcgaag taaaggcatt ggttttcaat gagacaggtt ggccagctcg tgttaccgat

    6901 aaattatcct ttaagtattt tattgatatc tcggaatatg tagcaaaggg atatacaaag

    6961 aatgatttta cggtatcgac aaattataac aatggagcaa ccacatcggc attgcttcct

    7021 tgggatgctg cgaataatat ctattatgtg aatgtagact tctctggaac taagatttat

    7081 cctggtggac agtctgcata taagaaagaa gtacaattta gaattgctgg tccacaaaac

    7141 gttaatatat gggacaattc caatgactac tcctttacac aaattgctaa tgttagttca

    7201 ggaaataccg taaagaccac atatatacca ttgtatgata atggtaaatt agtatttggt

    7261 aatgagccaa agacgggtgt tccttctgca agtcttgata agactacagc aaactttgac

    7321 aaaaacccag ctgtatccgc agatatacca gtaaccatta actataatgg taatacatta

    7381 acagcggtta agaatggaac aacggtttta acgaaaggta ctgattatac tgtatctggt

    7441 aatgtagtaa cgttatctaa gaattatttc ttagcacaga gcgctagtac ggttacttta

    7501 acatttgtat ttagtggcgg taacgatgca acattaaaag tgactttagt agatacttct

    7561 ccaagtgcat ccattaatcc aaattctgct gtctttgata aggctagcgg aaaacaggaa

    7621 aatatagtta ttacgcttac accaaatggc aataccttag ctggacttaa gaatgggtct

    7681 aagagcctgg taactggaac tgattatacc gtttccggaa caacagtgac gattctatct

    7741 tcttatttaa gtcaatttgc agtaggaagt caatctattg tatttgaaat gaataaaggg

    7801 acaaatccag tcttagcagt taccattaag gattcttctg ttgttactcc aacaggaaat

    7861 attaaacttc aaatgtttaa tggaaattct tctgcaacaa cgaatggcat tgcaccaaga

    7921 attaaattaa ttaacaccgg aactactgca atcaacttat ccgatgttaa gattcgctat

    7981 tattatacaa tcaatggcga aaaggatcag gcattctggt gtgattattc gacgattggt

    8041 agttccaatg taaatggtac tttcgtaaag atgagtacac caaaaacaaa tgcagattac

    8101 tatctagaat tttcatttaa gtccgctgcc ggaactttaa acgcagggca aagtattgaa

    8161 gttcaaggaa gattttctaa ggtagactgg acaaactata cacaaacaga tgattattcg

    8221 tttggtgata gtaactcaag ttatgctgat tggaataaga caacagtata tatctctgat

    8281 gttttggttt ggggagtcga accataatag gagaaaaaat gtaataattt ttagaggggt

    8341 cataacttag tatacatgtc tgtatatgag gtccgacacg tgccacacgg catgtgtcgg

    8401 gcctcatttt tatacagcgt gtatgtgacc ttattcatga caagggatcg tccgcc

    其它实施方式

    上面的描述公开了本发明的几种方法和材料。本发明改良了方法和材料以及改变了制备方法和设备。从本发明公开的描述或本文公开的本发明的实施例,这样的改进对于本领域技术人员而言是显而易见的。因此,并不意味着本发明限制在本文公开的具体实施方式中,但是它覆盖了所有在如所附的权利要求书中包含的本发明的实质范围和精神的范围内的改良和变化。

    关 键  词:
    改进 微生物 产物 生产 方法 组合
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:改进微生物中产物生产的方法和组合物.pdf
    链接地址:https://www.zhuanlichaxun.net/p-8982264.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1