新的草甘膦耐受型5-烯醇丙酮酰 莽草酸-3-磷酸合酶及其编码基因
技术领域
本发明涉及分子生物学领域。具体地,本发明涉及一种新的草甘膦耐 受型5-烯醇丙酮酰莽草酸-3-磷酸合酶(5-enolpyrul-shikimate-3-phosphate synthase,EPSPS)、编码上述合酶的分离的核酸序列,包含该序列或其编码 片段的核酸构建体,携有该序列或其编码片段或携有所述核酸构建体的载 体,以及用所述构建体或载体转化的宿主细胞。
背景技术
5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSPS)是芳香族氨基酸合成途径中 的关键酶,存在于植物和细菌中。草甘膦(Glyphosate),即N-膦酰甲基甘氨 酸,是一种广谱、高效的发芽后除草剂。它是EPSPS合成底物磷酸烯醇式 丙酮酸(PEP)的竞争性抑制剂,可阻断PEP和3-磷酸莽草酸这两种底物在 EPSPS催化下向5-烯醇丙酮酰莽草酸-3-磷酸莽草酸的转化,从而阻断芳香 族氨基酸合成前体-莽草酸的合成途径,导致植物和细菌死亡。
植株对草甘膦的耐受性可通过向它们的基因组稳定引入草甘膦耐受型 EPSPS编码基因而获得。目前已知的草甘膦耐受性EPSPS基因主要有两大 类:I类(如US 4,971,908;US 5,310,667;US 5,866,775等)和II类(如US 5,627,061;US 5,633,435等),它们都已成功导入植物基因组中,获得了具 有草甘膦耐受性的植物细胞,以及完整的植株。
本发明的目的是寻找一种新的能耐受草甘膦的天然序列EPSPS。
发明内容
发明目的
本发明一个目的是提供一种新分离的编码草甘膦耐受型EPSPS蛋白的 核酸序列。
本发明另一目的是提供一种新的草甘膦耐受型EPSPS蛋白。
本发明还有一个目的是提供一种由上述核酸序列与使上述核酸序列在 相应宿主细胞中表达所必需的调控序列可操作地连接而形成的核酸构建 体。所述调控序列具体可任选包括启动子、增强子、前导序列、聚腺苷酸 化信号、以及转录和翻译的起始和终止序列等。
本发明还有一个目的是提供一种含有上述核酸序列或核酸构建体的载 体。
本发明还有一个目的是提供由上述核酸构建体或载体所转化的宿主细 胞,该宿主细胞可以在适当的条件下表达上述核酸序列所编码的蛋白,并 使该蛋白具有的EPSPS酶活性以及草甘膦耐受性,从而使该宿主细胞具有 草甘膦耐受性。
本发明还有一个目的是提供上述宿主细胞及其后代细胞,这些细胞中 含有上述核酸序列或其编码片段、核酸构建体、或载体,并且这些细胞具 有草甘膦耐受性。
本发明的其它目的还可以体现在以下对本发明的详细描述以及具体实 施例中。
发明概述
本发明提供了一种具有天然序列的草甘膦耐受型5-烯醇丙酮酰莽草酸 -3-磷酸合酶(EPSPS)。所谓“天然序列”是指未经人工诱变,或其它生物学 或化学改造,如基因工程改造的序列。本发明提供了该EPSPS的分离的氨 基酸序列(即序列表中的序列3),在该序列的基础上进行任何改动,如缺失、 添加和/或取代一或多个氨基酸残基,最终所得氨基酸序列只要能形成具有 EPSPS活性和草甘膦耐受性的蛋白,也都包括在本发明的范围内。
本发明还提供了分离的编码所述EPSPS的核酸序列(即序列表中的序 列2,尤其其中的编码区),在该序列的基础上进行任何改动,如缺失、添 加和/或取代一或多个核苷酸,最终所得核酸序列只要能编码具有EPSPS活 性和草甘膦耐受性的蛋白,也都包括在本发明的范围内。
将本发明编码EPSPS的核酸序列与相对于该序列同源或异源的其它序 列可操作地连接,就构成本发明的核酸构建体。
根据本发明的方法,可将本发明的核酸构建体,或者直接将本发明的分 离的核酸序列导入载体,用该载体转化特定的宿主细胞,从而表达本发明的 EPSPS酶并使得该重组宿主细胞获得草甘膦耐受性。或者不通过载体转化, 而是直接将本发明的分离的核酸序列,或本发明的核酸构建体用常规方法, 如电穿孔等导入宿主细胞,同样可以表达本发明的EPSPS酶并赋予该细胞 草甘膦耐受性。如此所获得的载体和重组宿主细胞,以及获得该细胞的方法, 都包括在本发明的范围之内。
定义
本文中“序列同源性%”是指通过序列对比,并且必要时插入空隙以获 得同源性的最大百分比,而不考虑序列同源性的任何保守取代时,候选序列 中相同于目标序列的氨基酸残基的百分数。此处所述序列包括氨基酸序列和 核苷酸序列。可使用本领域已知的各种方法测定序列同源性百分比,例如, 使用公众可得到的计算机软件如BLAST、BLAST-2、ALIGN、ALIGN-2或 Megalign(DNASTAR)。本领域技术人员可以确定用于序列对比的具体参数, 以及全长序列的最大比较所需的任何算法。
本文中“核酸构建体”指单链或双链核酸分子,这些分子分离自天然基 因或已经过改变而含有以自然界不存在的方式而结合和并列的核酸片段。当 核酸构建体含有表达本发明EPSPS所需的所有调控序列时,术语“核酸构 建体”与“表达盒”是同义词。
本文中“调控序列”包括表达本发明多肽所必需的或有利的所有元件。 每一种调控序列既可以是编码该多肽的核酸序列天然具有的,也可以是外来 的。这种调控序列包括,但不限于,前导序列、聚腺苷酸化序列、前肽序列、 启动子、和转录终止子。调控序列最少应包括启动子、以及转录和翻译终止 信号。为了导入特异的限制性酶切位点以有助于调控序列和编码异源多肽的 核酸序列的编码区进行连接,可以制备带有接头的调控序列。
本文中“可操作地连接”定义为使本发明的分离的核酸序列与相对于该 序列同源或异源的任何其它序列相连,从而使它们作为一个整体能编码一种 产物。需要时,可通过一定方式,如通过限制性内切酶的酶切而使它们分离。 这里所述的同源或异源序列可以是任何序列,如能指导本发明所述分离的核 酸序列在特定宿主细胞中表达的任何调控序列,或与本发明所述分离的核酸 序列共同编码一种融合蛋白的序列,等等。
本文中“宿主细胞”包括任何能接受本发明所述分离的核酸序列,或能 接受含有该序列的构建体或载体,并使该序列稳定维持在细胞内的细胞。宿 主细胞包含了本发明所述分离的核酸序列后,能获得由该序列编码的性状 或特征。
发明详述
本发明人意外地发现并分离出一种新的草甘膦耐受型EPSPS编码基 因。本发明人测定并在本文中公开了该基因的编码序列,即序列表中编号 为2的序列以及其中明确指示的编码区(CDS,为第574-1800位的核苷酸)。 本发明还公开了由该CDS编码的氨基酸序列,即序列表中编号为3的序列。 本发明人使用DNAMAN 4.0版,按照CLUSTAL格式,将序列3所示氨基 酸序列与已知的I类和II类EPSPS的序列比较后发现,本发明的序列中不 含有被以往专利所保护的任何序列(见图2)。在GenBank蛋白序列库中进行 的BLAST搜索发现,本发明的序列3与醋酪酸梭状芽孢杆菌EPSPS的氨基 酸序列有37%同源性,与大肠杆菌EPSPS的氨基酸序列有20%同源性(见 图2)。将序列2中574-1800位核苷酸所示的序列用NCBI-BLAST搜索, 未发现与现有任何核酸序列的同源性。因此认为本发明所述的核酸序列和 蛋白是新的。
因此,本发明一个方面涉及一种分离的核酸序列,其含有序列表中编 号为2的核酸序列并可编码草甘膦耐受性EPSPS。
本发明还涉及含有上述序列2中第574-1800位核苷酸所示序列的分 离的核酸序列,其可编码草甘膦耐受性EPSPS。
本发明还涉及在上述序列2所示序列,或上述序列2的第574-1800 位核苷酸所示序列中改变一或多个核苷酸,或缺失和/或添加3个或3的倍 数个核苷酸而产生的核酸序列,且该核酸序列能编码具有5-烯醇式丙酮酰 莽草酸-3-磷酸合酶(EPSPS)活性和草甘膦耐受性的蛋白。这里所述的核苷酸 改变,缺失和添加是本领域技术范畴之内的常规内容。
本发明还涉及与用上述序列2所限定的核酸序列,或与用上述序列2 的第574-1800位核苷酸所限定的核酸序列具有一定同源性的核酸序列, 如同源性至少约65%,优选至少约66%,优选至少约67%,优选至少约 68%,优选至少约69%,优选至少约70%,优选至少约71%,优选至少约 72%,优选至少约73%,优选至少约74%,优选至少约75%,优选至少约 76%,优选至少约77%,优选至少约78%,优选至少约79%,更优选至少 约80%,更优选至少约81%,更优选至少约82%,更优选至少约83%,更优 选至少约84%,更优选至少约85%,更优选至少约86%,更优选至少约87 %,更优选至少约88%,更优选至少约89%,更优选至少约90%,更优选 至少约91%,更优选至少约92%,更优选至少约93%,更优选至少约94 %,最优选至少约95%,最优选至少约96%,最优选至少约97%,最优选 至少约98%,最优选至少约99%,只要该序列编码具有草甘膦耐受性EPSPS 活性的蛋白就属于本发明的范围。
本发明所述分离的核酸序列可按照本发明实施例部分所述方法从自然 界克隆而获得。克隆方法可包括:限制酶切割并分离含有编码目标蛋白的核 酸序列的预期核酸片段,将该片段插入载体分子中,将该重组载体掺入到宿 主细胞中,从而使该核酸序列的多个拷贝或克隆在该宿主细胞中复制。但是, 更简便的方法是,根据在此公开的核苷酸序列,用自动核苷酸合成仪(如 Applied Biosystems公司的ABI394 DNA合成仪)合成所述序列,或参照2000 年10月4日公开的中国专利申请99103472.4的方法,分别合成上述核酸序 列的片段,然后用常规连接酶和载体将这些片段连接成完整序列。
本发明的核酸序列可以是基因组序列、cDNA序列、RNA序列、半合 成的序列、完全人工合成的序列或其任何组合物。
本发明另一方面还涉及能编码具有EPSPS活性和草甘膦耐受性的蛋白 产物的分离的核酸序列,其中所述蛋白产物具有序列3所示氨基酸序列。
本发明还涉及能编码具有EPSPS活性和草甘膦耐受性的蛋白产物的分 离的核酸序列,其中所述蛋白产物的氨基酸序列相对于上述序列3所示氨基 酸序列,有一或多个氨基酸的取代、缺失和/或添加,但该产物仍具有EPSPS 活性和草甘膦耐受性。所述氨基酸的取代、缺失和/或添加都是本领域常规 技术可以完成的。优选这种氨基酸变化为:小的特性改变,即不显著影响蛋 白的折叠和/或活性的保守氨基酸取代;小的缺失,通常约1-30个氨基酸的 缺失;小的氨基或羧基端延伸,例如氨基端延伸一个甲硫氨酸残基;小的连 接肽,例如约20-25个残基长。
保守取代的实例是在下列氨基酸组内发生的取代:碱性氨基酸(如精氨 酸、赖氨酸和组氨酸)、酸性氨基酸(如谷氨酸和天冬氨酸)、极性氨基酸(如 谷氨酰胺、天冬酰胺)、疏水性氨基酸(如亮氨酸、异亮氨酸和缬氨酸)、芳香 氨基酸(如苯丙氨酸、色氨酸和酪氨酸),以及小分子氨基酸(如甘氨酸、丙氨 酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变特定活性的那些氨基酸取代 在本领域内是众所周知的,并且已由,例如,N.Neurath和R.L.Hill在1979 年纽约学术出版社(Academic Press)出版的Protein中进行了描述。最常见的 互换有Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val, Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu, 和Asp/Gly,以及它们相反的互换。
对于本领域的技术人员而言很明显,这种取代可以在对分子功能起重要 作用的区域之外发生,而且仍产生活性多肽。对于由本发明的分离的核酸序 列编码的多肽,其活性必需的并因此选择不被取代的氨基酸残基,可以根据 本领域已知的方法,如定点诱变或丙氨酸扫描诱变进行鉴定(如参见, Cunningham和Wells,1989,Science 244:1081-1085)。后一技术是在分子 中每一个带正电荷的残基处引入突变,检测所得突变分子的草甘膦耐受性 EPSPS活性,从而确定对该分子活性而言重要的氨基酸残基。底物-酶相互 作用位点也可以通过其三维结构的分析来测定,这种三维结构可由核磁共振 分析、结晶学或光亲合标记等技术测定(参见,如de Vos等,1992, Science 255: 306-312;Smith等,1992, J.Mol.Biol 224:899-904;Wlodaver等,1992, FEBS Letters 309:59-64)。
本发明还涉及与上述序列3所示氨基酸序列具有一定同源性的氨基酸 序列,如同源性至少约50%,优选至少约60%,优选至少约65%,优选至 少约66%,优选至少约67%,优选至少约68%,优选至少约69%,优选至 少约70%,优选至少约71%,优选至少约72%,优选至少约73%,优选至 少约74%,优选至少约75%,优选至少约76%,优选至少约77%,优选至 少约78%,优选至少约79%,更优选至少约80%,更优选至少约81%,更 优选至少约82%,更优选至少约83%,更优选至少约84%,更优选至少约 85%,更优选至少约86%,更优选至少约87%,更优选至少约88%,更优 选至少约89%,更优选至少约90%,更优选至少约91%,更优选至少约92 %,更优选至少约93%,更优选至少约94%,最优选至少约95%,最优选 至少约96%,最优选至少约97%,最优选至少约98%,最优选至少约99 %,只要具有所述同源序列的蛋白为草甘膦耐受性EPSPS蛋白,该序列就 属于本发明的范围。
由本发明的分离的核酸序列编码的蛋白,具有含序列3所示氨基酸序列 之EPSPS的活性的至少20%,优选至少40%,更优选至少60%,甚至更优 选至少80%,甚至更优选至少90%,最优选至少100%。
本发明还涉及含有上述定义的核酸序列,或其中的编码序列(如本文中, 序列2的574-1800位核苷酸)的核酸构建体。
本发明的核酸构建体还含有能使上述序列在所选宿主细胞中表达所必 需的调控序列。所述调控序列与上述分离的核酸序列在核酸构建体中可操作 地连接。
调控序列可以是启动子序列,包括介导多肽的表达的转录调控序列。启 动子可以是在细胞中显示转录活性的任何核酸序列,包括突变的、截短的、 及杂合的启动子,而且可以从编码细胞外或细胞内多肽的基因中得到,这些 多肽可以与该细胞同源或不同源。众多用于原核细胞的启动子为本领域所熟 知。
调控序列也可以是适当的转录终止序列,即被本文所述的宿主细胞识别 以终止转录的序列。该终止序列与编码多肽的核酸序列的3’端可操作地连 接。任何在宿主细胞中有功能的终止子都可以在本发明中使用。
调控序列可以是适当的前导序列,即mRNA上对细胞的翻译很重要的 非翻译区。前导序列与编码多肽的核酸序列的5’端可操作地连接。任何在宿 主细胞中有功能的前导序列都可以在本发明中使用。
调控序列也可以是聚腺苷酸化序列。该序列与核酸序列的3’端可操作 地连接,而且当转录时,被细胞作为信号来识别,从而将聚腺苷酸残基加到 转录出的mRNA上。任何在该细胞中有功能的聚腺苷酸化序列都可以在本 发明中使用。
核酸构建体还可以包括一个或多个这样的核酸序列,这些核酸序列编码 一个或多个有利于指导异源多肽表达的因子,例如,转录激活因子(如反式 作用因子)、伴侣蛋白和加工型蛋白酶。任何在宿主细胞特别是细菌细胞和 植物细胞中有效的因子都可以在本发明中使用。编码一个或多个这些因子的 核酸不一定与编码异源多肽的核酸序列串联。
可以将上述各种核酸和调控序列连接在质粒或病毒等常规载体上,产生 本发明的“重组表达载体”,所用方法是本领域技术人员所熟知的(可参见J. Sambrook,E.F.Fritsch和T.Maniatus,1989, Molecullar Cloning,laboratorVmannual,2th ed,Cold Spring,NY)。所述载体可以包含一个或多个便利的 限制性内切酶位点。载体的选择通常取决于载体与所用宿主细胞的兼容性。 所述载体可以是线性或闭合环状质粒。这样的载体可以是自主复制型载体, 即,以染色体外实体的形式存在的载体,其复制独立于染色体的复制,如质 粒(一种染色体外元件),微型染色体,或人工染色体。载体可以包含确保自 我复制的任何手段。或者,所述载体也可在导入细胞后,整合到基因组中并 随染色体一起复制。载体系统可以是单一载体或质粒或两个或多个载体或质 粒(它们共同包含目标核酸序列),或是转座子。
在载体向细胞基因组整合的情况中,该载体可以包含指导该载体通过同 源重组整合入细胞基因组的附加核酸序列。这些附加的核酸序列能够使该载 体在染色体的精确位置整合入基因组中。为了增加在精确位置整合的可能 性,整合元件应该优选包含足够数量的核酸,例如100至1500个碱基对, 优选400至1500个碱基对,最优选800至1500个碱基对,它们与其相应的 靶序列高度同源以提高同源重组的可能性。这些整合元件可以是与细胞基因 组中靶序列同源的任何序列。而且,这些整合元件可以是非编码或编码型核 酸序列。另一方面,该载体可以通过非同源重组整合入细胞的基因组中。
在自主复制的情况中,该载体可以进一步包含使该载体能在细菌细胞和 植物细胞中自主复制的复制起始点。
本发明还涉及含有本发明核酸序列的重组“宿主细胞”。可将含有本发 明核酸序列的核酸构建体或载体引入宿主细胞中,使本发明的核酸序列整合 至染色体上或使载体自主复制,从而本发明的核酸序列得以在该宿主细胞中 稳定表达,导致赋予该宿主细胞抗草甘膦的抗性。
宿主细胞可以是原核生物如细菌的细胞,但更优选真核生物如植物的细 胞。
常用的细菌细胞有革兰氏阳性细菌如芽孢杆菌的细胞,或革兰氏阴性细 菌如大肠杆菌和假单胞菌的细胞。在一个优选的实施方案中,细菌宿主细胞 大肠杆菌的细胞。
将表达载体引入细菌宿主细胞可通过原生质体转化(如Chang和 Cohen,1979,分子普通遗传学168:111-115),利用感受态细胞(如Young 和Spizizin,1961,J.Bacteriol.81:823-829,或Dubnau和Davidoff-Abelson, 1971,J.Mol.Biol.56:209-221),通过电穿孔(如Shigekawa和Dower,1988, Biotech.6:742-751),或通过接合作用(如Koehler和Thorne,1987,J.Bacteriol. 169:5771-5278)而实现。
附图说明
图1显示pKU2004的质粒图谱。
图2显示恶臭假单胞菌P.P4G-1的EPSPS与多个已知EPSPS的氨基酸 序列比较。图中方框和阴影所示为以往专利所具体要求保护的序列。
图3显示带不同EPSPS基因的大肠杆菌XL1-BLUE MR在不同草甘膦 浓度下的生长曲线。
具体实施方式
实施例1. 草甘膦耐受菌株的分离
在河北省保定市附近一个草甘膦生产厂周围土壤中采样,用含有一定浓 度草甘膦的培养基进行有效分离,共得到48株对草甘膦有很强耐受和降解 能力的菌株,其中一株菌4G-1可以在400mM草甘膦限制性培养基上生长, 而且对100mg/L的氨苄青霉素具有抗性,选择此菌株进行进一步研究。
实施例2. 草甘膦耐受菌株的鉴定
a) 4G-1菌总DNA的小量制备
在3ml含100mg/L氨苄青霉素的LB液体培养基中接种4G-1菌株,28 ℃振荡过夜培养,12000rpm/min离心收集菌体,将所得离心产物重悬于0.5ml 溶液I(10mM NaCl,20mM Tris-Hcl pH 8.0,1mM EDTA)中,加入蛋白酶K (Merck,德国)和SDS至终浓度分别为10μg/ml和0.5%。小心颠倒混匀,50℃ 放置6小时以上。加入等体积的酚,小心颠倒混匀,室温放置10min。室温 12000rpm/min离心5min,用枪头(AxyGen,USA)吸取上清水相,再用等体 积酚/氯仿抽提一遍。在上清液中加入10%3M NaAC,加2.3倍体积的无水 乙醇沉淀,于-10℃12000rpm/min离心25min。弃去上清,再加70%乙醇500μl 洗涤,12000rpm/min离心1分钟,尽量吸尽上清,在Savant中抽干20min 或37℃温箱中晾干1hr,加入100μl TE溶液(10mM Tris-Cl,1mM EDTA, pH8.0)将其溶解,置-20℃中冻存备用。
b) 4G-1菌株16S rRNA的克隆
合成一对16S rRNA的通用引物(引物1:5’AGA GTT TGA TCA TGG CTC AG 3’和引物2:5’TAC GGT TAC CTT GTT ACG ACT T 3’)。用这一对 引物在Robocycler 40(Stratagene)中进行PCR扩增反应。反应体系为:1μl 4G-1菌株总DNA为模板,5μl缓冲液,4μl 10μmol dNTP,1μl 20 pmol/μl引 物1和1μl 20pmol/μl引物2,37μl去离子水。反应条件为:94℃10min,加 入1μl 5U Pyrobest Taq DNA聚合酶,然后以94℃1min、50℃1min、72 ℃2min进行30个循环,最后72℃再延伸10min。得到一段约1.5kb的片 段。按照PCR产物纯化试剂盒供应商Boehringer提供的方法提纯PCR产物。
将PCR纯化产物进行加A(脱氧腺苷酸)反应。反应体系为:20μl(2μg) PCR纯化产物,5μl缓冲液,1μl(5U)Taq DNA聚合酶(鼎国公司,北京),4μl 5μmol dATP,20μl去离子水。
将反应产物按PCR产物的纯化方法纯化后,按照供应商Takara的说明 与T载体(Takara,大连)相连,得到质粒pKU2000。测序结果如序列1所示。 在美国国家生物信息中心(NCBI)用BLAST软件以及BLASTP 2.2.2 [Dec-14-2001]数据库进行序列比对,发现该序列与恶臭假单胞菌 (pseudomonas putida)16S rRNA的基因序列有99%同源性,因此推定4G-1 菌株为恶臭假单胞菌,将其命名为恶臭假单胞菌(pseudomonas putida)4G-1 (简称P.P4G-1),并于2002年4月30日将该菌株保藏在中国微生物菌种保 藏管理委员会普通微生物中心(中国.北京.中关村),保藏号为CGMCC 0739。
实施例3. 4G-1菌株基因文库的构建
a) 4G-1总DNA的大量制备
将P.P4G-1菌株接种至含100ml LB培养基(补加100mg/L氨苄青霉素) 的250ml锥形瓶中,28℃以200rpm/min振荡培养过夜,离心(8000转/min, 5min),将沉淀重悬于14ml上述溶液I中,加入蛋白酶K(Merck,德国)和 SDS至终浓度分别为10μg/ml和0.5%。小心颠倒混匀,50℃放置6 小、时。 加入等体积的酚,小心颠倒混匀,室温放置10min。室温4000mm/min离心 20min,用宽口枪头吸取上清水相,再加入等体积的酚/氯仿抽提一遍。在上 清液中加入10%3M NaAC(pH 5.5),加2.3倍体积的无水乙醇沉淀。用玻璃 棒小心挑出DNA,于70%乙醇中洗涤,弃去乙醇,晾干,加入2ml TE溶液 (pH 8.0)于4℃溶解24小时,得到约1mg总DNA。0.3%琼脂糖凝胶电泳确 定DNA片段在80Kb以上。
b) 回收总DNA的酶切片段
取200μl总DNA(100μg),加入5U限制性内切酶Sau3AI于室温分别酶 切消化20分钟,30分钟,45分钟。合并酶切消化产物,加入EDTA至终浓 度0.25mM,用等体积的酚/氯仿抽提,取上清加入10%3M醋酸钠,加2.3 倍体积的无水乙醇沉淀,沉淀物用70%乙醇洗涤,如上述抽干,加入200μl TE溶解,将其加入Beckman sw28超速离心管中的12ml 10-40%蔗糖密度梯 度上,将这些样品于20℃Beckman sw28转子中以120000g离心18小时, 从顶部收集各组分(0.5ml),每组分取15μl用0.3%琼脂糖凝胶电泳分析,合 并含有30-40kb DNA的组分,加入约2倍体积的去离子水,7倍体积的无水 乙醇,-20℃过夜沉淀,70%乙醇洗涤,干燥,溶于50μl TE中。
c) 4G-1基因文库的构建
按照Stratagne的方法将其提供的SuperCos l柯斯质粒载体先后用Xba I、碱性磷酸酶、BamHI处理,将其与上一步分离的总DNA片段相连。
按照Stratagene的说明书使用Gigapack III Gold的包装抽提物在体外包 装一份连接产物;用Stratagene的试剂盒在大肠杆菌XL 1-Blue MR(Stratagene) 上滴定文库。由此获得的文库按照同一供应商的说明加以扩增和储存。
实施例4.
具有草甘膦耐受性的EPSPS基因的分离、筛选、测序及分析
a) 具有草甘膦耐受性基因的文库的筛选
将1ml上述文库的储存液离心,弃去上清,加1ml灭菌生理盐水重悬, 离心弃去上清,加1ml灭菌生理盐水重悬。按照大约每平皿103个细菌的密 度涂布10mM草甘膦-50mg/L氨苄青霉素平板(20mM硫酸铵;0.4%葡萄糖; 10mM草甘膦;0.5mM磷酸氢二钾;0.1mg/L硫酸铁;0.5g/L硫酸镁;0.5g/L 氯化钙;2.1g/L氯化钠;50mM Tris(pH7.2);5mg/L维生素b1;15g/L琼脂), 37℃过夜培养,得到一个菌株,将此菌株命名为BDS,将其携带的柯斯质粒 命名为pKU2001。
b) 草甘膦耐受性基因的分离
将BDS菌株接种在50ml锥形瓶内20ml LB(补加50mg/L氨苄青霉素) 中,以300rpm/min 37℃摇床培养12hr,离心收集菌体后按 Molecullar cloning.laboratory manual,出处同上所述碱法提取质粒pKU2001。将其与柯斯质粒载 体重新转化入大肠杆菌XL1-Blue MR(Stratagene)中,于10mM草甘膦平板 划线,只带柯斯质粒空载体的菌株无法在草甘膦培养基上生长,而带有 pKU2001的菌株生长良好,证实pKU2001中确实带有抗草甘膦的基因。
将pKU2001用Sau3AI消化,用0.7%琼脂糖凝胶电泳回收2-4kb DNA 片段,与经BamH I酶切并已经去磷酸化的pUC18载体(Yanisch-Perron,C., Vieria,J.and Messing,J.1985,Gene 33:103-119)相连,转化入大肠杆菌 XL1-Blue MR(Stratagene)中,在补充50mg/L氨苄青霉素的10mM草甘膦板 上铺板,37℃过夜培养,得到数十个克隆,挑菌、提质粒,筛选得到携有 约2kb的外源片段的质粒,命名为pKU2002。将质粒pKU2002与pUC18 空载体分别转入大肠杆菌XL1-Blue MR(Stratagene)中,划线于补充有 50μg/ml氨苄青霉素的10mM草甘膦板上,带有pUC18空载体的菌株不能 在草甘膦平板上生长,而带有pKU2002质粒的菌株生长良好,证实质粒 pKU2002中确实带有抗草甘膦基因。
c)对pKU2002测序,得到1914bp克隆的全序列,见序列2。
d)用DNASIS软件对pKU2002进行序列分析,确定唯一可能的读码 框(ORF),见序列2中第574-1800位的核苷酸。其编码的氨基酸序列见序 列3。
e)将该蛋白序列在美国国家生物信息中心(NCBI)的GenBank蛋白序 列数据库中进行Blast搜索,发现与醋酪酸梭状芽孢杆菌EPSPS的氨基酸序 列有37%同源性,与大肠杆菌EPSPS的氨基酸序列有20%同源性。此 1230bp的序列可能编码一种EPSP合酶,将此基因命名为pparoA。分析表 明该基因不属于现有任何一种EPSPS类型,而是一种新型的EPSPS基因(第 III类)。大肠杆菌、醋酪酸梭状芽孢杆菌和P.P4G-1的EPSPS氨基酸序列比 较见图2。
f)设计一对含有下划线所示BamH I酶切位点的引物:
引物3:5’-CG G GAT CCT AAG TAA GTG AAA GTA ACA ATA CAG C-3’
引物4:5’-CG G GAT CCC TTC TTC GGA CAA TGA CAG AC-3’
以pKU2001为模板,进行PCR扩增。将扩增片段用BamH I酶切后插 入pUC18,得到质粒pKU2003,测序证明无错配碱基的引入;将pKU2003 用BamH I酶切,得到的小片段正向连入pACYC184(Chang,A.C.Y.,and Cohen,S.N.,1978,J.Bacteriol.134:1141-1156)的BamH I位点,得到质粒 pKU2004(图谱见图1),在此质粒中pparoA基因被pACYC184中的Tcr启动 子起始转录。
实施例5
大肠杆菌aroA基因的克隆及其草甘膦耐受性定位突变(对照实验)
将大肠杆菌ET8000(MacNeil,T.,MacNeil,D.,and Tyler,B.1982 J. Bacteriol.150:1302-1313)接种至15ml试管内3ml LB液体培养基中,37℃振 荡培养过夜,离心收集菌体,按照前述方法提取总DNA。
设计一对引物并引入如下划线所示的BamH I酶切位点:
引物5:5’-CG G GAT CCG TTA ATG CCG AAA TTT TGC TTA ATC-3’
引物6:5’-CG G GAT CCA GGT CCG AAA AAA AAC GCC GAC-3’
以大肠杆菌总DNA为模板扩增得到大肠杆菌的aroA基因,即大肠杆 菌中编码EPSPS蛋白的基因,将此基因用BamH I酶切,插入pUC18中得 到质粒pKU2005,测序得到序列10,该序列与NCBI的GenBank数据库中 大肠杆菌EPSPS的基因序列对比,证实无误。将质粒pKU2005用BamH I 酶切,回收小片段正向插入载体pACYC184的BamH I位点得到质粒 pKU2006。
对大肠杆菌的aroA基因进行点突变,将第287位的鸟嘌呤变为胞嘧啶, 从而使大肠杆菌EPSPS蛋白的96位甘氨酸突变为丙氨酸。将该基因片段同 样插入pACYC184 BamHI位点,得到质粒pKU2007。
实施例6. 大肠杆菌aroA-菌株的EPSPS功能互补实验
将pACYC 184、pKU2004、pKU2006、pKU2007转化入大肠杆菌AB2889 中(大肠杆菌aroA-菌株,来源于耶鲁大学),分别在含有终浓度25mg/L氯霉 素的限制性M63培养基(13.6g/L KH2PO4.0.5mg/L FeSO4-7H2O,20mM (NH4)2SO4,0.4%葡萄糖,1mM硫酸镁,0.5mg/L维生素B1)上划线培养,结 果如表1。
补加aAAS组分如下:
100mg/L苯丙氨酸
100mg/L酪氨酸
100mg/L色氨酸
5mg/L对氨基苯甲酸
5mg/L 2,3-二羟基苯甲酸
5mg/L对羟基苯甲酸
表1.大肠杆菌aroA缺失菌株EPSPS功能互补及草甘膦耐受性实验
AB2889 携带的质粒 EPSPS功能互补及抗草甘膦状况 M63培养基 M63培养基 (补加aAAS) 抗10mM草甘膦 pACYC184 - + - PKU2006 + + - pKU2007 + + + pKU2004 + + +
同时在液体培养条件下,对以上菌株的生长曲线进行了测定。结果表明, 与大肠杆菌aroA基因对照一样(pKU2006),pKU2004所携带的基因完全可 以在EPSPS功能上互补大肠杆菌AB2899的aroA缺陷,证明该质粒携带的 1230 bp核酸序列为EPSPS编码基因,同时该基因编码的EPSPS还具有草 甘膦耐受性。
实施例7. 新型EPSPS编码基因对草甘膦的抗性强度实验
将质粒pKU2004、pKU2006、pKU2007分别转化入大肠杆菌XL1-Blue MR中,然后分别接种在M63限制性培养基中过夜培养,再转接入补加了不 同浓度草甘膦的M63限制性培养基中培养,测它们的生长曲线。结果发现 转化有pKU2006的大肠杆菌在5mM草甘膦培养基中生长已受到较明显的抑 止,在40mM草甘膦培养基中已停止生长,而转化有pKU2004和pKU2006 的大肠杆菌在40mM草甘膦培养基中生长未受到明显抑制,转化有pKU2004 的大肠杆菌在120mM的草甘膦培养基中还能生长良好(图3:生长曲线)。
序列表
<110>北京大学
<120>新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合成酶及其编码基因
<130>PJMD3540N
<141>2002-04-30
<160>12
<170>PatentIn version 3.1
<210>1
<211>1501
<212>DNA
<213>恶臭假单胞菌P.P4G-1(Pseudomonas putida P.P4G-1)
<400>1
agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc 60
ggatgagaag agcttgctct tcgattcagc ggcggacggg tgagtaatgc ctaggaatct 120
gcctggtagt gggggacaac gtttcgaaag gaacgctaat accgcatacg tcctacggga 180
gaaagcaggg gaccttcggg ccttgcgcta tcagatgagc ctaggtcgga ttagctagtt 240
ggtgaggtaa tggctcacca aggcgacgat ccgtaactgg tctgagagga tgatcagtca 300
cactggaact gagacacggt ccagactcct acgggaggca gcagtgggga atattggaca 360
atgggcgaaa gcctgatcca gccatgccgc gtgtgtgaag aaggtcttcg gattgtaaag 420
cactttaagt tgggaggaag ggcattaacc taatacgtta gtgttttgac gttaccgaca 480
gaataagcac cggctaactc tgtgccagca gccgcggtaa tacagagggt gcaagcgtta 540
atcggaatta ctgggcgtaa agcgcgcgta ggtggtttgt taagttggat gtgaaagccc 600
cgggctcaac ctgggaactg tatccaaaac tggcaagcta gagtacggta gagggtggtg 660
gaatttcctg tgtagcggtg aaatgcgtag atataggaag gaacaccagt ggcgaaggcg 720
accacctgga ctgatactga cactgaggtg cgaaagcgtg gggagcaaac aggattagat 780
accctggtag tccacgccgt aaacgatgtc aactagccgt tggaatcctt gagattttag 840
tggcgcagct aacgcattaa gttgaccgcc tggggagtac ggccgcaagg ttaaaactca 900
aatgaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg aagcaacgcg 960
aagaacctta ccaggccttg acatgcagag aactttccag agatggattg gtgccttcgg 1020
gaactctgac acaggtgctg catggctgtc gtcagctcgt gtcgtgagat gttgggttaa 1080
gtcccgtaac gagcgcaacc cttgtcctta gttaccagca cgtaatggtg ggcactctaa 1140
ggagactgcc ggtgacaaac cggaggaagg tggggatggc gtcaagtcat catggccctt 1200
acggcctggg ctacacacgt gctacaatgg tcggtacaga gggttgccaa gccgcgaggt 1260
ggagctaatc tcacaaaacc gatcgtagtc cggatcgcag tctgcaactc gactgcgtga 1320
agtcggaatc gctagtaatc gcgaatcaga atgtcgcggt gaatacgttc ccgggccttg 1380
tacacaccgc ccgtcacacc atgggagtgg gttgcaccag aagtagctag tctaaccttc 1440
gggaggacgg ttaccacggt gtgattcatg actggggtga agtcgtaaca aggtaaccgt 1500
a 1501
<210>2
<211>1914
<212>DNA
<213>恶臭假单胞菌P.P4G-1(Pseudomonas putida P.P4G-1)
<220>
<221>CDS
<222>(574)..(1803)
<223>
<400>2
gatcataaaa catgcttgta taaaggatgc tgccatgttc cgtgaactgg aagcgaacaa 60
tcttgcggta tatcagaaaa agccaaagct gattgcagtg cttcttcagc gtaatgctca 120
gttaaaagcg aaggttgttc aggaggatga gttcgaaaag tcggtaaggc gtttgttgaa 180
ctttggtcat acattggggc atgccatcga aaatgaatat gcgttgatgc atggccatgc 240
ggttgctata ggaatgacat acgcgtgtca tatttctgag caattgtctg gattcaaaca 300
aacaaatcgc gtggtagaag tgttggaaca atatgggtta ccgacttata tggcattcga 360
tagggaaaag gcttttaatc tgttgaaaat ggacaagaag cgtgaaaaaa aggaaatgaa 420
ctatgtgttg ctggaaaaag tagggaaggg agtggtgaag agtattccac tggttcaatt 480
agaaaaaatc attcaagcat taccaaagtg aaagtaacaa tacagcccgg agatctgact 540
ggaattatcc agtcacccgc ttcaaaaagt tcg atg cag cga gct tgt gct gct 594
Met Gln Arg Ala Cys Ala Ala
1 5
gca ctg gtt gca aaa gga ata agt gag atc att aat ccc ggt cat agc 642
Ala Leu Val Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser
10 15 20
aat gat gat aaa gct gcc agg gat att gta agc cgg ctt ggt gcc agg 690
Asn Asp Asp Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg
25 30 35
ctt gaa gat cag cct gat ggt tct ttg cag ata aca agt gaa ggc gta 738
Leu Glu Asp Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val
40 45 50 55
aaa cct gtc gct cct ttt att gac tgc ggt gaa tct ggt tta agt atc 786
Lys Pro Val Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile
60 65 70
cgg atg ttt act ccg att gtt gcg ttg agt aaa gaa gag gtg acg atc 834
Arg Met Phe Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile
75 80 85
aaa gga tct gga agc ctt gtt aca aga cca atg gat ttc ttt gat gaa 882
Lys Gly Ser Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu
90 95 100
att ctt ccg cat ctc ggt gta aaa gtt aaa tct aac cag ggt aaa ttg 930
Ile Leu Pro His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu
105 110 115
cct ctc gtt ata cag ggg cca ttg aaa cca gca gac gtt acg gtt gat 978
Pro Leu Val Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp
120 125 130 135
ggg tec tta agc tct cag ttc ctt aca ggt ttg ttg ctt gca tat gcg 1026
Gly Ser Leu Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala
140 145 150
gcc gca gat gca agc gat gtt gcg ata aaa gta acg aat ctc aaa agc 1074
Ala Ala Asp Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser
155 160 165
cgt ccg tat atc gat ctt aca ctg gat gtg atg aag cgg ttt ggt ttg 1122
Arg Pro Tyr Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu
170 175 180
aag act ccc gag aat cga aac tat gaa gag ttt tat ttc aaa gcc ggg 1170
Lys Thr Pro Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly
185 190 195
aat gta tat gat gaa acg aaa atg caa cga tac acc gta gaa ggc gac 1218
Asn Val Tyr Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp
200 205 210 215
tgg agc ggt ggt gct ttt tta ctg gta gcg ggg gct att gcc ggg ccg 1266
Trp Ser Gly Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro
220 225 230
atc acg gta aga ggt ttg gat ata gct tcg acg cag gct gat aaa gcg 1314
Ile Thr Val Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala
235 240 245
atc gtt cag gct ttg atg agt gcg aac gca ggt att gcg att gat gca 1362
Ile Val Gln Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala
250 255 260
aaa gag atc aaa ctt cat cct gct gat ctc aat gca ttt gaa ttt gat 1410
Lys Glu Ile Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp
265 270 275
gct act gat tgc ccg gat ctt ttt ccg cca ttg gtt gct ttg gcg tct 1458
Ala Thr Asp Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser
280 285 290 295
tat tgc aaa gga gaa aca aag atc aaa ggc gta agc agg ctg gcg cat 1506
Tyr Cys Lys Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His
300 305 310
aaa gaa agt gac aga gga ttg acg ctg cag gac gag ttc ggg aaa atg 1554
Lys Glu Ser Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met
315 320 325
ggt gtt gaa atc cac ctt gag gga gat ctg atg cgc gtg atc gga ggg 1602
Gly Val Glu Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly
330 335 340
aaa ggc gta aaa gga gct gaa gtt agt tca agg cac gat cat cgc att 1650
Lys Gly Val Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile
345 350 355
gcg atg gct tgc gcg gtg gct gct tta aaa gct gtg ggt gaa aca acc 1698
Ala Met Ala Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr
360 365 370 375
atc gaa cat gca gaa gcg gtg aat aaa tcc tac ccg gat ttt tac agc 1746
Ile Glu His Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser
380 385 390
gat ctt aaa caa ctt ggc ggt gtt gta tct tta aac cat caa ttt aat 1794
Asp Leu Lys Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn
395 400 405
ttc tca tga atagcttcgg ccgcatcttc agggtgcata tttttggcga 1843
Phe Ser
atcacatggt gaatcagtag gcatcgttat tgatggttgt cctgctggtc tgtcattgtc 1903
cgaagaagat c 1914
<210>3
<211>409
<212>PRT
<213>恶臭假单胞菌P.P4G-1(Pseudomonas put ida P.P4G-1)
<400>3
Met Gln Arg Ala Cys Ala Ala Ala Leu Val Ala Lys Gly Ile Ser Glu
1 5 10 15
Ile Ile Asn Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg Asp Ile
20 25 30
Val Ser Arg Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly Ser Leu
35 40 45
Gln Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Asp Cys
50 55 60
Gly Glu Ser Gly Leu Ser Ile Arg Met Phe Thr Pro Ile Val Ala Leu
65 70 75 80
Ser Lys Glu Glu Val Thr Ile Lys Gly Ser Gly Ser Leu Val Thr Arg
85 90 95
Pro Met Asp Phe Phe Asp Glu Ile Leu Pro His Leu Gly Val Lys Val
100 105 110
Lys Ser Asn Gln Gly Lys Leu Pro Leu Val Ile Gln Gly Pro Leu Lys
115 120 125
Pro Ala Asp Val Thr Val Asp Gly Ser Leu Ser Ser Gln Phe Leu Thr
130 135 140
Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Val Ala Ile
145 150 155 160
Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr Ile Asp Leu Thr Leu Asp
165 170 175
Val Met Lys Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn Tyr Glu
180 185 190
Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr Asp Glu Thr Lys Met Gln
195 200 205
Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu Leu Val
210 215 220
Ala Gly Ala Ile Ala Gly Pro Ile Thr Val Arg Gly Leu Asp Ile Ala
225 230 235 240
Ser Thr Gln Ala Asp Lys Ala Ile Val Gln Ala Leu Met Ser Ala Asn
245 250 255
Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile Lys Leu His Pro Ala Asp
260 265 270
Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu Phe Pro
275 280 285
Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys Ile Lys
290 295 300
Gly Val Ser Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu Thr Leu
305 310 315 320
Gln Asp Glu Phe Gly Lys Met Gly Val Glu Ile His Leu Glu Gly Asp
325 330 335
Leu Met Arg Val Ile Gly Gly Lys Gly Val Lys Gly Ala Glu Val Ser
340 345 350
Ser Arg His Asp His Arg Ile Ala Met Ala Cys Ala Val Ala Ala Leu
355 360 365
Lys Ala Val Gly Glu Thr Thr Ile Glu His Ala Glu Ala Val Asn Lys
370 375 380
Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly Val Val
385 390 395 400
Ser Leu Asn His Gln Phe Asn Phe Ser
405
<210>4
<211>20
<212>DNA
<213>人工序列
<400> 4
agagtttgat catggctcag 20
<210>5
<211>22
<212>DNA
<213>人工序列
<400>5
tacggttacc ttgttacgac tt 22
<210>6
<211>34
<212>DNA
<213>人工序列
<400>6
cgggatccta agtaagtgaa agtaacaata cagc 34
<210>7
<211>29
<212>DNA
<213>人工序列
<400>7
cgggatccct tct tcggaca atgacagac 29
<210>8
<211>33
<212>DNA
<213>人工序列
<400>8
cgggatccgt taatgccgaa attttgctta atc 33
<210>9
<211>30
<212>DNA
<213>人工序列
<400>9
cgggatccag gtccgaaaaa aaacgccgac 30
<210>10
<211>1436
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>10
gttaatgccg aaattttgct taatccccac agccagcctg tggggttttt atttctgttg 60
tagagagttg agttcatgga atccctgacg ttacaaccca tcgctcgtgt cgatggcact 120
attaatctgc ccggttccaa gagcgtttct aaccgcgctt tattgctggc ggcattagca 180
cacggcaaaa cagtattaac caatctgctg gatagcgatg acgtgcgcca tatgctgaat 240
gcattaacag cgttaggggt aagctatacg ctttcagccg atcgtacgcg ttgcgaaatt 300
atcggtaacg gcggtccatt acacgcagaa ggtgccctgg agttgttcct cggtaacgcc 360
ggaacggcaa tgcgtccgct ggcggcagct ctttgtctgg gtagcaatga tattgtgctg 420
accggtgagc cgcgtatgaa agaacgcccg attggtcatc tggtggatgc gctgcgcctg 480
ggcggggcga agatcactta cctggaacaa gaaaattatc cgccgttgcg tttacagggc 540
ggctttactg gcggcaacgt tgacgttgat ggctccgttt ccagccaatt cctcaccgca 600
ctgttaatga ctgcgcctct tgcgccggaa gatacggtga ttcgtattaa aggcgatctg 660
gtttctaaac cttatatcga catcacactc aatctgatga agacgtttgg tgttgaaatt 720
gaaaatcagc actatcaaca atttgtcgta aaaggcgggc agtcttatca gtctccgggt 780
acttatttgg tcgaaggcga tgcatcttcg gcttcttact ttctggcagc agcagcaatc 840
aaaggcggca ctgtaaaagt gaccggtatt ggacgtaaca gtatgcaggg tgatattcgc 900
tttgctgatg tgctggaaaa aatgggcgcg accatttgct ggggcgatga ttatatttcc 960
tgcacgcgtg gtgaactgaa cgctattgat atggatatga accatattcc tgatgcggcg 1020
atgaccattg ccacggcggc gttatttgca aaaggcacca ccacgctgcg caatatctat 1080
aactggcgtg ttaaagagac cgatcgcctg tttgcgatgg caacagaact gcgtaaagtc 1140
ggcgcggaag tggaagaggg gcacgattac attcgtatca ctcctccgga aaaactgaac 1200
tttgccgaga tcgcgacata caatgatcac cggatggcga tgtgtttctc gctggtggcg 1260
ttgtcagata caccagtgac gattcttgat cccaaatgca cggccaaaac atttccggat 1320
tatttcgagc agctggcgcg gattagccag gcagcctgaa tgaacaacgg gcaataaata 1380
gccaaatctt tctttatcaa aacgtcggca cattgtcggc gttttttttc ggacct 1436
<210>11
<211>1284
<212>DNA
<213>大肠杆菌(Escherichia coli)
<220>
<221>CDS
<222>(1)..(1284)
<223>
<400>11
atg gaa tcc ctg acg tta caa ccc atc gct cgt gtc gat ggc act att 48
Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile
1 5 10 15
aat ctg ccc ggt tcc aag agc gtt tct aac cgc gct tta ttg ctg gcg 96
Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala
20 25 30
gca tta gca cac ggc aaa aca gta tta acc aat ctg ctg gat agc gat 144
Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp
35 40 45
gac gtg cgc cat atg ctg aat gca tta aca gcg tta ggg gta agc tat 192
Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr
50 55 60
acg ctt tca gcc gat cgt acg cgt tgc gaa att atc ggt aac ggc ggt 240
Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly
65 70 75 80
cca tta cac gca gaa ggt gcc ctg gag ttg ttc ctc ggt aac gcc gga 288
Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly
85 90 95
acg gca atg cgt ccg ctg gcg gca gct ctt tgt ctg ggt agc aat gat 336
Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp
100 105 110
att gtg ctg acc ggt gag ccg cgt atg aaa gaa cgc ccg att ggt cat 384
Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His
115 120 125
ctg gtg gat gcg ctg cgc ctg ggc ggg gcg aag atc act tac ctg gaa 432
Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu
130 135 140
caa gaa aat tat ccg ccg ttg cgt tta cag ggc ggc ttt act ggc ggc 480
Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly GIy
145 150 155 160
aat gtt gac gtt gat ggc tcc gtt tcc agc caa ttc ctc acc gca ctg 528
Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu
165 170 175
tta atg act gcg cct ctt gcg ccg gaa gat acg gtg att cgt att aaa 576
Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys
180 185 190
ggc gat ctg gtt tct aaa cct tat atc gac atc aca ctc aat ctg atg 624
Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met
195 200 205
aag acg ttt ggt gtt gaa att gaa aat cag cac tat caa caa ttt gtc 672
Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val
210 215 220
gta aaa ggc ggg cag tct tat cag tct ccg ggt act tat ttg gtc gaa 720
Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu
225 230 235 240
ggc gat gca tct tcg gct tct tac ttt ctg gca gca gca gca atc aaa 768
Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys
245 250 255
ggc ggc act gta aaa gtg acc ggt att gga cgt aac agt atg cag ggt 816
Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly
260 265 270
gat att cgc ttt gct gat gtg ctg gaa aaa atg ggc gcg acc att tgc 864
Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys
275 280 285
tgg ggc gat gat tat att tcc tgc acg cgt ggt gaa ctg aac gct att 912
Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile
290 295 300
gat atg gat atg aac cat att cct gat gcg gcg atg acc att gcc acg 960
Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr
305 310 315 320
gcg gcg tta ttt gca aaa ggc acc acc acg ctg cgc aat atc tat aac 1008
Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn
325 330 335
tgg cgt gtt aaa gag acc gat cgc ctg ttt gcg atg gca aca gaa ctg 1056
Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu
340 345 350
cgt aaa gtc ggc gcg gaa gtg gaa gag ggg cac gat tac att cgt atc 1104
Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile
355 360 365
act cct ccg gaa aaa ctg aac ttt gcc gag atc gcg aca tac aat gat 1152
Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp
370 375 380
cac cgg atg gcg atg tgt ttc tcg ctg gtg gcg ttg tca gat aca cca 1200
His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro
385 390 395 400
gtg acg att ctt gat ccc aaa tgc acg gcc aaa aca ttt ccg gat tat 1248
Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr
405 410 415
ttc gag cag ctg gcg cgg att agc cag gca gcc tga 1284
Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala
420 425
<210>12
<211>427
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>12
Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile
1 5 10 15
Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala
20 25 30
Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp
35 40 45
Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr
50 55 60
Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly
65 70 75 80
Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly
85 90 95
Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp
100 105 110
Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His
115 120 125
Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu
130 135 140
Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly
145 150 155 160
Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu
165 170 175
Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys
180 185 190
Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met
195 200 205
Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val
210 215 220
Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu
225 230 235 240
Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys
245 250 255
Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly
260 265 270
Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys
275 280 285
Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile
290 295 300
Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr
305 310 315 320
Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn
325 330 335
Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu
340 345 350
Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile
355 360 365
Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp
370 375 380
His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro
385 390 395 400
Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr
405 410 415
Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala
420 425