书签 分享 收藏 举报 版权申诉 / 36

新的草甘膦耐受型5烯醇丙酮酰莽草酸3磷酸合酶及其编码基因.pdf

  • 上传人:梁腾
  • 文档编号:8964879
  • 上传时间:2021-01-24
  • 格式:PDF
  • 页数:36
  • 大小:1.80MB
  • 摘要
    申请专利号:

    CN02117991.3

    申请日:

    20020528

    公开号:

    CN1330762C

    公开日:

    20070808

    当前法律状态:

    有效性:

    失效

    法律详情:

    IPC分类号:

    C12N15/54,C12N9/10,C12N15/63,C12N15/82,C07H21/04

    主分类号:

    C12N15/54,C12N9/10,C12N15/63,C12N15/82,C07H21/04

    申请人:

    北京大学

    发明人:

    孙义成,陈彦丞,李凤梅,田哲贤,林敏,王忆平

    地址:

    100871北京市海淀区颐和园路5号

    优先权:

    02117647.7

    专利代理机构:

    北京市柳沈律师事务所

    代理人:

    巫肖南;封新琴

    PDF完整版下载: PDF下载
    内容摘要

    本发明涉及一种新型5-烯醇丙酮酰莽草酸-3-磷酸合成酶(5-enolpyrul-shikimate-3-phosphate synthase,EPSPS),它对其合成底物磷酸烯醇式丙酮酸(PEP)的竞争性抑制剂草甘膦表现出很高的耐受性。本发明也涉及编码上述合成酶的基因、含此基因的构建体和载体,以及用该构建体或载体转化的宿主细胞。

    权利要求书

    1.一种分离的编码草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的核酸序列,所述合酶:(i)氨基酸序列如序列3所示;或(ii)是在(i)限定的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有草甘膦耐受性的由(i)衍生的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS);或(iii)是在(i)限定的氨基酸序列中保守取代一个或几个氨基酸且具有草甘膦耐受性的由(i)衍生的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)。 2.权利要求1所述分离的核酸序列,该核酸序列:(i)如序列2所示;或(ii)是在(i)限定的核苷酸序列中取代、缺失或添加一个或几个核苷酸的核苷酸序列,且其编码的蛋白具有5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)活性和草甘膦耐受性。 3.权利要求2的核酸序列,其具有序列表中编号为2的序列中第574-1800位所示核苷酸序列。 4.权利要求1-3任一项所述分离的核酸序列所编码的蛋白产物,其具有5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)活性和草甘膦耐受性。 5.一种核酸构建体,其含有权利要求1-3任一项所述分离的核酸序列。 6.一种载体,其携有权利要求1-3任一项所述分离的核酸序列,或携有权利要求5的核酸构建体。 7.一种宿主细胞,其由权利要求5的核酸构建体或权利要求6的载体转化而成。 8.权利要求7的宿主细胞,所述细胞包含权利要求1-3任一项所述分离的核酸序列,或包含权利要求5的核酸构建体,或包含权利要求6的载体。 9.权利要求7的宿主细胞,其为后代细胞。 10.权利要求8的宿主细胞,其为后代细胞。 11.制备权利要求7-10任一项所述宿主细胞的方法,包括将权利要求1-3任一项的核酸与适当调控序列可操作相连后导入适当载体,将该载体导入所选宿主细胞,使权利要求1-3任一项的核酸序列表达出有活性的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)。 12.一种草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS),该合酶:(i)氨基酸序列如序列3所示;或(ii)是在(i)限定的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有草甘膦耐受性的由(i)衍生的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS);或(iii)是在(i)限定的氨基酸序列中保守取代一个或几个氨基酸且具有草甘膦耐受性的由(i)衍生的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)。

    说明书

    新的草甘膦耐受型5-烯醇丙酮酰 莽草酸-3-磷酸合酶及其编码基因

    技术领域

    本发明涉及分子生物学领域。具体地,本发明涉及一种新的草甘膦耐 受型5-烯醇丙酮酰莽草酸-3-磷酸合酶(5-enolpyrul-shikimate-3-phosphate synthase,EPSPS)、编码上述合酶的分离的核酸序列,包含该序列或其编码 片段的核酸构建体,携有该序列或其编码片段或携有所述核酸构建体的载 体,以及用所述构建体或载体转化的宿主细胞。

    背景技术

    5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSPS)是芳香族氨基酸合成途径中 的关键酶,存在于植物和细菌中。草甘膦(Glyphosate),即N-膦酰甲基甘氨 酸,是一种广谱、高效的发芽后除草剂。它是EPSPS合成底物磷酸烯醇式 丙酮酸(PEP)的竞争性抑制剂,可阻断PEP和3-磷酸莽草酸这两种底物在 EPSPS催化下向5-烯醇丙酮酰莽草酸-3-磷酸莽草酸的转化,从而阻断芳香 族氨基酸合成前体-莽草酸的合成途径,导致植物和细菌死亡。

    植株对草甘膦的耐受性可通过向它们的基因组稳定引入草甘膦耐受型 EPSPS编码基因而获得。目前已知的草甘膦耐受性EPSPS基因主要有两大 类:I类(如US 4,971,908;US 5,310,667;US 5,866,775等)和II类(如US 5,627,061;US 5,633,435等),它们都已成功导入植物基因组中,获得了具 有草甘膦耐受性的植物细胞,以及完整的植株。

    本发明的目的是寻找一种新的能耐受草甘膦的天然序列EPSPS。

    发明内容

    发明目的

    本发明一个目的是提供一种新分离的编码草甘膦耐受型EPSPS蛋白的 核酸序列。

    本发明另一目的是提供一种新的草甘膦耐受型EPSPS蛋白。

    本发明还有一个目的是提供一种由上述核酸序列与使上述核酸序列在 相应宿主细胞中表达所必需的调控序列可操作地连接而形成的核酸构建 体。所述调控序列具体可任选包括启动子、增强子、前导序列、聚腺苷酸 化信号、以及转录和翻译的起始和终止序列等。

    本发明还有一个目的是提供一种含有上述核酸序列或核酸构建体的载 体。

    本发明还有一个目的是提供由上述核酸构建体或载体所转化的宿主细 胞,该宿主细胞可以在适当的条件下表达上述核酸序列所编码的蛋白,并 使该蛋白具有的EPSPS酶活性以及草甘膦耐受性,从而使该宿主细胞具有 草甘膦耐受性。

    本发明还有一个目的是提供上述宿主细胞及其后代细胞,这些细胞中 含有上述核酸序列或其编码片段、核酸构建体、或载体,并且这些细胞具 有草甘膦耐受性。

    本发明的其它目的还可以体现在以下对本发明的详细描述以及具体实 施例中。

    发明概述

    本发明提供了一种具有天然序列的草甘膦耐受型5-烯醇丙酮酰莽草酸 -3-磷酸合酶(EPSPS)。所谓“天然序列”是指未经人工诱变,或其它生物学 或化学改造,如基因工程改造的序列。本发明提供了该EPSPS的分离的氨 基酸序列(即序列表中的序列3),在该序列的基础上进行任何改动,如缺失、 添加和/或取代一或多个氨基酸残基,最终所得氨基酸序列只要能形成具有 EPSPS活性和草甘膦耐受性的蛋白,也都包括在本发明的范围内。

    本发明还提供了分离的编码所述EPSPS的核酸序列(即序列表中的序 列2,尤其其中的编码区),在该序列的基础上进行任何改动,如缺失、添 加和/或取代一或多个核苷酸,最终所得核酸序列只要能编码具有EPSPS活 性和草甘膦耐受性的蛋白,也都包括在本发明的范围内。

    将本发明编码EPSPS的核酸序列与相对于该序列同源或异源的其它序 列可操作地连接,就构成本发明的核酸构建体。

    根据本发明的方法,可将本发明的核酸构建体,或者直接将本发明的分 离的核酸序列导入载体,用该载体转化特定的宿主细胞,从而表达本发明的 EPSPS酶并使得该重组宿主细胞获得草甘膦耐受性。或者不通过载体转化, 而是直接将本发明的分离的核酸序列,或本发明的核酸构建体用常规方法, 如电穿孔等导入宿主细胞,同样可以表达本发明的EPSPS酶并赋予该细胞 草甘膦耐受性。如此所获得的载体和重组宿主细胞,以及获得该细胞的方法, 都包括在本发明的范围之内。

    定义

    本文中“序列同源性%”是指通过序列对比,并且必要时插入空隙以获 得同源性的最大百分比,而不考虑序列同源性的任何保守取代时,候选序列 中相同于目标序列的氨基酸残基的百分数。此处所述序列包括氨基酸序列和 核苷酸序列。可使用本领域已知的各种方法测定序列同源性百分比,例如, 使用公众可得到的计算机软件如BLAST、BLAST-2、ALIGN、ALIGN-2或 Megalign(DNASTAR)。本领域技术人员可以确定用于序列对比的具体参数, 以及全长序列的最大比较所需的任何算法。

    本文中“核酸构建体”指单链或双链核酸分子,这些分子分离自天然基 因或已经过改变而含有以自然界不存在的方式而结合和并列的核酸片段。当 核酸构建体含有表达本发明EPSPS所需的所有调控序列时,术语“核酸构 建体”与“表达盒”是同义词。

    本文中“调控序列”包括表达本发明多肽所必需的或有利的所有元件。 每一种调控序列既可以是编码该多肽的核酸序列天然具有的,也可以是外来 的。这种调控序列包括,但不限于,前导序列、聚腺苷酸化序列、前肽序列、 启动子、和转录终止子。调控序列最少应包括启动子、以及转录和翻译终止 信号。为了导入特异的限制性酶切位点以有助于调控序列和编码异源多肽的 核酸序列的编码区进行连接,可以制备带有接头的调控序列。

    本文中“可操作地连接”定义为使本发明的分离的核酸序列与相对于该 序列同源或异源的任何其它序列相连,从而使它们作为一个整体能编码一种 产物。需要时,可通过一定方式,如通过限制性内切酶的酶切而使它们分离。 这里所述的同源或异源序列可以是任何序列,如能指导本发明所述分离的核 酸序列在特定宿主细胞中表达的任何调控序列,或与本发明所述分离的核酸 序列共同编码一种融合蛋白的序列,等等。

    本文中“宿主细胞”包括任何能接受本发明所述分离的核酸序列,或能 接受含有该序列的构建体或载体,并使该序列稳定维持在细胞内的细胞。宿 主细胞包含了本发明所述分离的核酸序列后,能获得由该序列编码的性状 或特征。

    发明详述

    本发明人意外地发现并分离出一种新的草甘膦耐受型EPSPS编码基 因。本发明人测定并在本文中公开了该基因的编码序列,即序列表中编号 为2的序列以及其中明确指示的编码区(CDS,为第574-1800位的核苷酸)。 本发明还公开了由该CDS编码的氨基酸序列,即序列表中编号为3的序列。 本发明人使用DNAMAN 4.0版,按照CLUSTAL格式,将序列3所示氨基 酸序列与已知的I类和II类EPSPS的序列比较后发现,本发明的序列中不 含有被以往专利所保护的任何序列(见图2)。在GenBank蛋白序列库中进行 的BLAST搜索发现,本发明的序列3与醋酪酸梭状芽孢杆菌EPSPS的氨基 酸序列有37%同源性,与大肠杆菌EPSPS的氨基酸序列有20%同源性(见 图2)。将序列2中574-1800位核苷酸所示的序列用NCBI-BLAST搜索, 未发现与现有任何核酸序列的同源性。因此认为本发明所述的核酸序列和 蛋白是新的。

    因此,本发明一个方面涉及一种分离的核酸序列,其含有序列表中编 号为2的核酸序列并可编码草甘膦耐受性EPSPS。

    本发明还涉及含有上述序列2中第574-1800位核苷酸所示序列的分 离的核酸序列,其可编码草甘膦耐受性EPSPS。

    本发明还涉及在上述序列2所示序列,或上述序列2的第574-1800 位核苷酸所示序列中改变一或多个核苷酸,或缺失和/或添加3个或3的倍 数个核苷酸而产生的核酸序列,且该核酸序列能编码具有5-烯醇式丙酮酰 莽草酸-3-磷酸合酶(EPSPS)活性和草甘膦耐受性的蛋白。这里所述的核苷酸 改变,缺失和添加是本领域技术范畴之内的常规内容。

    本发明还涉及与用上述序列2所限定的核酸序列,或与用上述序列2 的第574-1800位核苷酸所限定的核酸序列具有一定同源性的核酸序列, 如同源性至少约65%,优选至少约66%,优选至少约67%,优选至少约 68%,优选至少约69%,优选至少约70%,优选至少约71%,优选至少约 72%,优选至少约73%,优选至少约74%,优选至少约75%,优选至少约 76%,优选至少约77%,优选至少约78%,优选至少约79%,更优选至少 约80%,更优选至少约81%,更优选至少约82%,更优选至少约83%,更优 选至少约84%,更优选至少约85%,更优选至少约86%,更优选至少约87 %,更优选至少约88%,更优选至少约89%,更优选至少约90%,更优选 至少约91%,更优选至少约92%,更优选至少约93%,更优选至少约94 %,最优选至少约95%,最优选至少约96%,最优选至少约97%,最优选 至少约98%,最优选至少约99%,只要该序列编码具有草甘膦耐受性EPSPS 活性的蛋白就属于本发明的范围。

    本发明所述分离的核酸序列可按照本发明实施例部分所述方法从自然 界克隆而获得。克隆方法可包括:限制酶切割并分离含有编码目标蛋白的核 酸序列的预期核酸片段,将该片段插入载体分子中,将该重组载体掺入到宿 主细胞中,从而使该核酸序列的多个拷贝或克隆在该宿主细胞中复制。但是, 更简便的方法是,根据在此公开的核苷酸序列,用自动核苷酸合成仪(如 Applied Biosystems公司的ABI394 DNA合成仪)合成所述序列,或参照2000 年10月4日公开的中国专利申请99103472.4的方法,分别合成上述核酸序 列的片段,然后用常规连接酶和载体将这些片段连接成完整序列。

    本发明的核酸序列可以是基因组序列、cDNA序列、RNA序列、半合 成的序列、完全人工合成的序列或其任何组合物。

    本发明另一方面还涉及能编码具有EPSPS活性和草甘膦耐受性的蛋白 产物的分离的核酸序列,其中所述蛋白产物具有序列3所示氨基酸序列。

    本发明还涉及能编码具有EPSPS活性和草甘膦耐受性的蛋白产物的分 离的核酸序列,其中所述蛋白产物的氨基酸序列相对于上述序列3所示氨基 酸序列,有一或多个氨基酸的取代、缺失和/或添加,但该产物仍具有EPSPS 活性和草甘膦耐受性。所述氨基酸的取代、缺失和/或添加都是本领域常规 技术可以完成的。优选这种氨基酸变化为:小的特性改变,即不显著影响蛋 白的折叠和/或活性的保守氨基酸取代;小的缺失,通常约1-30个氨基酸的 缺失;小的氨基或羧基端延伸,例如氨基端延伸一个甲硫氨酸残基;小的连 接肽,例如约20-25个残基长。

    保守取代的实例是在下列氨基酸组内发生的取代:碱性氨基酸(如精氨 酸、赖氨酸和组氨酸)、酸性氨基酸(如谷氨酸和天冬氨酸)、极性氨基酸(如 谷氨酰胺、天冬酰胺)、疏水性氨基酸(如亮氨酸、异亮氨酸和缬氨酸)、芳香 氨基酸(如苯丙氨酸、色氨酸和酪氨酸),以及小分子氨基酸(如甘氨酸、丙氨 酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变特定活性的那些氨基酸取代 在本领域内是众所周知的,并且已由,例如,N.Neurath和R.L.Hill在1979 年纽约学术出版社(Academic Press)出版的Protein中进行了描述。最常见的 互换有Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val, Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu, 和Asp/Gly,以及它们相反的互换。

    对于本领域的技术人员而言很明显,这种取代可以在对分子功能起重要 作用的区域之外发生,而且仍产生活性多肽。对于由本发明的分离的核酸序 列编码的多肽,其活性必需的并因此选择不被取代的氨基酸残基,可以根据 本领域已知的方法,如定点诱变或丙氨酸扫描诱变进行鉴定(如参见, Cunningham和Wells,1989,Science 244:1081-1085)。后一技术是在分子 中每一个带正电荷的残基处引入突变,检测所得突变分子的草甘膦耐受性 EPSPS活性,从而确定对该分子活性而言重要的氨基酸残基。底物-酶相互 作用位点也可以通过其三维结构的分析来测定,这种三维结构可由核磁共振 分析、结晶学或光亲合标记等技术测定(参见,如de Vos等,1992, Science 255: 306-312;Smith等,1992, J.Mol.Biol 224:899-904;Wlodaver等,1992, FEBS Letters 309:59-64)。

    本发明还涉及与上述序列3所示氨基酸序列具有一定同源性的氨基酸 序列,如同源性至少约50%,优选至少约60%,优选至少约65%,优选至 少约66%,优选至少约67%,优选至少约68%,优选至少约69%,优选至 少约70%,优选至少约71%,优选至少约72%,优选至少约73%,优选至 少约74%,优选至少约75%,优选至少约76%,优选至少约77%,优选至 少约78%,优选至少约79%,更优选至少约80%,更优选至少约81%,更 优选至少约82%,更优选至少约83%,更优选至少约84%,更优选至少约 85%,更优选至少约86%,更优选至少约87%,更优选至少约88%,更优 选至少约89%,更优选至少约90%,更优选至少约91%,更优选至少约92 %,更优选至少约93%,更优选至少约94%,最优选至少约95%,最优选 至少约96%,最优选至少约97%,最优选至少约98%,最优选至少约99 %,只要具有所述同源序列的蛋白为草甘膦耐受性EPSPS蛋白,该序列就 属于本发明的范围。

    由本发明的分离的核酸序列编码的蛋白,具有含序列3所示氨基酸序列 之EPSPS的活性的至少20%,优选至少40%,更优选至少60%,甚至更优 选至少80%,甚至更优选至少90%,最优选至少100%。

    本发明还涉及含有上述定义的核酸序列,或其中的编码序列(如本文中, 序列2的574-1800位核苷酸)的核酸构建体。

    本发明的核酸构建体还含有能使上述序列在所选宿主细胞中表达所必 需的调控序列。所述调控序列与上述分离的核酸序列在核酸构建体中可操作 地连接。

    调控序列可以是启动子序列,包括介导多肽的表达的转录调控序列。启 动子可以是在细胞中显示转录活性的任何核酸序列,包括突变的、截短的、 及杂合的启动子,而且可以从编码细胞外或细胞内多肽的基因中得到,这些 多肽可以与该细胞同源或不同源。众多用于原核细胞的启动子为本领域所熟 知。

    调控序列也可以是适当的转录终止序列,即被本文所述的宿主细胞识别 以终止转录的序列。该终止序列与编码多肽的核酸序列的3’端可操作地连 接。任何在宿主细胞中有功能的终止子都可以在本发明中使用。

    调控序列可以是适当的前导序列,即mRNA上对细胞的翻译很重要的 非翻译区。前导序列与编码多肽的核酸序列的5’端可操作地连接。任何在宿 主细胞中有功能的前导序列都可以在本发明中使用。

    调控序列也可以是聚腺苷酸化序列。该序列与核酸序列的3’端可操作 地连接,而且当转录时,被细胞作为信号来识别,从而将聚腺苷酸残基加到 转录出的mRNA上。任何在该细胞中有功能的聚腺苷酸化序列都可以在本 发明中使用。

    核酸构建体还可以包括一个或多个这样的核酸序列,这些核酸序列编码 一个或多个有利于指导异源多肽表达的因子,例如,转录激活因子(如反式 作用因子)、伴侣蛋白和加工型蛋白酶。任何在宿主细胞特别是细菌细胞和 植物细胞中有效的因子都可以在本发明中使用。编码一个或多个这些因子的 核酸不一定与编码异源多肽的核酸序列串联。

    可以将上述各种核酸和调控序列连接在质粒或病毒等常规载体上,产生 本发明的“重组表达载体”,所用方法是本领域技术人员所熟知的(可参见J. Sambrook,E.F.Fritsch和T.Maniatus,1989, Molecullar Cloning,laboratorVmannual,2th ed,Cold Spring,NY)。所述载体可以包含一个或多个便利的 限制性内切酶位点。载体的选择通常取决于载体与所用宿主细胞的兼容性。 所述载体可以是线性或闭合环状质粒。这样的载体可以是自主复制型载体, 即,以染色体外实体的形式存在的载体,其复制独立于染色体的复制,如质 粒(一种染色体外元件),微型染色体,或人工染色体。载体可以包含确保自 我复制的任何手段。或者,所述载体也可在导入细胞后,整合到基因组中并 随染色体一起复制。载体系统可以是单一载体或质粒或两个或多个载体或质 粒(它们共同包含目标核酸序列),或是转座子。

    在载体向细胞基因组整合的情况中,该载体可以包含指导该载体通过同 源重组整合入细胞基因组的附加核酸序列。这些附加的核酸序列能够使该载 体在染色体的精确位置整合入基因组中。为了增加在精确位置整合的可能 性,整合元件应该优选包含足够数量的核酸,例如100至1500个碱基对, 优选400至1500个碱基对,最优选800至1500个碱基对,它们与其相应的 靶序列高度同源以提高同源重组的可能性。这些整合元件可以是与细胞基因 组中靶序列同源的任何序列。而且,这些整合元件可以是非编码或编码型核 酸序列。另一方面,该载体可以通过非同源重组整合入细胞的基因组中。

    在自主复制的情况中,该载体可以进一步包含使该载体能在细菌细胞和 植物细胞中自主复制的复制起始点。

    本发明还涉及含有本发明核酸序列的重组“宿主细胞”。可将含有本发 明核酸序列的核酸构建体或载体引入宿主细胞中,使本发明的核酸序列整合 至染色体上或使载体自主复制,从而本发明的核酸序列得以在该宿主细胞中 稳定表达,导致赋予该宿主细胞抗草甘膦的抗性。

    宿主细胞可以是原核生物如细菌的细胞,但更优选真核生物如植物的细 胞。

    常用的细菌细胞有革兰氏阳性细菌如芽孢杆菌的细胞,或革兰氏阴性细 菌如大肠杆菌和假单胞菌的细胞。在一个优选的实施方案中,细菌宿主细胞 大肠杆菌的细胞。

    将表达载体引入细菌宿主细胞可通过原生质体转化(如Chang和 Cohen,1979,分子普通遗传学168:111-115),利用感受态细胞(如Young 和Spizizin,1961,J.Bacteriol.81:823-829,或Dubnau和Davidoff-Abelson, 1971,J.Mol.Biol.56:209-221),通过电穿孔(如Shigekawa和Dower,1988, Biotech.6:742-751),或通过接合作用(如Koehler和Thorne,1987,J.Bacteriol. 169:5771-5278)而实现。

    附图说明

    图1显示pKU2004的质粒图谱。

    图2显示恶臭假单胞菌P.P4G-1的EPSPS与多个已知EPSPS的氨基酸 序列比较。图中方框和阴影所示为以往专利所具体要求保护的序列。

    图3显示带不同EPSPS基因的大肠杆菌XL1-BLUE MR在不同草甘膦 浓度下的生长曲线。

    具体实施方式

    实施例1. 草甘膦耐受菌株的分离

    在河北省保定市附近一个草甘膦生产厂周围土壤中采样,用含有一定浓 度草甘膦的培养基进行有效分离,共得到48株对草甘膦有很强耐受和降解 能力的菌株,其中一株菌4G-1可以在400mM草甘膦限制性培养基上生长, 而且对100mg/L的氨苄青霉素具有抗性,选择此菌株进行进一步研究。

    实施例2. 草甘膦耐受菌株的鉴定

    a) 4G-1菌总DNA的小量制备

    在3ml含100mg/L氨苄青霉素的LB液体培养基中接种4G-1菌株,28 ℃振荡过夜培养,12000rpm/min离心收集菌体,将所得离心产物重悬于0.5ml 溶液I(10mM NaCl,20mM Tris-Hcl pH 8.0,1mM EDTA)中,加入蛋白酶K (Merck,德国)和SDS至终浓度分别为10μg/ml和0.5%。小心颠倒混匀,50℃ 放置6小时以上。加入等体积的酚,小心颠倒混匀,室温放置10min。室温 12000rpm/min离心5min,用枪头(AxyGen,USA)吸取上清水相,再用等体 积酚/氯仿抽提一遍。在上清液中加入10%3M NaAC,加2.3倍体积的无水 乙醇沉淀,于-10℃12000rpm/min离心25min。弃去上清,再加70%乙醇500μl 洗涤,12000rpm/min离心1分钟,尽量吸尽上清,在Savant中抽干20min 或37℃温箱中晾干1hr,加入100μl TE溶液(10mM Tris-Cl,1mM EDTA, pH8.0)将其溶解,置-20℃中冻存备用。

    b) 4G-1菌株16S rRNA的克隆

    合成一对16S rRNA的通用引物(引物1:5’AGA GTT TGA TCA TGG CTC AG 3’和引物2:5’TAC GGT TAC CTT GTT ACG ACT T 3’)。用这一对 引物在Robocycler 40(Stratagene)中进行PCR扩增反应。反应体系为:1μl 4G-1菌株总DNA为模板,5μl缓冲液,4μl 10μmol dNTP,1μl 20 pmol/μl引 物1和1μl 20pmol/μl引物2,37μl去离子水。反应条件为:94℃10min,加 入1μl 5U Pyrobest Taq DNA聚合酶,然后以94℃1min、50℃1min、72 ℃2min进行30个循环,最后72℃再延伸10min。得到一段约1.5kb的片 段。按照PCR产物纯化试剂盒供应商Boehringer提供的方法提纯PCR产物。

    将PCR纯化产物进行加A(脱氧腺苷酸)反应。反应体系为:20μl(2μg) PCR纯化产物,5μl缓冲液,1μl(5U)Taq DNA聚合酶(鼎国公司,北京),4μl 5μmol dATP,20μl去离子水。

    将反应产物按PCR产物的纯化方法纯化后,按照供应商Takara的说明 与T载体(Takara,大连)相连,得到质粒pKU2000。测序结果如序列1所示。 在美国国家生物信息中心(NCBI)用BLAST软件以及BLASTP 2.2.2 [Dec-14-2001]数据库进行序列比对,发现该序列与恶臭假单胞菌 (pseudomonas putida)16S rRNA的基因序列有99%同源性,因此推定4G-1 菌株为恶臭假单胞菌,将其命名为恶臭假单胞菌(pseudomonas putida)4G-1 (简称P.P4G-1),并于2002年4月30日将该菌株保藏在中国微生物菌种保 藏管理委员会普通微生物中心(中国.北京.中关村),保藏号为CGMCC 0739。

    实施例3. 4G-1菌株基因文库的构建

    a) 4G-1总DNA的大量制备

    将P.P4G-1菌株接种至含100ml LB培养基(补加100mg/L氨苄青霉素) 的250ml锥形瓶中,28℃以200rpm/min振荡培养过夜,离心(8000转/min, 5min),将沉淀重悬于14ml上述溶液I中,加入蛋白酶K(Merck,德国)和 SDS至终浓度分别为10μg/ml和0.5%。小心颠倒混匀,50℃放置6 小、时。 加入等体积的酚,小心颠倒混匀,室温放置10min。室温4000mm/min离心 20min,用宽口枪头吸取上清水相,再加入等体积的酚/氯仿抽提一遍。在上 清液中加入10%3M NaAC(pH 5.5),加2.3倍体积的无水乙醇沉淀。用玻璃 棒小心挑出DNA,于70%乙醇中洗涤,弃去乙醇,晾干,加入2ml TE溶液 (pH 8.0)于4℃溶解24小时,得到约1mg总DNA。0.3%琼脂糖凝胶电泳确 定DNA片段在80Kb以上。

    b) 回收总DNA的酶切片段

    取200μl总DNA(100μg),加入5U限制性内切酶Sau3AI于室温分别酶 切消化20分钟,30分钟,45分钟。合并酶切消化产物,加入EDTA至终浓 度0.25mM,用等体积的酚/氯仿抽提,取上清加入10%3M醋酸钠,加2.3 倍体积的无水乙醇沉淀,沉淀物用70%乙醇洗涤,如上述抽干,加入200μl TE溶解,将其加入Beckman sw28超速离心管中的12ml 10-40%蔗糖密度梯 度上,将这些样品于20℃Beckman sw28转子中以120000g离心18小时, 从顶部收集各组分(0.5ml),每组分取15μl用0.3%琼脂糖凝胶电泳分析,合 并含有30-40kb DNA的组分,加入约2倍体积的去离子水,7倍体积的无水 乙醇,-20℃过夜沉淀,70%乙醇洗涤,干燥,溶于50μl TE中。

    c)  4G-1基因文库的构建

    按照Stratagne的方法将其提供的SuperCos l柯斯质粒载体先后用Xba I、碱性磷酸酶、BamHI处理,将其与上一步分离的总DNA片段相连。

    按照Stratagene的说明书使用Gigapack III Gold的包装抽提物在体外包 装一份连接产物;用Stratagene的试剂盒在大肠杆菌XL 1-Blue MR(Stratagene) 上滴定文库。由此获得的文库按照同一供应商的说明加以扩增和储存。

    实施例4.

    具有草甘膦耐受性的EPSPS基因的分离、筛选、测序及分析

    a) 具有草甘膦耐受性基因的文库的筛选

    将1ml上述文库的储存液离心,弃去上清,加1ml灭菌生理盐水重悬, 离心弃去上清,加1ml灭菌生理盐水重悬。按照大约每平皿103个细菌的密 度涂布10mM草甘膦-50mg/L氨苄青霉素平板(20mM硫酸铵;0.4%葡萄糖; 10mM草甘膦;0.5mM磷酸氢二钾;0.1mg/L硫酸铁;0.5g/L硫酸镁;0.5g/L 氯化钙;2.1g/L氯化钠;50mM Tris(pH7.2);5mg/L维生素b1;15g/L琼脂), 37℃过夜培养,得到一个菌株,将此菌株命名为BDS,将其携带的柯斯质粒 命名为pKU2001。

    b) 草甘膦耐受性基因的分离

    将BDS菌株接种在50ml锥形瓶内20ml LB(补加50mg/L氨苄青霉素) 中,以300rpm/min 37℃摇床培养12hr,离心收集菌体后按 Molecullar cloning.laboratory manual,出处同上所述碱法提取质粒pKU2001。将其与柯斯质粒载 体重新转化入大肠杆菌XL1-Blue MR(Stratagene)中,于10mM草甘膦平板 划线,只带柯斯质粒空载体的菌株无法在草甘膦培养基上生长,而带有 pKU2001的菌株生长良好,证实pKU2001中确实带有抗草甘膦的基因。

    将pKU2001用Sau3AI消化,用0.7%琼脂糖凝胶电泳回收2-4kb DNA 片段,与经BamH I酶切并已经去磷酸化的pUC18载体(Yanisch-Perron,C., Vieria,J.and Messing,J.1985,Gene 33:103-119)相连,转化入大肠杆菌 XL1-Blue MR(Stratagene)中,在补充50mg/L氨苄青霉素的10mM草甘膦板 上铺板,37℃过夜培养,得到数十个克隆,挑菌、提质粒,筛选得到携有 约2kb的外源片段的质粒,命名为pKU2002。将质粒pKU2002与pUC18 空载体分别转入大肠杆菌XL1-Blue MR(Stratagene)中,划线于补充有 50μg/ml氨苄青霉素的10mM草甘膦板上,带有pUC18空载体的菌株不能 在草甘膦平板上生长,而带有pKU2002质粒的菌株生长良好,证实质粒 pKU2002中确实带有抗草甘膦基因。

    c)对pKU2002测序,得到1914bp克隆的全序列,见序列2。

    d)用DNASIS软件对pKU2002进行序列分析,确定唯一可能的读码 框(ORF),见序列2中第574-1800位的核苷酸。其编码的氨基酸序列见序 列3。

    e)将该蛋白序列在美国国家生物信息中心(NCBI)的GenBank蛋白序 列数据库中进行Blast搜索,发现与醋酪酸梭状芽孢杆菌EPSPS的氨基酸序 列有37%同源性,与大肠杆菌EPSPS的氨基酸序列有20%同源性。此 1230bp的序列可能编码一种EPSP合酶,将此基因命名为pparoA。分析表 明该基因不属于现有任何一种EPSPS类型,而是一种新型的EPSPS基因(第 III类)。大肠杆菌、醋酪酸梭状芽孢杆菌和P.P4G-1的EPSPS氨基酸序列比 较见图2。

    f)设计一对含有下划线所示BamH I酶切位点的引物:

    引物3:5’-CG G GAT CCT AAG TAA GTG AAA GTA ACA ATA CAG C-3’

    引物4:5’-CG G GAT CCC TTC TTC GGA CAA TGA CAG AC-3’

    以pKU2001为模板,进行PCR扩增。将扩增片段用BamH I酶切后插 入pUC18,得到质粒pKU2003,测序证明无错配碱基的引入;将pKU2003 用BamH I酶切,得到的小片段正向连入pACYC184(Chang,A.C.Y.,and Cohen,S.N.,1978,J.Bacteriol.134:1141-1156)的BamH I位点,得到质粒 pKU2004(图谱见图1),在此质粒中pparoA基因被pACYC184中的Tcr启动 子起始转录。

    实施例5

    大肠杆菌aroA基因的克隆及其草甘膦耐受性定位突变(对照实验)

    将大肠杆菌ET8000(MacNeil,T.,MacNeil,D.,and Tyler,B.1982 J. Bacteriol.150:1302-1313)接种至15ml试管内3ml LB液体培养基中,37℃振 荡培养过夜,离心收集菌体,按照前述方法提取总DNA。

    设计一对引物并引入如下划线所示的BamH I酶切位点:

    引物5:5’-CG G GAT CCG TTA ATG CCG AAA TTT TGC TTA ATC-3’

    引物6:5’-CG G GAT CCA GGT CCG AAA AAA AAC GCC GAC-3’

    以大肠杆菌总DNA为模板扩增得到大肠杆菌的aroA基因,即大肠杆 菌中编码EPSPS蛋白的基因,将此基因用BamH I酶切,插入pUC18中得 到质粒pKU2005,测序得到序列10,该序列与NCBI的GenBank数据库中 大肠杆菌EPSPS的基因序列对比,证实无误。将质粒pKU2005用BamH I 酶切,回收小片段正向插入载体pACYC184的BamH I位点得到质粒 pKU2006。

    对大肠杆菌的aroA基因进行点突变,将第287位的鸟嘌呤变为胞嘧啶, 从而使大肠杆菌EPSPS蛋白的96位甘氨酸突变为丙氨酸。将该基因片段同 样插入pACYC184 BamHI位点,得到质粒pKU2007。

    实施例6. 大肠杆菌aroA-菌株的EPSPS功能互补实验

    将pACYC 184、pKU2004、pKU2006、pKU2007转化入大肠杆菌AB2889 中(大肠杆菌aroA-菌株,来源于耶鲁大学),分别在含有终浓度25mg/L氯霉 素的限制性M63培养基(13.6g/L KH2PO4.0.5mg/L FeSO4-7H2O,20mM (NH4)2SO4,0.4%葡萄糖,1mM硫酸镁,0.5mg/L维生素B1)上划线培养,结 果如表1。

    补加aAAS组分如下:

    100mg/L苯丙氨酸

    100mg/L酪氨酸

    100mg/L色氨酸

    5mg/L对氨基苯甲酸

    5mg/L 2,3-二羟基苯甲酸

    5mg/L对羟基苯甲酸

    表1.大肠杆菌aroA缺失菌株EPSPS功能互补及草甘膦耐受性实验

    AB2889 携带的质粒 EPSPS功能互补及抗草甘膦状况 M63培养基   M63培养基   (补加aAAS) 抗10mM草甘膦 pACYC184 -   + - PKU2006 +   + - pKU2007 +   + + pKU2004 +   + +

    同时在液体培养条件下,对以上菌株的生长曲线进行了测定。结果表明, 与大肠杆菌aroA基因对照一样(pKU2006),pKU2004所携带的基因完全可 以在EPSPS功能上互补大肠杆菌AB2899的aroA缺陷,证明该质粒携带的 1230 bp核酸序列为EPSPS编码基因,同时该基因编码的EPSPS还具有草 甘膦耐受性。

    实施例7. 新型EPSPS编码基因对草甘膦的抗性强度实验

    将质粒pKU2004、pKU2006、pKU2007分别转化入大肠杆菌XL1-Blue MR中,然后分别接种在M63限制性培养基中过夜培养,再转接入补加了不 同浓度草甘膦的M63限制性培养基中培养,测它们的生长曲线。结果发现 转化有pKU2006的大肠杆菌在5mM草甘膦培养基中生长已受到较明显的抑 止,在40mM草甘膦培养基中已停止生长,而转化有pKU2004和pKU2006 的大肠杆菌在40mM草甘膦培养基中生长未受到明显抑制,转化有pKU2004 的大肠杆菌在120mM的草甘膦培养基中还能生长良好(图3:生长曲线)。

    序列表

    <110>北京大学

    <120>新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合成酶及其编码基因

    <130>PJMD3540N

    <141>2002-04-30

    <160>12

    <170>PatentIn version 3.1

    <210>1

    <211>1501

    <212>DNA

    <213>恶臭假单胞菌P.P4G-1(Pseudomonas putida P.P4G-1)

    <400>1

    agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc    60

    ggatgagaag agcttgctct tcgattcagc ggcggacggg tgagtaatgc ctaggaatct    120

    gcctggtagt gggggacaac gtttcgaaag gaacgctaat accgcatacg tcctacggga    180

    gaaagcaggg gaccttcggg ccttgcgcta tcagatgagc ctaggtcgga ttagctagtt    240

    ggtgaggtaa tggctcacca aggcgacgat ccgtaactgg tctgagagga tgatcagtca    300

    cactggaact gagacacggt ccagactcct acgggaggca gcagtgggga atattggaca    360

    atgggcgaaa gcctgatcca gccatgccgc gtgtgtgaag aaggtcttcg gattgtaaag    420

    cactttaagt tgggaggaag ggcattaacc taatacgtta gtgttttgac gttaccgaca    480

    gaataagcac cggctaactc tgtgccagca gccgcggtaa tacagagggt gcaagcgtta    540

    atcggaatta ctgggcgtaa agcgcgcgta ggtggtttgt taagttggat gtgaaagccc    600

    cgggctcaac ctgggaactg tatccaaaac tggcaagcta gagtacggta gagggtggtg    660

    gaatttcctg tgtagcggtg aaatgcgtag atataggaag gaacaccagt ggcgaaggcg    720

    accacctgga ctgatactga cactgaggtg cgaaagcgtg gggagcaaac aggattagat    780

    accctggtag tccacgccgt aaacgatgtc aactagccgt tggaatcctt gagattttag    840

    tggcgcagct aacgcattaa gttgaccgcc tggggagtac ggccgcaagg ttaaaactca    900

    aatgaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg aagcaacgcg    960

    aagaacctta ccaggccttg acatgcagag aactttccag agatggattg gtgccttcgg   1020

    gaactctgac acaggtgctg catggctgtc gtcagctcgt gtcgtgagat gttgggttaa   1080

    gtcccgtaac gagcgcaacc cttgtcctta gttaccagca cgtaatggtg ggcactctaa   1140

    ggagactgcc ggtgacaaac cggaggaagg tggggatggc gtcaagtcat catggccctt   1200

    acggcctggg ctacacacgt gctacaatgg tcggtacaga gggttgccaa gccgcgaggt   1260

    ggagctaatc tcacaaaacc gatcgtagtc cggatcgcag tctgcaactc gactgcgtga   1320

    agtcggaatc gctagtaatc gcgaatcaga atgtcgcggt gaatacgttc ccgggccttg   1380

    tacacaccgc ccgtcacacc atgggagtgg gttgcaccag aagtagctag tctaaccttc   1440

    gggaggacgg ttaccacggt gtgattcatg actggggtga agtcgtaaca aggtaaccgt   1500

    a                                                                   1501

    <210>2

    <211>1914

    <212>DNA

    <213>恶臭假单胞菌P.P4G-1(Pseudomonas putida P.P4G-1)

    <220>

    <221>CDS

    <222>(574)..(1803)

    <223>

    <400>2

    gatcataaaa catgcttgta taaaggatgc tgccatgttc cgtgaactgg aagcgaacaa    60

    tcttgcggta tatcagaaaa agccaaagct gattgcagtg cttcttcagc gtaatgctca    120

    gttaaaagcg aaggttgttc aggaggatga gttcgaaaag tcggtaaggc gtttgttgaa    180

    ctttggtcat acattggggc atgccatcga aaatgaatat gcgttgatgc atggccatgc    240

    ggttgctata ggaatgacat acgcgtgtca tatttctgag caattgtctg gattcaaaca   300

    aacaaatcgc gtggtagaag tgttggaaca atatgggtta ccgacttata tggcattcga    360

    tagggaaaag gcttttaatc tgttgaaaat ggacaagaag cgtgaaaaaa aggaaatgaa    420

    ctatgtgttg ctggaaaaag tagggaaggg agtggtgaag agtattccac tggttcaatt    480

    agaaaaaatc attcaagcat taccaaagtg aaagtaacaa tacagcccgg agatctgact    540

    ggaattatcc agtcacccgc ttcaaaaagt tcg atg cag cga gct tgt gct gct     594

                                         Met Gln Arg Ala Cys Ala Ala

                                         1               5

    gca ctg gtt gca aaa gga ata agt gag atc att aat ccc ggt cat agc      642

    Ala Leu Val Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser

            10                  15                  20

    aat gat gat aaa gct gcc agg gat att gta agc cgg ctt ggt gcc agg      690

    Asn Asp Asp Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg

        25                  30                  35

    ctt gaa gat cag cct gat ggt tct ttg cag ata aca agt gaa ggc gta      738

    Leu Glu Asp Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val

    40                  45                  50                  55

    aaa cct gtc gct cct ttt att gac tgc ggt gaa tct ggt tta agt atc      786

    Lys Pro Val Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile

                    60                  65                  70

    cgg atg ttt act ccg att gtt gcg ttg agt aaa gaa gag gtg acg atc      834

    Arg Met Phe Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile

                75                  80                  85

    aaa gga tct gga agc ctt gtt aca aga cca atg gat ttc ttt gat gaa      882

    Lys Gly Ser Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu

            90                  95                  100

    att ctt ccg cat ctc ggt gta aaa gtt aaa tct aac cag ggt aaa ttg      930

    Ile Leu Pro His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu

        105                 110                 115

    cct ctc gtt ata cag ggg cca ttg aaa cca gca gac gtt acg gtt gat      978

    Pro Leu Val Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp

    120                 125                 130                 135

    ggg tec tta agc tct cag ttc ctt aca ggt ttg ttg ctt gca tat gcg     1026

    Gly Ser Leu Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala

                    140                 145                 150

    gcc gca gat gca agc gat gtt gcg ata aaa gta acg aat ctc aaa agc     1074

    Ala Ala Asp Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser

                155                 160                 165

    cgt ccg tat atc gat ctt aca ctg gat gtg atg aag cgg ttt ggt ttg     1122

    Arg Pro Tyr Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu

            170                 175                 180

    aag act ccc gag aat cga aac tat gaa gag ttt tat ttc aaa gcc ggg     1170

    Lys Thr Pro Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly

        185                 190                 195

    aat gta tat gat gaa acg aaa atg caa cga tac acc gta gaa ggc gac     1218

    Asn Val Tyr Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp

    200                 205                 210                 215

    tgg agc ggt ggt gct ttt tta ctg gta gcg ggg gct att gcc ggg ccg     1266

    Trp Ser Gly Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro

                    220                 225                 230

    atc acg gta aga ggt ttg gat ata gct tcg acg cag gct gat aaa gcg     1314

    Ile Thr Val Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala

                235                 240                 245

    atc gtt cag gct ttg atg agt gcg aac gca ggt att gcg att gat gca     1362

    Ile Val Gln Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala

            250                 255                 260

    aaa gag atc aaa ctt cat cct gct gat ctc aat gca ttt gaa ttt gat     1410

    Lys Glu Ile Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp

        265                 270                 275

    gct act gat tgc ccg gat ctt ttt ccg cca ttg gtt gct ttg gcg tct     1458

    Ala Thr Asp Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser

    280                 285                 290                 295

    tat tgc aaa gga gaa aca aag atc aaa ggc gta agc agg ctg gcg cat     1506

    Tyr Cys Lys Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His

                    300                 305                 310

    aaa gaa agt gac aga gga ttg acg ctg cag gac gag ttc ggg aaa atg     1554

    Lys Glu Ser Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met

                315                 320                 325

    ggt gtt gaa atc cac ctt gag gga gat ctg atg cgc gtg atc gga ggg     1602

    Gly Val Glu Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly

            330                 335                 340

    aaa ggc gta aaa gga gct gaa gtt agt tca agg cac gat cat cgc att     1650

    Lys Gly Val Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile

        345                 350                 355

    gcg atg gct tgc gcg gtg gct gct tta aaa gct gtg ggt gaa aca acc     1698

    Ala Met Ala Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr

    360                 365                 370                 375

    atc gaa cat gca gaa gcg gtg aat aaa tcc tac ccg gat ttt tac agc     1746

    Ile Glu His Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser

                    380                 385                 390

    gat ctt aaa caa ctt ggc ggt gtt gta tct tta aac cat caa ttt aat     1794

    Asp Leu Lys Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn

                395                 400                 405

    ttc tca tga atagcttcgg ccgcatcttc agggtgcata tttttggcga             1843

    Phe Ser

    atcacatggt gaatcagtag gcatcgttat tgatggttgt cctgctggtc tgtcattgtc   1903

    cgaagaagat c                                                        1914

    <210>3

    <211>409

    <212>PRT

    <213>恶臭假单胞菌P.P4G-1(Pseudomonas put ida P.P4G-1)

    <400>3

    Met Gln Arg Ala Cys Ala Ala Ala Leu Val Ala Lys Gly Ile Ser Glu

    1               5                   10                  15

    Ile Ile Asn Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg Asp Ile

                20                  25                  30

    Val Ser Arg Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly Ser Leu

            35                  40                  45

    Gln Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Asp Cys

        50                  55                  60

    Gly Glu Ser Gly Leu Ser Ile Arg Met Phe Thr Pro Ile Val Ala Leu

    65                  70                   75                 80

    Ser Lys Glu Glu Val Thr Ile Lys Gly Ser Gly Ser Leu Val Thr Arg

                    85                  90                  95

    Pro Met Asp Phe Phe Asp Glu Ile Leu Pro His Leu Gly Val Lys Val

                100                 105                 110

    Lys Ser Asn Gln Gly Lys Leu Pro Leu Val Ile Gln Gly Pro Leu Lys

            115                 120                 125

    Pro Ala Asp Val Thr Val Asp Gly Ser Leu Ser Ser Gln Phe Leu Thr

        130                 135                 140

    Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Val Ala Ile

    145                 150                 155                 160

    Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr Ile Asp Leu Thr Leu Asp

                    165                 170                 175

    Val Met Lys Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn Tyr Glu

                180                 185                 190

    Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr Asp Glu Thr Lys Met Gln

            195                 200                 205

    Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu Leu Val

        210                 215                 220

    Ala Gly Ala Ile Ala Gly Pro Ile Thr Val Arg Gly Leu Asp Ile Ala

    225                 230                 235                 240

    Ser Thr Gln Ala Asp Lys Ala Ile Val Gln Ala Leu Met Ser Ala Asn

                    245                 250                 255

    Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile Lys Leu His Pro Ala Asp

                260                 265                 270

    Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu Phe Pro

            275                 280                 285

    Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys Ile Lys

        290                 295                 300

    Gly Val Ser Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu Thr Leu

    305                 310                 315                 320

    Gln Asp Glu Phe Gly Lys Met Gly Val Glu Ile His Leu Glu Gly Asp

                    325                 330                 335

    Leu Met Arg Val Ile Gly Gly Lys Gly Val Lys Gly Ala Glu Val Ser

                340                 345                 350

    Ser Arg His Asp His Arg Ile Ala Met Ala Cys Ala Val Ala Ala Leu

            355                 360                 365

    Lys Ala Val Gly Glu Thr Thr Ile Glu His Ala Glu Ala Val Asn Lys

        370                 375                 380

    Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly Val Val

    385                 390                 395                 400

    Ser Leu Asn His Gln Phe Asn Phe Ser

                    405

    <210>4

    <211>20

    <212>DNA

    <213>人工序列

    <400> 4

    agagtttgat catggctcag                                                 20

    <210>5

    <211>22

    <212>DNA

    <213>人工序列

    <400>5

    tacggttacc ttgttacgac tt                                              22

    <210>6

    <211>34

    <212>DNA

    <213>人工序列

    <400>6

    cgggatccta agtaagtgaa agtaacaata cagc                                 34

    <210>7

    <211>29

    <212>DNA

    <213>人工序列

    <400>7

    cgggatccct tct tcggaca atgacagac                                      29

    <210>8

    <211>33

    <212>DNA

    <213>人工序列

    <400>8

    cgggatccgt taatgccgaa attttgctta atc                                  33

    <210>9

    <211>30

    <212>DNA

    <213>人工序列

    <400>9

    cgggatccag gtccgaaaaa aaacgccgac                                      30

    <210>10

    <211>1436

    <212>DNA

    <213>大肠杆菌(Escherichia coli)

    <400>10

    gttaatgccg aaattttgct taatccccac agccagcctg tggggttttt atttctgttg     60

    tagagagttg agttcatgga atccctgacg ttacaaccca tcgctcgtgt cgatggcact    120

    attaatctgc ccggttccaa gagcgtttct aaccgcgctt tattgctggc ggcattagca    180

    cacggcaaaa cagtattaac caatctgctg gatagcgatg acgtgcgcca tatgctgaat    240

    gcattaacag cgttaggggt aagctatacg ctttcagccg atcgtacgcg ttgcgaaatt    300

    atcggtaacg gcggtccatt acacgcagaa ggtgccctgg agttgttcct cggtaacgcc    360

    ggaacggcaa tgcgtccgct ggcggcagct ctttgtctgg gtagcaatga tattgtgctg    420

    accggtgagc cgcgtatgaa agaacgcccg attggtcatc tggtggatgc gctgcgcctg    480

    ggcggggcga agatcactta cctggaacaa gaaaattatc cgccgttgcg tttacagggc    540

    ggctttactg gcggcaacgt tgacgttgat ggctccgttt ccagccaatt cctcaccgca    600

    ctgttaatga ctgcgcctct tgcgccggaa gatacggtga ttcgtattaa aggcgatctg    660

    gtttctaaac cttatatcga catcacactc aatctgatga agacgtttgg tgttgaaatt    720

    gaaaatcagc actatcaaca atttgtcgta aaaggcgggc agtcttatca gtctccgggt   780

    acttatttgg tcgaaggcga tgcatcttcg gcttcttact ttctggcagc agcagcaatc    840

    aaaggcggca ctgtaaaagt gaccggtatt ggacgtaaca gtatgcaggg tgatattcgc    900

    tttgctgatg tgctggaaaa aatgggcgcg accatttgct ggggcgatga ttatatttcc    960

    tgcacgcgtg gtgaactgaa cgctattgat atggatatga accatattcc tgatgcggcg   1020

    atgaccattg ccacggcggc gttatttgca aaaggcacca ccacgctgcg caatatctat   1080

    aactggcgtg ttaaagagac cgatcgcctg tttgcgatgg caacagaact gcgtaaagtc   1140

    ggcgcggaag tggaagaggg gcacgattac attcgtatca ctcctccgga aaaactgaac   1200

    tttgccgaga tcgcgacata caatgatcac cggatggcga tgtgtttctc gctggtggcg   1260

    ttgtcagata caccagtgac gattcttgat cccaaatgca cggccaaaac atttccggat   1320

    tatttcgagc agctggcgcg gattagccag gcagcctgaa tgaacaacgg gcaataaata   1380

    gccaaatctt tctttatcaa aacgtcggca cattgtcggc gttttttttc ggacct       1436

    <210>11

    <211>1284

    <212>DNA

    <213>大肠杆菌(Escherichia coli)

    <220>

    <221>CDS

    <222>(1)..(1284)

    <223>

    <400>11

    atg gaa tcc ctg acg tta caa ccc atc gct cgt gtc gat ggc act att       48

    Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile

    1               5                   10                  15

    aat ctg ccc ggt tcc aag agc gtt tct aac cgc gct tta ttg ctg gcg       96

    Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala

                20                  25                  30

    gca tta gca cac ggc aaa aca gta tta acc aat ctg ctg gat agc gat      144

    Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp

            35                  40                  45

    gac gtg cgc cat atg ctg aat gca tta aca gcg tta ggg gta agc tat      192

    Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr

        50                  55                  60

    acg ctt tca gcc gat cgt acg cgt tgc gaa att atc ggt aac ggc ggt      240

    Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly

    65                  70                  75                  80

    cca tta cac gca gaa ggt gcc ctg gag ttg ttc ctc ggt aac gcc gga      288

    Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly

                    85                  90                  95

    acg gca atg cgt ccg ctg gcg gca gct ctt tgt ctg ggt agc aat gat      336

    Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp

                100                 105                 110

    att gtg ctg acc ggt gag ccg cgt atg aaa gaa cgc ccg att ggt cat      384

    Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His

            115                 120                 125

    ctg gtg gat gcg ctg cgc ctg ggc ggg gcg aag atc act tac ctg gaa      432

    Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu

        130                 135                 140

    caa gaa aat tat ccg ccg ttg cgt tta cag ggc ggc ttt act ggc ggc      480

    Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly GIy

    145                 150                 155                 160

    aat gtt gac gtt gat ggc tcc gtt tcc agc caa ttc ctc acc gca ctg      528

    Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu

                    165                 170                 175

    tta atg act gcg cct ctt gcg ccg gaa gat acg gtg att cgt att aaa     576

    Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys

                180                 185                 190

    ggc gat ctg gtt tct aaa cct tat atc gac atc aca ctc aat ctg atg      624

    Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met

            195                 200                 205

    aag acg ttt ggt gtt gaa att gaa aat cag cac tat caa caa ttt gtc      672

    Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val

        210                 215                 220

    gta aaa ggc ggg cag tct tat cag tct ccg ggt act tat ttg gtc gaa      720

    Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu

    225                 230                 235                 240

    ggc gat gca tct tcg gct tct tac ttt ctg gca gca gca gca atc aaa      768

    Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys

                    245                 250                 255

    ggc ggc act gta aaa gtg acc ggt att gga cgt aac agt atg cag ggt      816

    Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly

                260                 265                 270

    gat att cgc ttt gct gat gtg ctg gaa aaa atg ggc gcg acc att tgc      864

    Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys

            275                 280                 285

    tgg ggc gat gat tat att tcc tgc acg cgt ggt gaa ctg aac gct att      912

    Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile

        290                 295                 300

    gat atg gat atg aac cat att cct gat gcg gcg atg acc att gcc acg      960

    Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr

    305                 310                 315                 320

    gcg gcg tta ttt gca aaa ggc acc acc acg ctg cgc aat atc tat aac     1008

    Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn

                    325                 330                 335

    tgg cgt gtt aaa gag acc gat cgc ctg ttt gcg atg gca aca gaa ctg     1056

    Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu

                340                 345                 350

    cgt aaa gtc ggc gcg gaa gtg gaa gag ggg cac gat tac att cgt atc     1104

    Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile

            355                 360                 365

    act cct ccg gaa aaa ctg aac ttt gcc gag atc gcg aca tac aat gat     1152

    Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp

        370                 375                 380

    cac cgg atg gcg atg tgt ttc tcg ctg gtg gcg ttg tca gat aca cca     1200

    His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro

    385                 390                 395                 400

    gtg acg att ctt gat ccc aaa tgc acg gcc aaa aca ttt ccg gat tat     1248

    Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr

                    405                 410                 415

    ttc gag cag ctg gcg cgg att agc cag gca gcc tga                     1284

    Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala

                420                 425

    <210>12

    <211>427

    <212>PRT

    <213>大肠杆菌(Escherichia coli)

    <400>12

    Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile

    1               5                   10                  15

    Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala

                20                  25                  30

    Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp

            35                  40                  45

    Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr

        50                  55                  60

    Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly

    65                  70                  75                  80

    Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly

                    85                  90                  95

    Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp

                100                 105                 110

    Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His

            115                 120                 125

    Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu

        130                 135                 140

    Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly

    145                 150                 155                 160

    Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu

                    165                 170                 175

    Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys

                180                 185                 190

    Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met

            195                 200                 205

    Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val

        210                 215                 220

    Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu

    225                 230                 235                 240

    Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys

                    245                 250                 255

    Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly

                260                 265                 270

    Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys

            275                 280                 285

    Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile

        290                 295                 300

    Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr

    305                 310                 315                 320

    Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn

                    325                 330                 335

    Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu

                340                 345                 350

    Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile

            355                 360                 365

    Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp

        370                 375                 380

    His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro

    385                 390                 395                 400

    Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr

                    405                 410                 415

    Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala

                420                 425

    关 键  词:
    草甘膦 耐受 丙酮 莽草 磷酸 及其 编码 基因
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:新的草甘膦耐受型5烯醇丙酮酰莽草酸3磷酸合酶及其编码基因.pdf
    链接地址:https://www.zhuanlichaxun.net/p-8964879.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1