书签分享收藏举报版权申诉 / 36

立即下载加入VIP,免费下载

当前位置：首页 > > 新的草甘膦耐受型5烯醇丙酮酰莽草酸3磷酸合酶及其编码基因.pdf

新的草甘膦耐受型5烯醇丙酮酰莽草酸3磷酸合酶及其编码基因.pdf

上传人：梁腾

文档编号：8964879

上传时间：2021-01-24

格式：PDF

页数：36

大小：1.80MB

《新的草甘膦耐受型5烯醇丙酮酰莽草酸3磷酸合酶及其编码基因.pdf》由会员分享，可在线阅读，更多相关《新的草甘膦耐受型5烯醇丙酮酰莽草酸3磷酸合酶及其编码基因.pdf（36页完整版）》请在专利查询网上搜索。

本发明涉及一种新型5-烯醇丙酮酰莽草酸-3-磷酸合成酶(5-enolpyrul-shikimate-3-phosphate synthase，EPSPS)，它对其合成底物磷酸烯醇式丙酮酸(PEP)的竞争性抑制剂草甘膦表现出很高的耐受性。本发明也涉及编码上述合成酶的基因、含此基因的构建体和载体，以及用该构建体或载体转化的宿主细胞。。

摘要
申请专利号：	CN02117991.3	申请日：	20020528
公开号：	CN1330762C	公开日：	20070808
当前法律状态：		有效性：	失效
法律详情：
IPC分类号：	C12N15/54,C12N9/10,C12N15/63,C12N15/82,C07H21/04	主分类号：	C12N15/54,C12N9/10,C12N15/63,C12N15/82,C07H21/04
申请人：	北京大学
发明人：	孙义成,陈彦丞,李凤梅,田哲贤,林敏,王忆平
地址：	100871北京市海淀区颐和园路5号
优先权：	02117647.7
专利代理机构：	北京市柳沈律师事务所	代理人：	巫肖南;封新琴
PDF完整版下载：	PDF下载

内容摘要

本发明涉及一种新型5-烯醇丙酮酰莽草酸-3-磷酸合成酶(5-enolpyrul-shikimate-3-phosphate synthase，EPSPS)，它对其合成底物磷酸烯醇式丙酮酸(PEP)的竞争性抑制剂草甘膦表现出很高的耐受性。本发明也涉及编码上述合成酶的基因、含此基因的构建体和载体，以及用该构建体或载体转化的宿主细胞。

权利要求书

1.一种分离的编码草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的核酸序列，所述合酶：(i)氨基酸序列如序列3所示；或(ii)是在(i)限定的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有草甘膦耐受性的由(i)衍生的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)；或(iii)是在(i)限定的氨基酸序列中保守取代一个或几个氨基酸且具有草甘膦耐受性的由(i)衍生的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)。 2.权利要求1所述分离的核酸序列，该核酸序列：(i)如序列2所示；或(ii)是在(i)限定的核苷酸序列中取代、缺失或添加一个或几个核苷酸的核苷酸序列，且其编码的蛋白具有5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)活性和草甘膦耐受性。 3.权利要求2的核酸序列，其具有序列表中编号为2的序列中第574-1800位所示核苷酸序列。 4.权利要求1-3任一项所述分离的核酸序列所编码的蛋白产物，其具有5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)活性和草甘膦耐受性。 5.一种核酸构建体，其含有权利要求1-3任一项所述分离的核酸序列。 6.一种载体，其携有权利要求1-3任一项所述分离的核酸序列，或携有权利要求5的核酸构建体。 7.一种宿主细胞，其由权利要求5的核酸构建体或权利要求6的载体转化而成。 8.权利要求7的宿主细胞，所述细胞包含权利要求1-3任一项所述分离的核酸序列，或包含权利要求5的核酸构建体，或包含权利要求6的载体。 9.权利要求7的宿主细胞，其为后代细胞。 10.权利要求8的宿主细胞，其为后代细胞。 11.制备权利要求7-10任一项所述宿主细胞的方法，包括将权利要求1-3任一项的核酸与适当调控序列可操作相连后导入适当载体，将该载体导入所选宿主细胞，使权利要求1-3任一项的核酸序列表达出有活性的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)。 12.一种草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)，该合酶：(i)氨基酸序列如序列3所示；或(ii)是在(i)限定的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有草甘膦耐受性的由(i)衍生的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)；或(iii)是在(i)限定的氨基酸序列中保守取代一个或几个氨基酸且具有草甘膦耐受性的由(i)衍生的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)。

说明书

新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合酶及其编码基因

技术领域

本发明涉及分子生物学领域。具体地，本发明涉及一种新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合酶(5-enolpyrul-shikimate-3-phosphate synthase，EPSPS)、编码上述合酶的分离的核酸序列，包含该序列或其编码片段的核酸构建体，携有该序列或其编码片段或携有所述核酸构建体的载体，以及用所述构建体或载体转化的宿主细胞。

背景技术

5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSPS)是芳香族氨基酸合成途径中的关键酶，存在于植物和细菌中。草甘膦(Glyphosate)，即N-膦酰甲基甘氨酸，是一种广谱、高效的发芽后除草剂。它是EPSPS合成底物磷酸烯醇式丙酮酸(PEP)的竞争性抑制剂，可阻断PEP和3-磷酸莽草酸这两种底物在 EPSPS催化下向5-烯醇丙酮酰莽草酸-3-磷酸莽草酸的转化，从而阻断芳香族氨基酸合成前体-莽草酸的合成途径，导致植物和细菌死亡。

植株对草甘膦的耐受性可通过向它们的基因组稳定引入草甘膦耐受型 EPSPS编码基因而获得。目前已知的草甘膦耐受性EPSPS基因主要有两大类：I类(如US 4,971,908；US 5,310,667；US 5,866,775等)和II类(如US 5,627,061；US 5,633,435等)，它们都已成功导入植物基因组中，获得了具有草甘膦耐受性的植物细胞，以及完整的植株。

本发明的目的是寻找一种新的能耐受草甘膦的天然序列EPSPS。

发明内容

发明目的

本发明一个目的是提供一种新分离的编码草甘膦耐受型EPSPS蛋白的核酸序列。

本发明另一目的是提供一种新的草甘膦耐受型EPSPS蛋白。

本发明还有一个目的是提供一种由上述核酸序列与使上述核酸序列在相应宿主细胞中表达所必需的调控序列可操作地连接而形成的核酸构建体。所述调控序列具体可任选包括启动子、增强子、前导序列、聚腺苷酸化信号、以及转录和翻译的起始和终止序列等。

本发明还有一个目的是提供一种含有上述核酸序列或核酸构建体的载体。

本发明还有一个目的是提供由上述核酸构建体或载体所转化的宿主细胞，该宿主细胞可以在适当的条件下表达上述核酸序列所编码的蛋白，并使该蛋白具有的EPSPS酶活性以及草甘膦耐受性，从而使该宿主细胞具有草甘膦耐受性。

本发明还有一个目的是提供上述宿主细胞及其后代细胞，这些细胞中含有上述核酸序列或其编码片段、核酸构建体、或载体，并且这些细胞具有草甘膦耐受性。

本发明的其它目的还可以体现在以下对本发明的详细描述以及具体实施例中。

发明概述

本发明提供了一种具有天然序列的草甘膦耐受型5-烯醇丙酮酰莽草酸 -3-磷酸合酶(EPSPS)。所谓“天然序列”是指未经人工诱变，或其它生物学或化学改造，如基因工程改造的序列。本发明提供了该EPSPS的分离的氨基酸序列(即序列表中的序列3)，在该序列的基础上进行任何改动，如缺失、添加和/或取代一或多个氨基酸残基，最终所得氨基酸序列只要能形成具有 EPSPS活性和草甘膦耐受性的蛋白，也都包括在本发明的范围内。

本发明还提供了分离的编码所述EPSPS的核酸序列(即序列表中的序列2，尤其其中的编码区)，在该序列的基础上进行任何改动，如缺失、添加和/或取代一或多个核苷酸，最终所得核酸序列只要能编码具有EPSPS活性和草甘膦耐受性的蛋白，也都包括在本发明的范围内。

将本发明编码EPSPS的核酸序列与相对于该序列同源或异源的其它序列可操作地连接，就构成本发明的核酸构建体。

根据本发明的方法，可将本发明的核酸构建体，或者直接将本发明的分离的核酸序列导入载体，用该载体转化特定的宿主细胞，从而表达本发明的 EPSPS酶并使得该重组宿主细胞获得草甘膦耐受性。或者不通过载体转化，而是直接将本发明的分离的核酸序列，或本发明的核酸构建体用常规方法，如电穿孔等导入宿主细胞，同样可以表达本发明的EPSPS酶并赋予该细胞草甘膦耐受性。如此所获得的载体和重组宿主细胞，以及获得该细胞的方法，都包括在本发明的范围之内。

定义

本文中“序列同源性％”是指通过序列对比，并且必要时插入空隙以获得同源性的最大百分比，而不考虑序列同源性的任何保守取代时，候选序列中相同于目标序列的氨基酸残基的百分数。此处所述序列包括氨基酸序列和核苷酸序列。可使用本领域已知的各种方法测定序列同源性百分比，例如，使用公众可得到的计算机软件如BLAST、BLAST-2、ALIGN、ALIGN-2或 Megalign(DNASTAR)。本领域技术人员可以确定用于序列对比的具体参数，以及全长序列的最大比较所需的任何算法。

本文中“核酸构建体”指单链或双链核酸分子，这些分子分离自天然基因或已经过改变而含有以自然界不存在的方式而结合和并列的核酸片段。当核酸构建体含有表达本发明EPSPS所需的所有调控序列时，术语“核酸构建体”与“表达盒”是同义词。

本文中“调控序列”包括表达本发明多肽所必需的或有利的所有元件。每一种调控序列既可以是编码该多肽的核酸序列天然具有的，也可以是外来的。这种调控序列包括，但不限于，前导序列、聚腺苷酸化序列、前肽序列、启动子、和转录终止子。调控序列最少应包括启动子、以及转录和翻译终止信号。为了导入特异的限制性酶切位点以有助于调控序列和编码异源多肽的核酸序列的编码区进行连接，可以制备带有接头的调控序列。

本文中“可操作地连接”定义为使本发明的分离的核酸序列与相对于该序列同源或异源的任何其它序列相连，从而使它们作为一个整体能编码一种产物。需要时，可通过一定方式，如通过限制性内切酶的酶切而使它们分离。这里所述的同源或异源序列可以是任何序列，如能指导本发明所述分离的核酸序列在特定宿主细胞中表达的任何调控序列，或与本发明所述分离的核酸序列共同编码一种融合蛋白的序列，等等。

本文中“宿主细胞”包括任何能接受本发明所述分离的核酸序列，或能接受含有该序列的构建体或载体，并使该序列稳定维持在细胞内的细胞。宿主细胞包含了本发明所述分离的核酸序列后，能获得由该序列编码的性状或特征。

发明详述

本发明人意外地发现并分离出一种新的草甘膦耐受型EPSPS编码基因。本发明人测定并在本文中公开了该基因的编码序列，即序列表中编号为2的序列以及其中明确指示的编码区(CDS，为第574-1800位的核苷酸)。本发明还公开了由该CDS编码的氨基酸序列，即序列表中编号为3的序列。本发明人使用DNAMAN 4.0版，按照CLUSTAL格式，将序列3所示氨基酸序列与已知的I类和II类EPSPS的序列比较后发现，本发明的序列中不含有被以往专利所保护的任何序列(见图2)。在GenBank蛋白序列库中进行的BLAST搜索发现，本发明的序列3与醋酪酸梭状芽孢杆菌EPSPS的氨基酸序列有37％同源性，与大肠杆菌EPSPS的氨基酸序列有20％同源性(见图2)。将序列2中574-1800位核苷酸所示的序列用NCBI-BLAST搜索，未发现与现有任何核酸序列的同源性。因此认为本发明所述的核酸序列和蛋白是新的。

因此，本发明一个方面涉及一种分离的核酸序列，其含有序列表中编号为2的核酸序列并可编码草甘膦耐受性EPSPS。

本发明还涉及含有上述序列2中第574-1800位核苷酸所示序列的分离的核酸序列，其可编码草甘膦耐受性EPSPS。

本发明还涉及在上述序列2所示序列，或上述序列2的第574-1800 位核苷酸所示序列中改变一或多个核苷酸，或缺失和/或添加3个或3的倍数个核苷酸而产生的核酸序列，且该核酸序列能编码具有5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)活性和草甘膦耐受性的蛋白。这里所述的核苷酸改变，缺失和添加是本领域技术范畴之内的常规内容。

本发明还涉及与用上述序列2所限定的核酸序列，或与用上述序列2 的第574-1800位核苷酸所限定的核酸序列具有一定同源性的核酸序列，如同源性至少约65％，优选至少约66％，优选至少约67％，优选至少约 68％，优选至少约69％，优选至少约70％，优选至少约71％，优选至少约 72％，优选至少约73％，优选至少约74％，优选至少约75％，优选至少约 76％，优选至少约77％，优选至少约78％，优选至少约79％，更优选至少约80％，更优选至少约81％，更优选至少约82％，更优选至少约83％，更优选至少约84％，更优选至少约85％，更优选至少约86％，更优选至少约87 ％，更优选至少约88％，更优选至少约89％，更优选至少约90％，更优选至少约91％，更优选至少约92％，更优选至少约93％，更优选至少约94 ％，最优选至少约95％，最优选至少约96％，最优选至少约97％，最优选至少约98％，最优选至少约99％，只要该序列编码具有草甘膦耐受性EPSPS 活性的蛋白就属于本发明的范围。

本发明所述分离的核酸序列可按照本发明实施例部分所述方法从自然界克隆而获得。克隆方法可包括：限制酶切割并分离含有编码目标蛋白的核酸序列的预期核酸片段，将该片段插入载体分子中，将该重组载体掺入到宿主细胞中，从而使该核酸序列的多个拷贝或克隆在该宿主细胞中复制。但是，更简便的方法是，根据在此公开的核苷酸序列，用自动核苷酸合成仪(如 Applied Biosystems公司的ABI394 DNA合成仪)合成所述序列，或参照2000 年10月4日公开的中国专利申请99103472.4的方法，分别合成上述核酸序列的片段，然后用常规连接酶和载体将这些片段连接成完整序列。

本发明的核酸序列可以是基因组序列、cDNA序列、RNA序列、半合成的序列、完全人工合成的序列或其任何组合物。

本发明另一方面还涉及能编码具有EPSPS活性和草甘膦耐受性的蛋白产物的分离的核酸序列，其中所述蛋白产物具有序列3所示氨基酸序列。

本发明还涉及能编码具有EPSPS活性和草甘膦耐受性的蛋白产物的分离的核酸序列，其中所述蛋白产物的氨基酸序列相对于上述序列3所示氨基酸序列，有一或多个氨基酸的取代、缺失和/或添加，但该产物仍具有EPSPS 活性和草甘膦耐受性。所述氨基酸的取代、缺失和/或添加都是本领域常规技术可以完成的。优选这种氨基酸变化为：小的特性改变，即不显著影响蛋白的折叠和/或活性的保守氨基酸取代；小的缺失，通常约1-30个氨基酸的缺失；小的氨基或羧基端延伸，例如氨基端延伸一个甲硫氨酸残基；小的连接肽，例如约20-25个残基长。

保守取代的实例是在下列氨基酸组内发生的取代：碱性氨基酸(如精氨酸、赖氨酸和组氨酸)、酸性氨基酸(如谷氨酸和天冬氨酸)、极性氨基酸(如谷氨酰胺、天冬酰胺)、疏水性氨基酸(如亮氨酸、异亮氨酸和缬氨酸)、芳香氨基酸(如苯丙氨酸、色氨酸和酪氨酸)，以及小分子氨基酸(如甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变特定活性的那些氨基酸取代在本领域内是众所周知的，并且已由，例如，N.Neurath和R.L.Hill在1979 年纽约学术出版社(Academic Press)出版的Protein中进行了描述。最常见的互换有Ala/Ser，Val/Ile，Asp/Glu，Thr/Ser，Ala/Gly，Ala/Thr，Ser/Asn，Ala/Val， Ser/Gly，Tyr/Phe，Ala/Pro，Lys/Arg，Asp/Asn，Leu/Ile，Leu/Val，Ala/Glu，和Asp/Gly，以及它们相反的互换。

对于本领域的技术人员而言很明显，这种取代可以在对分子功能起重要作用的区域之外发生，而且仍产生活性多肽。对于由本发明的分离的核酸序列编码的多肽，其活性必需的并因此选择不被取代的氨基酸残基，可以根据本领域已知的方法，如定点诱变或丙氨酸扫描诱变进行鉴定(如参见， Cunningham和Wells，1989，Science 244：1081-1085)。后一技术是在分子中每一个带正电荷的残基处引入突变，检测所得突变分子的草甘膦耐受性 EPSPS活性，从而确定对该分子活性而言重要的氨基酸残基。底物-酶相互作用位点也可以通过其三维结构的分析来测定，这种三维结构可由核磁共振分析、结晶学或光亲合标记等技术测定(参见，如de Vos等，1992， Science 255： 306-312；Smith等，1992， J.Mol.Biol 224：899-904；Wlodaver等，1992， FEBS Letters 309：59-64)。

本发明还涉及与上述序列3所示氨基酸序列具有一定同源性的氨基酸序列，如同源性至少约50％，优选至少约60％，优选至少约65％，优选至少约66％，优选至少约67％，优选至少约68％，优选至少约69％，优选至少约70％，优选至少约71％，优选至少约72％，优选至少约73％，优选至少约74％，优选至少约75％，优选至少约76％，优选至少约77％，优选至少约78％，优选至少约79％，更优选至少约80％，更优选至少约81％，更优选至少约82％，更优选至少约83％，更优选至少约84％，更优选至少约 85％，更优选至少约86％，更优选至少约87％，更优选至少约88％，更优选至少约89％，更优选至少约90％，更优选至少约91％，更优选至少约92 ％，更优选至少约93％，更优选至少约94％，最优选至少约95％，最优选至少约96％，最优选至少约97％，最优选至少约98％，最优选至少约99 ％，只要具有所述同源序列的蛋白为草甘膦耐受性EPSPS蛋白，该序列就属于本发明的范围。

由本发明的分离的核酸序列编码的蛋白，具有含序列3所示氨基酸序列之EPSPS的活性的至少20％，优选至少40％，更优选至少60％，甚至更优选至少80％，甚至更优选至少90％，最优选至少100％。

本发明还涉及含有上述定义的核酸序列，或其中的编码序列(如本文中，序列2的574-1800位核苷酸)的核酸构建体。

本发明的核酸构建体还含有能使上述序列在所选宿主细胞中表达所必需的调控序列。所述调控序列与上述分离的核酸序列在核酸构建体中可操作地连接。

调控序列可以是启动子序列，包括介导多肽的表达的转录调控序列。启动子可以是在细胞中显示转录活性的任何核酸序列，包括突变的、截短的、及杂合的启动子，而且可以从编码细胞外或细胞内多肽的基因中得到，这些多肽可以与该细胞同源或不同源。众多用于原核细胞的启动子为本领域所熟知。

调控序列也可以是适当的转录终止序列，即被本文所述的宿主细胞识别以终止转录的序列。该终止序列与编码多肽的核酸序列的3’端可操作地连接。任何在宿主细胞中有功能的终止子都可以在本发明中使用。

调控序列可以是适当的前导序列，即mRNA上对细胞的翻译很重要的非翻译区。前导序列与编码多肽的核酸序列的5’端可操作地连接。任何在宿主细胞中有功能的前导序列都可以在本发明中使用。

调控序列也可以是聚腺苷酸化序列。该序列与核酸序列的3’端可操作地连接，而且当转录时，被细胞作为信号来识别，从而将聚腺苷酸残基加到转录出的mRNA上。任何在该细胞中有功能的聚腺苷酸化序列都可以在本发明中使用。

核酸构建体还可以包括一个或多个这样的核酸序列，这些核酸序列编码一个或多个有利于指导异源多肽表达的因子，例如，转录激活因子(如反式作用因子)、伴侣蛋白和加工型蛋白酶。任何在宿主细胞特别是细菌细胞和植物细胞中有效的因子都可以在本发明中使用。编码一个或多个这些因子的核酸不一定与编码异源多肽的核酸序列串联。

可以将上述各种核酸和调控序列连接在质粒或病毒等常规载体上，产生本发明的“重组表达载体”，所用方法是本领域技术人员所熟知的(可参见J. Sambrook，E.F.Fritsch和T.Maniatus，1989， Molecullar Cloning，laboratorVmannual，2th ed，Cold Spring，NY)。所述载体可以包含一个或多个便利的限制性内切酶位点。载体的选择通常取决于载体与所用宿主细胞的兼容性。所述载体可以是线性或闭合环状质粒。这样的载体可以是自主复制型载体，即，以染色体外实体的形式存在的载体，其复制独立于染色体的复制，如质粒(一种染色体外元件)，微型染色体，或人工染色体。载体可以包含确保自我复制的任何手段。或者，所述载体也可在导入细胞后，整合到基因组中并随染色体一起复制。载体系统可以是单一载体或质粒或两个或多个载体或质粒(它们共同包含目标核酸序列)，或是转座子。

在载体向细胞基因组整合的情况中，该载体可以包含指导该载体通过同源重组整合入细胞基因组的附加核酸序列。这些附加的核酸序列能够使该载体在染色体的精确位置整合入基因组中。为了增加在精确位置整合的可能性，整合元件应该优选包含足够数量的核酸，例如100至1500个碱基对，优选400至1500个碱基对，最优选800至1500个碱基对，它们与其相应的靶序列高度同源以提高同源重组的可能性。这些整合元件可以是与细胞基因组中靶序列同源的任何序列。而且，这些整合元件可以是非编码或编码型核酸序列。另一方面，该载体可以通过非同源重组整合入细胞的基因组中。

在自主复制的情况中，该载体可以进一步包含使该载体能在细菌细胞和植物细胞中自主复制的复制起始点。

本发明还涉及含有本发明核酸序列的重组“宿主细胞”。可将含有本发明核酸序列的核酸构建体或载体引入宿主细胞中，使本发明的核酸序列整合至染色体上或使载体自主复制，从而本发明的核酸序列得以在该宿主细胞中稳定表达，导致赋予该宿主细胞抗草甘膦的抗性。

宿主细胞可以是原核生物如细菌的细胞，但更优选真核生物如植物的细胞。

常用的细菌细胞有革兰氏阳性细菌如芽孢杆菌的细胞，或革兰氏阴性细菌如大肠杆菌和假单胞菌的细胞。在一个优选的实施方案中，细菌宿主细胞大肠杆菌的细胞。

将表达载体引入细菌宿主细胞可通过原生质体转化(如Chang和 Cohen，1979，分子普通遗传学168：111-115)，利用感受态细胞(如Young 和Spizizin，1961，J.Bacteriol.81：823-829，或Dubnau和Davidoff-Abelson， 1971，J.Mol.Biol.56：209-221)，通过电穿孔(如Shigekawa和Dower，1988， Biotech.6：742-751)，或通过接合作用(如Koehler和Thorne，1987，J.Bacteriol. 169：5771-5278)而实现。

附图说明

图1显示pKU2004的质粒图谱。

图2显示恶臭假单胞菌P.P4G-1的EPSPS与多个已知EPSPS的氨基酸序列比较。图中方框和阴影所示为以往专利所具体要求保护的序列。

图3显示带不同EPSPS基因的大肠杆菌XL1-BLUE MR在不同草甘膦浓度下的生长曲线。

具体实施方式

实施例1. 草甘膦耐受菌株的分离

在河北省保定市附近一个草甘膦生产厂周围土壤中采样，用含有一定浓度草甘膦的培养基进行有效分离，共得到48株对草甘膦有很强耐受和降解能力的菌株，其中一株菌4G-1可以在400mM草甘膦限制性培养基上生长，而且对100mg/L的氨苄青霉素具有抗性，选择此菌株进行进一步研究。

实施例2. 草甘膦耐受菌株的鉴定

a) 4G-1菌总DNA的小量制备

在3ml含100mg/L氨苄青霉素的LB液体培养基中接种4G-1菌株，28 ℃振荡过夜培养，12000rpm/min离心收集菌体，将所得离心产物重悬于0.5ml 溶液I(10mM NaCl，20mM Tris-Hcl pH 8.0，1mM EDTA)中，加入蛋白酶K (Merck，德国)和SDS至终浓度分别为10μg/ml和0.5％。小心颠倒混匀，50℃ 放置6小时以上。加入等体积的酚，小心颠倒混匀，室温放置10min。室温 12000rpm/min离心5min，用枪头(AxyGen，USA)吸取上清水相，再用等体积酚/氯仿抽提一遍。在上清液中加入10％3M NaAC，加2.3倍体积的无水乙醇沉淀，于-10℃12000rpm/min离心25min。弃去上清，再加70％乙醇500μl 洗涤，12000rpm/min离心1分钟，尽量吸尽上清，在Savant中抽干20min 或37℃温箱中晾干1hr，加入100μl TE溶液(10mM Tris-Cl，1mM EDTA， pH8.0)将其溶解，置-20℃中冻存备用。

b) 4G-1菌株16S rRNA的克隆

合成一对16S rRNA的通用引物(引物1：5’AGA GTT TGA TCA TGG CTC AG 3’和引物2：5’TAC GGT TAC CTT GTT ACG ACT T 3’)。用这一对引物在Robocycler 40(Stratagene)中进行PCR扩增反应。反应体系为：1μl 4G-1菌株总DNA为模板，5μl缓冲液，4μl 10μmol dNTP，1μl 20 pmol/μl引物1和1μl 20pmol/μl引物2，37μl去离子水。反应条件为：94℃10min，加入1μl 5U Pyrobest Taq DNA聚合酶，然后以94℃1min、50℃1min、72 ℃2min进行30个循环，最后72℃再延伸10min。得到一段约1.5kb的片段。按照PCR产物纯化试剂盒供应商Boehringer提供的方法提纯PCR产物。

将PCR纯化产物进行加A(脱氧腺苷酸)反应。反应体系为：20μl(2μg) PCR纯化产物，5μl缓冲液，1μl(5U)Taq DNA聚合酶(鼎国公司，北京)，4μl 5μmol dATP，20μl去离子水。

将反应产物按PCR产物的纯化方法纯化后，按照供应商Takara的说明与T载体(Takara，大连)相连，得到质粒pKU2000。测序结果如序列1所示。在美国国家生物信息中心(NCBI)用BLAST软件以及BLASTP 2.2.2 [Dec-14-2001]数据库进行序列比对，发现该序列与恶臭假单胞菌 (pseudomonas putida)16S rRNA的基因序列有99％同源性，因此推定4G-1 菌株为恶臭假单胞菌，将其命名为恶臭假单胞菌(pseudomonas putida)4G-1 (简称P.P4G-1)，并于2002年4月30日将该菌株保藏在中国微生物菌种保藏管理委员会普通微生物中心(中国.北京.中关村)，保藏号为CGMCC 0739。

实施例3. 4G-1菌株基因文库的构建

a) 4G-1总DNA的大量制备

将P.P4G-1菌株接种至含100ml LB培养基(补加100mg/L氨苄青霉素) 的250ml锥形瓶中，28℃以200rpm/min振荡培养过夜，离心(8000转/min， 5min)，将沉淀重悬于14ml上述溶液I中，加入蛋白酶K(Merck，德国)和 SDS至终浓度分别为10μg/ml和0.5％。小心颠倒混匀，50℃放置6 小、时。加入等体积的酚，小心颠倒混匀，室温放置10min。室温4000mm/min离心 20min，用宽口枪头吸取上清水相，再加入等体积的酚/氯仿抽提一遍。在上清液中加入10％3M NaAC(pH 5.5)，加2.3倍体积的无水乙醇沉淀。用玻璃棒小心挑出DNA，于70％乙醇中洗涤，弃去乙醇，晾干，加入2ml TE溶液 (pH 8.0)于4℃溶解24小时，得到约1mg总DNA。0.3％琼脂糖凝胶电泳确定DNA片段在80Kb以上。

b) 回收总DNA的酶切片段

取200μl总DNA(100μg)，加入5U限制性内切酶Sau3AI于室温分别酶切消化20分钟，30分钟，45分钟。合并酶切消化产物，加入EDTA至终浓度0.25mM，用等体积的酚/氯仿抽提，取上清加入10％3M醋酸钠，加2.3 倍体积的无水乙醇沉淀，沉淀物用70％乙醇洗涤，如上述抽干，加入200μl TE溶解，将其加入Beckman sw28超速离心管中的12ml 10-40％蔗糖密度梯度上，将这些样品于20℃Beckman sw28转子中以120000g离心18小时，从顶部收集各组分(0.5ml)，每组分取15μl用0.3％琼脂糖凝胶电泳分析，合并含有30-40kb DNA的组分，加入约2倍体积的去离子水，7倍体积的无水乙醇，-20℃过夜沉淀，70％乙醇洗涤，干燥，溶于50μl TE中。

c) 4G-1基因文库的构建

按照Stratagne的方法将其提供的SuperCos l柯斯质粒载体先后用Xba I、碱性磷酸酶、BamHI处理，将其与上一步分离的总DNA片段相连。

按照Stratagene的说明书使用Gigapack III Gold的包装抽提物在体外包装一份连接产物；用Stratagene的试剂盒在大肠杆菌XL 1-Blue MR(Stratagene) 上滴定文库。由此获得的文库按照同一供应商的说明加以扩增和储存。

实施例4.

具有草甘膦耐受性的EPSPS基因的分离、筛选、测序及分析

a) 具有草甘膦耐受性基因的文库的筛选

将1ml上述文库的储存液离心，弃去上清，加1ml灭菌生理盐水重悬，离心弃去上清，加1ml灭菌生理盐水重悬。按照大约每平皿103个细菌的密度涂布10mM草甘膦-50mg/L氨苄青霉素平板(20mM硫酸铵；0.4％葡萄糖； 10mM草甘膦；0.5mM磷酸氢二钾；0.1mg/L硫酸铁；0.5g/L硫酸镁；0.5g/L 氯化钙；2.1g/L氯化钠；50mM Tris(pH7.2)；5mg/L维生素b1；15g/L琼脂)， 37℃过夜培养，得到一个菌株，将此菌株命名为BDS，将其携带的柯斯质粒命名为pKU2001。

b) 草甘膦耐受性基因的分离

将BDS菌株接种在50ml锥形瓶内20ml LB(补加50mg/L氨苄青霉素) 中，以300rpm/min 37℃摇床培养12hr，离心收集菌体后按 Molecullar cloning.laboratory manual，出处同上所述碱法提取质粒pKU2001。将其与柯斯质粒载体重新转化入大肠杆菌XL1-Blue MR(Stratagene)中，于10mM草甘膦平板划线，只带柯斯质粒空载体的菌株无法在草甘膦培养基上生长，而带有 pKU2001的菌株生长良好，证实pKU2001中确实带有抗草甘膦的基因。

将pKU2001用Sau3AI消化，用0.7％琼脂糖凝胶电泳回收2-4kb DNA 片段，与经BamH I酶切并已经去磷酸化的pUC18载体(Yanisch-Perron，C.， Vieria，J.and Messing，J.1985，Gene 33：103-119)相连，转化入大肠杆菌 XL1-Blue MR(Stratagene)中，在补充50mg/L氨苄青霉素的10mM草甘膦板上铺板，37℃过夜培养，得到数十个克隆，挑菌、提质粒，筛选得到携有约2kb的外源片段的质粒，命名为pKU2002。将质粒pKU2002与pUC18 空载体分别转入大肠杆菌XL1-Blue MR(Stratagene)中，划线于补充有 50μg/ml氨苄青霉素的10mM草甘膦板上，带有pUC18空载体的菌株不能在草甘膦平板上生长，而带有pKU2002质粒的菌株生长良好，证实质粒 pKU2002中确实带有抗草甘膦基因。

c)对pKU2002测序，得到1914bp克隆的全序列，见序列2。

d)用DNASIS软件对pKU2002进行序列分析，确定唯一可能的读码框(ORF)，见序列2中第574-1800位的核苷酸。其编码的氨基酸序列见序列3。

e)将该蛋白序列在美国国家生物信息中心(NCBI)的GenBank蛋白序列数据库中进行Blast搜索，发现与醋酪酸梭状芽孢杆菌EPSPS的氨基酸序列有37％同源性，与大肠杆菌EPSPS的氨基酸序列有20％同源性。此 1230bp的序列可能编码一种EPSP合酶，将此基因命名为pparoA。分析表明该基因不属于现有任何一种EPSPS类型，而是一种新型的EPSPS基因(第 III类)。大肠杆菌、醋酪酸梭状芽孢杆菌和P.P4G-1的EPSPS氨基酸序列比较见图2。

f)设计一对含有下划线所示BamH I酶切位点的引物：

引物3：5’-CG G GAT CCT AAG TAA GTG AAA GTA ACA ATA CAG C-3’

引物4：5’-CG G GAT CCC TTC TTC GGA CAA TGA CAG AC-3’

以pKU2001为模板，进行PCR扩增。将扩增片段用BamH I酶切后插入pUC18，得到质粒pKU2003，测序证明无错配碱基的引入；将pKU2003 用BamH I酶切，得到的小片段正向连入pACYC184(Chang，A.C.Y.，and Cohen，S.N.，1978，J.Bacteriol.134：1141-1156)的BamH I位点，得到质粒 pKU2004(图谱见图1)，在此质粒中pparoA基因被pACYC184中的Tcr启动子起始转录。

实施例5

大肠杆菌aroA基因的克隆及其草甘膦耐受性定位突变(对照实验)

将大肠杆菌ET8000(MacNeil，T.，MacNeil，D.，and Tyler，B.1982 J. Bacteriol.150：1302-1313)接种至15ml试管内3ml LB液体培养基中，37℃振荡培养过夜，离心收集菌体，按照前述方法提取总DNA。

设计一对引物并引入如下划线所示的BamH I酶切位点：

引物5：5’-CG G GAT CCG TTA ATG CCG AAA TTT TGC TTA ATC-3’

引物6：5’-CG G GAT CCA GGT CCG AAA AAA AAC GCC GAC-3’

以大肠杆菌总DNA为模板扩增得到大肠杆菌的aroA基因，即大肠杆菌中编码EPSPS蛋白的基因，将此基因用BamH I酶切，插入pUC18中得到质粒pKU2005，测序得到序列10，该序列与NCBI的GenBank数据库中大肠杆菌EPSPS的基因序列对比，证实无误。将质粒pKU2005用BamH I 酶切，回收小片段正向插入载体pACYC184的BamH I位点得到质粒 pKU2006。

对大肠杆菌的aroA基因进行点突变，将第287位的鸟嘌呤变为胞嘧啶，从而使大肠杆菌EPSPS蛋白的96位甘氨酸突变为丙氨酸。将该基因片段同样插入pACYC184 BamHI位点，得到质粒pKU2007。

实施例6. 大肠杆菌aroA-菌株的EPSPS功能互补实验

将pACYC 184、pKU2004、pKU2006、pKU2007转化入大肠杆菌AB2889 中(大肠杆菌aroA-菌株，来源于耶鲁大学)，分别在含有终浓度25mg/L氯霉素的限制性M63培养基(13.6g/L KH2PO4.0.5mg/L FeSO4-7H2O，20mM (NH4)2SO4，0.4％葡萄糖，1mM硫酸镁，0.5mg/L维生素B1)上划线培养，结果如表1。

补加aAAS组分如下：

100mg/L苯丙氨酸

100mg/L酪氨酸

100mg/L色氨酸

5mg/L对氨基苯甲酸

5mg/L 2，3-二羟基苯甲酸

5mg/L对羟基苯甲酸

表1.大肠杆菌aroA缺失菌株EPSPS功能互补及草甘膦耐受性实验

AB2889 携带的质粒 EPSPS功能互补及抗草甘膦状况 M63培养基 M63培养基 (补加aAAS) 抗10mM草甘膦 pACYC184 - + - PKU2006 + + - pKU2007 + + + pKU2004 + + +

同时在液体培养条件下，对以上菌株的生长曲线进行了测定。结果表明，与大肠杆菌aroA基因对照一样(pKU2006)，pKU2004所携带的基因完全可以在EPSPS功能上互补大肠杆菌AB2899的aroA缺陷，证明该质粒携带的 1230 bp核酸序列为EPSPS编码基因，同时该基因编码的EPSPS还具有草甘膦耐受性。

实施例7. 新型EPSPS编码基因对草甘膦的抗性强度实验

将质粒pKU2004、pKU2006、pKU2007分别转化入大肠杆菌XL1-Blue MR中，然后分别接种在M63限制性培养基中过夜培养，再转接入补加了不同浓度草甘膦的M63限制性培养基中培养，测它们的生长曲线。结果发现转化有pKU2006的大肠杆菌在5mM草甘膦培养基中生长已受到较明显的抑止，在40mM草甘膦培养基中已停止生长，而转化有pKU2004和pKU2006 的大肠杆菌在40mM草甘膦培养基中生长未受到明显抑制，转化有pKU2004 的大肠杆菌在120mM的草甘膦培养基中还能生长良好(图3：生长曲线)。

序列表

<110>北京大学

<120>新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合成酶及其编码基因

<130>PJMD3540N

<141>2002-04-30

<160>12

<170>PatentIn version 3.1

<210>1

<211>1501

<212>DNA

<213>恶臭假单胞菌P.P4G-1(Pseudomonas putida P.P4G-1)

<400>1

agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc 60

ggatgagaag agcttgctct tcgattcagc ggcggacggg tgagtaatgc ctaggaatct 120

gcctggtagt gggggacaac gtttcgaaag gaacgctaat accgcatacg tcctacggga 180

gaaagcaggg gaccttcggg ccttgcgcta tcagatgagc ctaggtcgga ttagctagtt 240

ggtgaggtaa tggctcacca aggcgacgat ccgtaactgg tctgagagga tgatcagtca 300

cactggaact gagacacggt ccagactcct acgggaggca gcagtgggga atattggaca 360

atgggcgaaa gcctgatcca gccatgccgc gtgtgtgaag aaggtcttcg gattgtaaag 420

cactttaagt tgggaggaag ggcattaacc taatacgtta gtgttttgac gttaccgaca 480

gaataagcac cggctaactc tgtgccagca gccgcggtaa tacagagggt gcaagcgtta 540

atcggaatta ctgggcgtaa agcgcgcgta ggtggtttgt taagttggat gtgaaagccc 600

cgggctcaac ctgggaactg tatccaaaac tggcaagcta gagtacggta gagggtggtg 660

gaatttcctg tgtagcggtg aaatgcgtag atataggaag gaacaccagt ggcgaaggcg 720

accacctgga ctgatactga cactgaggtg cgaaagcgtg gggagcaaac aggattagat 780

accctggtag tccacgccgt aaacgatgtc aactagccgt tggaatcctt gagattttag 840

tggcgcagct aacgcattaa gttgaccgcc tggggagtac ggccgcaagg ttaaaactca 900

aatgaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg aagcaacgcg 960

aagaacctta ccaggccttg acatgcagag aactttccag agatggattg gtgccttcgg 1020

gaactctgac acaggtgctg catggctgtc gtcagctcgt gtcgtgagat gttgggttaa 1080

gtcccgtaac gagcgcaacc cttgtcctta gttaccagca cgtaatggtg ggcactctaa 1140

ggagactgcc ggtgacaaac cggaggaagg tggggatggc gtcaagtcat catggccctt 1200

acggcctggg ctacacacgt gctacaatgg tcggtacaga gggttgccaa gccgcgaggt 1260

ggagctaatc tcacaaaacc gatcgtagtc cggatcgcag tctgcaactc gactgcgtga 1320

agtcggaatc gctagtaatc gcgaatcaga atgtcgcggt gaatacgttc ccgggccttg 1380

tacacaccgc ccgtcacacc atgggagtgg gttgcaccag aagtagctag tctaaccttc 1440

gggaggacgg ttaccacggt gtgattcatg actggggtga agtcgtaaca aggtaaccgt 1500

a 1501

<210>2

<211>1914

<212>DNA

<213>恶臭假单胞菌P.P4G-1(Pseudomonas putida P.P4G-1)

<220>

<221>CDS

<222>(574)..(1803)

<223>

<400>2

gatcataaaa catgcttgta taaaggatgc tgccatgttc cgtgaactgg aagcgaacaa 60

tcttgcggta tatcagaaaa agccaaagct gattgcagtg cttcttcagc gtaatgctca 120

gttaaaagcg aaggttgttc aggaggatga gttcgaaaag tcggtaaggc gtttgttgaa 180

ctttggtcat acattggggc atgccatcga aaatgaatat gcgttgatgc atggccatgc 240

ggttgctata ggaatgacat acgcgtgtca tatttctgag caattgtctg gattcaaaca 300

aacaaatcgc gtggtagaag tgttggaaca atatgggtta ccgacttata tggcattcga 360

tagggaaaag gcttttaatc tgttgaaaat ggacaagaag cgtgaaaaaa aggaaatgaa 420

ctatgtgttg ctggaaaaag tagggaaggg agtggtgaag agtattccac tggttcaatt 480

agaaaaaatc attcaagcat taccaaagtg aaagtaacaa tacagcccgg agatctgact 540

ggaattatcc agtcacccgc ttcaaaaagt tcg atg cag cga gct tgt gct gct 594

Met Gln Arg Ala Cys Ala Ala

1 5

gca ctg gtt gca aaa gga ata agt gag atc att aat ccc ggt cat agc 642

Ala Leu Val Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser

10 15 20

aat gat gat aaa gct gcc agg gat att gta agc cgg ctt ggt gcc agg 690

Asn Asp Asp Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg

25 30 35

ctt gaa gat cag cct gat ggt tct ttg cag ata aca agt gaa ggc gta 738

Leu Glu Asp Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val

40 45 50 55

aaa cct gtc gct cct ttt att gac tgc ggt gaa tct ggt tta agt atc 786

Lys Pro Val Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile

60 65 70

cgg atg ttt act ccg att gtt gcg ttg agt aaa gaa gag gtg acg atc 834

Arg Met Phe Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile

75 80 85

aaa gga tct gga agc ctt gtt aca aga cca atg gat ttc ttt gat gaa 882

Lys Gly Ser Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu

90 95 100

att ctt ccg cat ctc ggt gta aaa gtt aaa tct aac cag ggt aaa ttg 930

Ile Leu Pro His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu

105 110 115

cct ctc gtt ata cag ggg cca ttg aaa cca gca gac gtt acg gtt gat 978

Pro Leu Val Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp

120 125 130 135

ggg tec tta agc tct cag ttc ctt aca ggt ttg ttg ctt gca tat gcg 1026

Gly Ser Leu Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala

140 145 150

gcc gca gat gca agc gat gtt gcg ata aaa gta acg aat ctc aaa agc 1074

Ala Ala Asp Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser

155 160 165

cgt ccg tat atc gat ctt aca ctg gat gtg atg aag cgg ttt ggt ttg 1122

Arg Pro Tyr Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu

170 175 180

aag act ccc gag aat cga aac tat gaa gag ttt tat ttc aaa gcc ggg 1170

Lys Thr Pro Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly

185 190 195

aat gta tat gat gaa acg aaa atg caa cga tac acc gta gaa ggc gac 1218

Asn Val Tyr Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp

200 205 210 215

tgg agc ggt ggt gct ttt tta ctg gta gcg ggg gct att gcc ggg ccg 1266

Trp Ser Gly Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro

220 225 230

atc acg gta aga ggt ttg gat ata gct tcg acg cag gct gat aaa gcg 1314

Ile Thr Val Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala

235 240 245

atc gtt cag gct ttg atg agt gcg aac gca ggt att gcg att gat gca 1362

Ile Val Gln Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala

250 255 260

aaa gag atc aaa ctt cat cct gct gat ctc aat gca ttt gaa ttt gat 1410

Lys Glu Ile Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp

265 270 275

gct act gat tgc ccg gat ctt ttt ccg cca ttg gtt gct ttg gcg tct 1458

Ala Thr Asp Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser

280 285 290 295

tat tgc aaa gga gaa aca aag atc aaa ggc gta agc agg ctg gcg cat 1506

Tyr Cys Lys Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His

300 305 310

aaa gaa agt gac aga gga ttg acg ctg cag gac gag ttc ggg aaa atg 1554

Lys Glu Ser Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met

315 320 325

ggt gtt gaa atc cac ctt gag gga gat ctg atg cgc gtg atc gga ggg 1602

Gly Val Glu Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly

330 335 340

aaa ggc gta aaa gga gct gaa gtt agt tca agg cac gat cat cgc att 1650

Lys Gly Val Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile

345 350 355

gcg atg gct tgc gcg gtg gct gct tta aaa gct gtg ggt gaa aca acc 1698

Ala Met Ala Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr

360 365 370 375

atc gaa cat gca gaa gcg gtg aat aaa tcc tac ccg gat ttt tac agc 1746

Ile Glu His Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser

380 385 390

gat ctt aaa caa ctt ggc ggt gtt gta tct tta aac cat caa ttt aat 1794

Asp Leu Lys Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn

395 400 405

ttc tca tga atagcttcgg ccgcatcttc agggtgcata tttttggcga 1843

Phe Ser

atcacatggt gaatcagtag gcatcgttat tgatggttgt cctgctggtc tgtcattgtc 1903

cgaagaagat c 1914

<210>3

<211>409

<212>PRT

<213>恶臭假单胞菌P.P4G-1(Pseudomonas put ida P.P4G-1)

<400>3

Met Gln Arg Ala Cys Ala Ala Ala Leu Val Ala Lys Gly Ile Ser Glu

1 5 10 15

Ile Ile Asn Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg Asp Ile

20 25 30

Val Ser Arg Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly Ser Leu

35 40 45

Gln Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Asp Cys

50 55 60

Gly Glu Ser Gly Leu Ser Ile Arg Met Phe Thr Pro Ile Val Ala Leu

65 70 75 80

Ser Lys Glu Glu Val Thr Ile Lys Gly Ser Gly Ser Leu Val Thr Arg

85 90 95

Pro Met Asp Phe Phe Asp Glu Ile Leu Pro His Leu Gly Val Lys Val

100 105 110

Lys Ser Asn Gln Gly Lys Leu Pro Leu Val Ile Gln Gly Pro Leu Lys

115 120 125

Pro Ala Asp Val Thr Val Asp Gly Ser Leu Ser Ser Gln Phe Leu Thr

130 135 140

Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Val Ala Ile

145 150 155 160

Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr Ile Asp Leu Thr Leu Asp

165 170 175

Val Met Lys Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn Tyr Glu

180 185 190

Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr Asp Glu Thr Lys Met Gln

195 200 205

Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu Leu Val

210 215 220

Ala Gly Ala Ile Ala Gly Pro Ile Thr Val Arg Gly Leu Asp Ile Ala

225 230 235 240

Ser Thr Gln Ala Asp Lys Ala Ile Val Gln Ala Leu Met Ser Ala Asn

245 250 255

Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile Lys Leu His Pro Ala Asp

260 265 270

Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu Phe Pro

275 280 285

Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys Ile Lys

290 295 300

Gly Val Ser Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu Thr Leu

305 310 315 320

Gln Asp Glu Phe Gly Lys Met Gly Val Glu Ile His Leu Glu Gly Asp

325 330 335

Leu Met Arg Val Ile Gly Gly Lys Gly Val Lys Gly Ala Glu Val Ser

340 345 350

Ser Arg His Asp His Arg Ile Ala Met Ala Cys Ala Val Ala Ala Leu

355 360 365

Lys Ala Val Gly Glu Thr Thr Ile Glu His Ala Glu Ala Val Asn Lys

370 375 380

Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly Val Val

385 390 395 400

Ser Leu Asn His Gln Phe Asn Phe Ser

405

<210>4

<211>20

<212>DNA

<213>人工序列

<400> 4

agagtttgat catggctcag 20

<210>5

<211>22

<212>DNA

<213>人工序列

<400>5

tacggttacc ttgttacgac tt 22

<210>6

<211>34

<212>DNA

<213>人工序列

<400>6

cgggatccta agtaagtgaa agtaacaata cagc 34

<210>7

<211>29

<212>DNA

<213>人工序列

<400>7

cgggatccct tct tcggaca atgacagac 29

<210>8

<211>33

<212>DNA

<213>人工序列

<400>8

cgggatccgt taatgccgaa attttgctta atc 33

<210>9

<211>30

<212>DNA

<213>人工序列

<400>9

cgggatccag gtccgaaaaa aaacgccgac 30

<210>10

<211>1436

<212>DNA

<213>大肠杆菌(Escherichia coli)

<400>10

gttaatgccg aaattttgct taatccccac agccagcctg tggggttttt atttctgttg 60

tagagagttg agttcatgga atccctgacg ttacaaccca tcgctcgtgt cgatggcact 120

attaatctgc ccggttccaa gagcgtttct aaccgcgctt tattgctggc ggcattagca 180

cacggcaaaa cagtattaac caatctgctg gatagcgatg acgtgcgcca tatgctgaat 240

gcattaacag cgttaggggt aagctatacg ctttcagccg atcgtacgcg ttgcgaaatt 300

atcggtaacg gcggtccatt acacgcagaa ggtgccctgg agttgttcct cggtaacgcc 360

ggaacggcaa tgcgtccgct ggcggcagct ctttgtctgg gtagcaatga tattgtgctg 420

accggtgagc cgcgtatgaa agaacgcccg attggtcatc tggtggatgc gctgcgcctg 480

ggcggggcga agatcactta cctggaacaa gaaaattatc cgccgttgcg tttacagggc 540

ggctttactg gcggcaacgt tgacgttgat ggctccgttt ccagccaatt cctcaccgca 600

ctgttaatga ctgcgcctct tgcgccggaa gatacggtga ttcgtattaa aggcgatctg 660

gtttctaaac cttatatcga catcacactc aatctgatga agacgtttgg tgttgaaatt 720

gaaaatcagc actatcaaca atttgtcgta aaaggcgggc agtcttatca gtctccgggt 780

acttatttgg tcgaaggcga tgcatcttcg gcttcttact ttctggcagc agcagcaatc 840

aaaggcggca ctgtaaaagt gaccggtatt ggacgtaaca gtatgcaggg tgatattcgc 900

tttgctgatg tgctggaaaa aatgggcgcg accatttgct ggggcgatga ttatatttcc 960

tgcacgcgtg gtgaactgaa cgctattgat atggatatga accatattcc tgatgcggcg 1020

atgaccattg ccacggcggc gttatttgca aaaggcacca ccacgctgcg caatatctat 1080

aactggcgtg ttaaagagac cgatcgcctg tttgcgatgg caacagaact gcgtaaagtc 1140

ggcgcggaag tggaagaggg gcacgattac attcgtatca ctcctccgga aaaactgaac 1200

tttgccgaga tcgcgacata caatgatcac cggatggcga tgtgtttctc gctggtggcg 1260

ttgtcagata caccagtgac gattcttgat cccaaatgca cggccaaaac atttccggat 1320

tatttcgagc agctggcgcg gattagccag gcagcctgaa tgaacaacgg gcaataaata 1380

gccaaatctt tctttatcaa aacgtcggca cattgtcggc gttttttttc ggacct 1436

<210>11

<211>1284

<212>DNA

<213>大肠杆菌(Escherichia coli)

<220>

<221>CDS

<222>(1)..(1284)

<223>

<400>11

atg gaa tcc ctg acg tta caa ccc atc gct cgt gtc gat ggc act att 48

Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile

1 5 10 15

aat ctg ccc ggt tcc aag agc gtt tct aac cgc gct tta ttg ctg gcg 96

Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala

20 25 30

gca tta gca cac ggc aaa aca gta tta acc aat ctg ctg gat agc gat 144

Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp

35 40 45

gac gtg cgc cat atg ctg aat gca tta aca gcg tta ggg gta agc tat 192

Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr

50 55 60

acg ctt tca gcc gat cgt acg cgt tgc gaa att atc ggt aac ggc ggt 240

Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly

65 70 75 80

cca tta cac gca gaa ggt gcc ctg gag ttg ttc ctc ggt aac gcc gga 288

Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly

85 90 95

acg gca atg cgt ccg ctg gcg gca gct ctt tgt ctg ggt agc aat gat 336

Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp

100 105 110

att gtg ctg acc ggt gag ccg cgt atg aaa gaa cgc ccg att ggt cat 384

Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His

115 120 125

ctg gtg gat gcg ctg cgc ctg ggc ggg gcg aag atc act tac ctg gaa 432

Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu

130 135 140

caa gaa aat tat ccg ccg ttg cgt tta cag ggc ggc ttt act ggc ggc 480

Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly GIy

145 150 155 160

aat gtt gac gtt gat ggc tcc gtt tcc agc caa ttc ctc acc gca ctg 528

Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu

165 170 175

tta atg act gcg cct ctt gcg ccg gaa gat acg gtg att cgt att aaa 576

Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys

180 185 190

ggc gat ctg gtt tct aaa cct tat atc gac atc aca ctc aat ctg atg 624

Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met

195 200 205

aag acg ttt ggt gtt gaa att gaa aat cag cac tat caa caa ttt gtc 672

Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val

210 215 220

gta aaa ggc ggg cag tct tat cag tct ccg ggt act tat ttg gtc gaa 720

Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu

225 230 235 240

ggc gat gca tct tcg gct tct tac ttt ctg gca gca gca gca atc aaa 768

Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys

245 250 255

ggc ggc act gta aaa gtg acc ggt att gga cgt aac agt atg cag ggt 816

Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly

260 265 270

gat att cgc ttt gct gat gtg ctg gaa aaa atg ggc gcg acc att tgc 864

Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys

275 280 285

tgg ggc gat gat tat att tcc tgc acg cgt ggt gaa ctg aac gct att 912

Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile

290 295 300

gat atg gat atg aac cat att cct gat gcg gcg atg acc att gcc acg 960

Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr

305 310 315 320

gcg gcg tta ttt gca aaa ggc acc acc acg ctg cgc aat atc tat aac 1008

Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn

325 330 335

tgg cgt gtt aaa gag acc gat cgc ctg ttt gcg atg gca aca gaa ctg 1056

Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu

340 345 350

cgt aaa gtc ggc gcg gaa gtg gaa gag ggg cac gat tac att cgt atc 1104

Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile

355 360 365

act cct ccg gaa aaa ctg aac ttt gcc gag atc gcg aca tac aat gat 1152

Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp

370 375 380

cac cgg atg gcg atg tgt ttc tcg ctg gtg gcg ttg tca gat aca cca 1200

His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro

385 390 395 400

gtg acg att ctt gat ccc aaa tgc acg gcc aaa aca ttt ccg gat tat 1248

Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr

405 410 415

ttc gag cag ctg gcg cgg att agc cag gca gcc tga 1284

Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala

420 425

<210>12

<211>427

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>12

Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile

1 5 10 15

Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala

20 25 30

Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp

35 40 45

Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr

50 55 60

Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly

65 70 75 80

Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly

85 90 95

Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp

100 105 110

Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His

115 120 125

Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu

130 135 140

Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly

145 150 155 160

Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu

165 170 175

Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys

180 185 190

Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met

195 200 205

Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val

210 215 220

Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu

225 230 235 240

Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys

245 250 255

Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly

260 265 270

Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys

275 280 285

Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile

290 295 300

Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr

305 310 315 320

Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn

325 330 335

Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu

340 345 350

Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile

355 360 365

Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp

370 375 380

His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro

385 390 395 400

Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr

405 410 415

Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala

420 425

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

30 金币 0人已下载

下载	加入VIP,免费下载

版权申诉 PDF格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

关键词：: 草甘膦耐受丙酮莽草磷酸及其编码基因

专利查询网所有文档均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

0条评论

还可以输入200字符

暂无评论，赶快抢占沙发吧。

关于本文

本文标题：新的草甘膦耐受型5烯醇丙酮酰莽草酸3磷酸合酶及其编码基因.pdf
链接地址：https://www.zhuanlichaxun.net/p-8964879.html