微生物草甘膦抗性5-烯醇丙酮基莽草酸-3-磷酸合酶
优先权要求
本申请要求2004年6月24日申请的美国临时申请SN 60/582,658的优先权,通过引用将该临时申请的完整内容并入本文。
发明领域
本发明涉及植物分子生物学和植物基因工程。具体地,本发明涉及用于在植物中提供除草剂抗性的方法和DNA构建体,更具体地,涉及该方法中草甘膦抗性5-烯醇丙酮基莽草酸-3-磷酸合酶的用途。
相关技术描述
N-膦酰基甲基甘氨酸,也称作草甘膦,是公知的除草剂,其对多种植物种类有活性。草甘膦是Roundup(Monsanto Co.,St Louis,MO)的活性成分,Roundup是长期以来使用安全并且在环境中具有所希望的短的半寿期的除草剂。当应用于植物表面时,草甘膦移动到植物整株各处。草甘膦由于抑制莽草酸途径而具有植物毒性,其中莽草酸途径为芳香族氨基酸的合成提供前体。草甘膦抑制在植物和一些细菌中发现的I类5-烯醇丙酮基(pyruvyl)-3-磷酸莽草酸合酶(EPSPS)。通过表达下述经修饰的I类EPSPS可以获得植物中的草甘膦耐受性,所述经修饰的I类EPSPS对草甘膦具有较低亲和力,但是在草甘膦存在下仍然保持它们的催化活性(美国专利4,535,060和6,040,497)。
EPSPS酶,如II类EPSPS已经从天然抗草甘膦的细菌中分离并且当该酶作为植物中转基因的基因产物表达时,提供了对植物的草甘膦耐受性(美国专利5,633,435和5,094,945)。降解植物组织中的草甘膦的酶(美国专利5,463,175)也能够赋予植物对草甘膦的耐受性。含有表达草甘膦抗性酶或者降解酶所必要的遗传元件的DNA构建体产生了植物中有用的嵌合转基因。此类转基因用于产生耐受草甘膦的转基因作物植物,从而允许草甘膦用于有效的杂草控制且作物损害最小。例如,已经将草甘膦耐受性基因工程化到玉米(美国专利5,554,798)、小麦(Zhou等人Plant Cell Rep.15:159-163,1995)、大豆(WO 9200377)和芸苔(canola)(WO 9204449)。
除草剂耐受性作物的开发是农业生物技术中的重大突破,因为它为农民提供了新的杂草控制方法。由于其对抑制剂除草剂的耐受性已经成功地工程化的一种酶是I类EPSPS。已经分离了耐受草甘膦的I类EPSPS的变体(Pro-Ser,美国专利4,769,061;Gly-Ala,美国专利4,971,908;Gly-Ala,Gly-Asp,美国专利5,310,667;Gly-Ala,Ala-Thr,美国专利5,8866,775,Thr-Ile,Pro-Ser,美国专利6,040,497)。然而,许多EPSPS变体对草甘膦未表现出足够高的Ki或者对磷酸烯醇丙酮酸(PEP)的Km太高而不能有效作为用于植物中的草甘膦抗性酶(Padgette等人,In″Herbicide-resistant Crops″,Chapter 4 pp 53-83.ed.Stephen Duke,Lewis Pub,CRC Press Boca Raton,Fl 1996)。
在植物分子生物学领域需要多种基因来提供阳性选择标记表型和农学上有用的表型。具体地,草甘膦耐受性广泛用作植物中的阳性选择标记并且是作物生产中使用的有价值的表型。当使用不同的阳性选择标记时,现有转基因性状与新近开发的性状的叠加和组合增强。标记基因提供了不同的表型,如抗生素或者除草剂耐受性,或者通过用于蛋白质和DNA检测的方法可以辨别的分子差别。可以针对叠加的性状对转基因植物加以筛选,通过分析多种抗生素或者除草剂耐受性或者通过DNA检测方法分析新的DNA分子的存在,可以实现所述筛选。
本发明提供了用于表达草甘膦抗性EPSPS酶的嵌合基因。这些酶和编码它们的DNA分子用于基因工程化针对草甘膦除草剂植物耐受性。
附图简述
图1.图解pMON58454的质粒图。
图2.图解pMON42488的质粒图。
图3.图解pMON58477的质粒图。
图4.图解pMON76553的质粒图。
图5.图解pMON58453的质粒图。
图6.图解pMON21104的质粒图。
图7.图解pMON70461的质粒图。
图8.图解pMON81523的质粒图。
图9.图解pMON81524的质粒图。
图10.图解pMON81517的质粒图。
图11.图解pMON58481的质粒图。
图12.图解pMON81546的质粒图。
图13.图解pMON68922的质粒图。
图14.图解pMON68921的质粒图。
图15.图解pMON58469的质粒图。
图16.图解pMON81568的质粒图。
图17.图解pMON81575的质粒图。
发明概述
本发明公开了嵌合DNA分子,其包含编码草甘膦抗性EPSPS酶的多核苷酸分子,其中所述EPSPS酶包含序列结构域X1-D-K-S(SEQID NO:1),其中X1为G或A或S或P;S-A-Q-X2-K(SEQ ID NO:2),其中X2为任意氨基酸;和R-X3-X4-X5-X6(SEQ ID NO:3),其中X3为D或N,X4为Y或H,X5为T或S,X6为R或E;和N-X7-X8-R(SEQ ID NO:4),其中X7为P或E或Q,并且X8为R或L。此外,包含在植物细胞中有功能的启动子分子的嵌合DNA分子还包含编码叶绿体转运(transit)肽的DNA分子,其可操作地连接编码本发明的草甘膦抗性EPSPS酶的DNA分子,以指导EPSPS酶进入植物细胞的叶绿体。本发明的示例性EPSPS酶多肽序列在SEQ ID NOs:5-18中公开。
在本发明的另一方面,提供了嵌合DNA分子,其包含针对本发明的草甘膦抗性EPSPS酶的多核苷酸分子编码序列,其中该多核苷酸分子选自SEQ ID NO:19-32。在本发明的再一个方面,提供了嵌合DNA分子,其包含针对本发明的草甘膦抗性EPSPS酶的多核苷酸分子编码序列,其中该多核苷酸分子已经经修饰以增强在植物细胞中的表达。所修饰的多核苷酸分子是人工DNA分子,其编码与SEQ ID NO:5-18基本同一的EPSPS酶,该人工DNA分子是本发明的一方面。示例性人工DNA分子在SEQ ID NO:33-37中公开。
在本发明的再一方面,提供了用本发明的嵌合DNA分子转化的植物细胞。该嵌合DNA包含选自由SEQ ID NO:5-18和33-37组成的组的多核苷酸。植物细胞可以是单子叶植物或者双子叶植物的植物细胞。将植物细胞再生成完整的转基因植物。用草甘膦处理转基因植物和其子代,并针对对草甘膦的耐受性加以选择。此外,包含嵌合DNA分子的转基因植物和其子代是本发明的一方面。此外,在其细胞和组织中表达本发明的EPSPS酶的转基因植物和其子代是本发明的一方面。
本发明提供了用于选择性杀死作物植物田间中的杂草的方法,其包括步骤:a)种植作物种子或者植物,它们由于嵌合DNA分子插入到所述作物种子或者植物而是草甘膦耐受的,所述嵌合DNA分子包含(i)在植物细胞中有功能的启动子区;和(ii)编码本发明的草甘膦抗性EPSPS的DNA分子;和(iii)转录终止区;和b)对所述作物种子或者植物应用足够量的草甘膦,其抑制草甘膦敏感植物的生长;其中所述量的草甘膦不显著影响包含所述嵌合基因的所述作物种子或者植物。
在本发明的另一方面,提供了鉴定草甘膦抗性EPSPS酶的方法,其包括鉴定EPSPS酶中的S-A-Q-X-K氨基酸基序(motif),其中X是任意氨基酸。还提供了分离的草甘膦抗性EPSPS酶,其包含EPSPS酶中的S-A-Q-X-K氨基酸基序,其中X是任意氨基酸,并且不存在如下基序:-G-D-K-X3-,其中X3是Ser或者Thr,和R-X1-H-X2-E-,其中X1是不带电的极性或者酸性氨基酸并且X2是Ser或者Thr,和-N-X5-T-R-,其中X5是任意氨基酸。包含嵌合DNA分子的转基因植物和其子代包含分离的草甘膦抗性EPSPS酶,其包含EPSPS酶中的S-A-Q-X-K氨基酸基序,其中X是任意氨基酸,并且不存在如下基序:-G-D-K-X3-,其中X3是Ser或者Thr,和R-X1-H-X2-E-,其中X1是不带电的极性或者酸性氨基酸并且X2是Ser或者Thr,和-N-X5-T-R-,其中X5是任意氨基酸。
还提供了产生草甘膦耐受性植物的方法,其包括步骤:a)用本发明的嵌合DNA分子转化植物;和b)将所述植物细胞再生成完整植物;和c)针对草甘膦耐受性对所述植物进行选择。
本发明提供了鉴定转基因的草甘膦耐受性植物种子的方法,其包括步骤:a)从所述种子分离基因组DNA;和b)将DNA引物分子与所述基因组DNA杂交,其中所述DNA引物分子与选自由SEQ ID NO:19-32和33-37组成的组的DNA序列的部分同源或者互补;和c)检测所述杂交产物。
在本发明的另一方面,提供了DNA分子,其包含小麦GBSS(颗粒结合的淀粉合酶,GBSS)叶绿体转运肽(CTP)编码序列,其编码与SEQ ID NO:38基本同一的多肽,所述编码序列可操作地连接草甘膦抗性EPSPS编码序列。小麦GBSS CTP(TS-Ta.Wxy)和草甘膦抗性EPSPS的示例性融合多肽包括,但不限于SEQ ID NO:39、SEQ ID NO:40和SEQ ID NO:41。包含SEQ ID NO:39、SEQ ID NO:40或SEQ IDNO:41的转化植物和子代是本发明的一方面。本发明还预期,可操作地连接异源蛋白的小麦GBSS CTP用于转运到植物叶绿体的用途,其中所述异源蛋白对植物提供了农学上有用的表型。
发明详述
提供下面的描述来更好地详细描述本发明和指导本领域技术人员实施本发明。
本发明描述了草甘膦抗性EPSPS酶的多核苷酸和多肽分子。设计嵌合的DNA分子以在转基因细胞中产生EPSPS和提供对EPSPS酶活性和草甘膦抗性的分析。嵌合DNA分子指包含未在自然界中一起发现的异源调节序列和编码序列的任意DNA分子。因此,嵌合DNA分子可以包含来自不同来源的调节序列和编码序列,或者来自相同来源但是排列方式与自然界中发现的排列方式不同的调节序列和编码序列。在本发明的一方面,将嵌合DNA分子设计成在转基因植物细胞中以足够提供植物细胞的草甘膦耐受性的量产生草甘膦抗性EPSPS酶。通过得到转基因植物的转化步骤,转基因植物细胞在其基因组中含有嵌合的DNA分子。术语“基因组”应用于植物细胞时,不仅包括在细胞核内发现的染色体DNA,而且包括在细胞的亚细胞组分内发现的细胞器DNA。术语“植物”包括任意高等植物和其子代,包括单子叶植物(例如,玉米、稻、小麦、大麦,等等)、双子叶植物(例如,大豆、棉花、芸苔、番茄、马铃薯、拟南芥、烟草,等等)、裸子植物(松、冷杉、雪松等等),并且包括植物的部分,包括植物的繁殖单位(例如,种子、鳞茎、决茎、果实、花,等等)或者可以再生植物的其他部分或者组织。术语“种质”指可再生的活的材料,其含有遗传信息,如DNA,例如,活的材料可以是细胞、种子、花粉、胚珠或者无性繁殖体,如块茎和根茎。转基因种质含有本发明的嵌合DNA分子和种质中天然包含的额外的遗传信息。加入转基因可以极大提高种质的价值。
通常从含有本发明描述的嵌合DNA分子的转基因作物植物产生谷粒。谷粒可以用作食品或者动物饲料并且可被进一步加工以提供有用的材料,如纤维、蛋白质、油和淀粉。本发明的一方面是从含有本发明的嵌合cDNA分子的谷粒加工的材料。营养组织也可以加工成饲料或者食品,如果必要,可以从转基因种质加工的材料检测和分离本发明的DNA分子。DNA分子用作追踪食物系统中产物的标记。
导入植物细胞基因组中的本发明的多核苷酸因此可以以染色体方式整合或者定位于细胞器。通过将异源叶绿体转运肽(CTP)融合到EPSPS分子的N末端,产生嵌合多肽分子,可以将本发明的EPSPS靶向叶绿体。备选地,编码EPSPS的基因可以整合进叶绿体基因组,从而不需要叶绿体转运肽(美国专利6,271,444和6,492,578)。
通常,将转基因植物细胞再生成完整的转基因植物并且测定植物对草甘膦除草剂的耐受性。“耐受的”或者“耐受性”指试剂对植物的生长和发育,和产量的降低的效果,尤其指对草甘膦除草剂的植物毒性效果的耐受性。本文提供了这些嵌合DNA分子的构建、对EPSPS酶的草甘膦抗性的分析,和针对草甘膦耐受性对含有所述DNA分子的植物进行的分析。
“草甘膦”指N-膦酰基甲基甘氨酸和其盐,草甘膦是Roundup除草剂(Monsanto Co.)的活性成分。除非另外说明,用“草甘膦”处理植物指用Roundup或者Roundup Ultra除草剂制剂处理植物。作为N-膦酰基甲基甘氨酸和其盐(不是配制的Roundup除草剂)的草甘膦是下述合成培养基的组分,所述培养基用于选择草甘膦耐受性的细菌和植物或者用于在体外生物化学测定中确定酶抗性。草甘膦的商业制剂的例子包括,但不限于,Monsanto公司以ROUNDUP、ROUNDUPULTRA、ROUNDUPULTRAMAX、ROUNDUPWEATHERMAX、ROUNDUPCT、ROUNDUPEXTRA、ROUNDUPBIACTIVE、ROUNDUPBIOFORCE、RODEO、POLARIS、SPARK和ACCORD除草剂销售的那些制剂,它们都含有以其异丙基铵盐形式存在的草甘膦;由Monsanto公司以ROUNDUPDRY和RIVAL销售的那些制剂,它们含有以其铵盐形式存在的草甘膦;由Monsanto公司以ROUNDUPGEOFORCE销售的那些制剂,它含有以其钠盐形式存在的草甘膦;由Zeneca Limited以TOUCHDOWN销售的制剂,其含有以其三甲基锍盐形式存在的草甘膦。草甘膦除草剂制剂可以安全地以低至8盎司/英亩到64盎司/英亩的比率用于草甘膦耐受性植物的顶部以控制田间杂草。在实验中,草甘膦已经以低至4盎司/英亩到高达或者超过128盎司/英亩的比率应用于草甘膦耐受性植物而对作物植物没有实质性伤害。
已经分离了天然地耐受草甘膦抑制的EPSPS酶,它们已经鉴定为II类EPSPS酶(美国专利5,633,435)。II类酶与其他EPSPS酶不同处在于含有四个不同的肽基序。这些基序在美国专利5,633,435中鉴定为-G-D-K-X3-,其中X3为Ser或Thr,和-S-A-Q-X4-K-,其中X4为任意氨基酸,和R-X1-H-X2-E-,其中X1为不带电的极性或者酸性氨基酸,X2为Ser或Thr,和-N-X5-T-R-,其中X5为任意氨基酸。
本发明鉴定了一类新的草甘膦抗性EPSPS酶,其中包含编码所述草甘膦抗性EPSPS的多核苷酸的嵌合DNA分子是本发明的一方面,所述EPSPS包含如下序列结构域:基序,#1 X1-D-K-S(SEQ ID NO:1),其中X1 is G or A or S or P;motif#2 S-A-Q-X2-K(SEQ ID NO:2),其中X2为任意氨基酸;基序#3 R-X3-X4-X5-X6(SEQ ID NO:3),其中X3为D或N,X4为Y或H,X5为T或S,X6为R或E;基序#4 N-X7-X8-R(SEQ IDNO:4),其中X7为P或E或Q,X8为R或L.嵌合DNA分子可以还包含额外的编码多核苷酸序列(例如,编码额外蛋白质,如编码在与EPSPS编码序列相同的编码翻译读框中的叶绿体转运肽的核苷酸序列),和非编码的多核苷酸序列,如启动子分子、内含子、前导序列,和3’终止区。
已经开发了用于鉴定草甘膦抗性EPSPS酶的方法,其中在EPSPS蛋白质中鉴定了S-A-Q-X-K基序,其中X是任意氨基酸。对蛋白质序列集合,如Genbank(NIH基因序列数据库)中所含序列和在NCBI(National Center for Biotechnology Information)中发现的其他数据集合的生物信息学分析可以鉴定含有SAQXK基序的草甘膦抗性EPSPS酶。本发明的新的EPSPS类别的EPSPS酶具有额外的肽基序,其已被鉴定为与表1所示的定义II类EPSPS酶的肽基序不同。EPSPS的四种基序的进一步分析将草甘膦抗性EPSPS的新类别细分成三个亚类。第一亚类由来自苛养木杆菌(Xylella fastidiosa)(XYL202310,分别为SEQ ID NO:5和SEQ ID NO:19)和野油菜黄单胞菌(Xanthomonascampestris)(XAN202351,分别为SEQ ID NO:6和SEQ ID NO:20)的EPSPS多肽和多核苷酸序列代表。定义第一亚类的基序是GDKS;SAQX1K,其中X1为I或者V;RDYTR和NPRR。第二类由从Rhodopseudomonas palustris(RHO102346,分别为SEQ ID NO:7和SEQID NO:21),向磁磁螺菌(Magnetospirillum magnetotacticum)(Mag306428,SEQ ID NO:8和SEQ ID NO:22),和新月柄杆菌(Caulobacter crescentus)(Cau203563,分别为SEQ ED NO:9和SEQID NO:23)分离的EPSPS多肽和多核苷酸序列代表。定义第二亚类的基序是GDKS;SAQX1K,其中X1是I或V;RDHTR;NX2LR,其中X2是P或E。第三亚类由从Magnetococcus MC-I(Mag200715,分别为SEQ ID NO:10和SEQ ID NO:24),粪肠球菌(Enterococcus faecalis)(ENT219801,分别为SEQ ID NO:11和SEQ ID NO:25),粪肠球菌(EFA101510,分别为SEQ ID NO:12和SEQ ID NO:26),屎肠球菌(Enterococcus faecium)(EFM101480,分别为SEQ ID NO:13和SEQ IDNO:27),海栖热袍菌(Thermotoga maritime)(TM0345,分别为SEQ IDNO:14和SEQ ID NO:28),Aquifex aeolicus(AAE101069,分别为SEQID NO:15和SEQ ID NO:29),幽门螺旋杆菌(HelicobacterPylori)(HPY200976,分别为SEQ ID NO:16和SEQ ID NO:30),幽门螺旋杆菌(HP0401,分别为SEQ ID NO:17和SEQ ID NO:31),空肠弯曲杆菌(Campylobacter jejuni)(CJU10895,分别为SEQ ID NO:18和SEQ ID NO:32)分离的EPSPS多肽和多核苷酸代表。定义第三亚类的基序是X1DXS,其中X是A或者S或者P;SAQVK;RX2HTE,,其中X2是D或者N;NX3TR,其中X3是Q或者P。
表1.EPSPS多肽基序
SEQ ID NO: EPSPS 基序1 基序2 基序3 基序4
5,19 6,20 7,21 8,22 9,23 10,24 11,25 12,26 13,27 14,28 15,29 16,30 17,31 18,32XYL202310XAN202351RHO102346Mag306428Cau203563Mag200715ENT219801EFA101510EFM101480TM0345AAE101069HPY200976HP0401CJU10895II类EPSPS GDKS GDKS GDKS GDKS GDKS ADKS SDKS SDKS ADKS PDKS SDKS SDKS SDKS ADKS GDKX1 SAQIK SAQVK SAQIK SAQVK SAQVK SAQVK SAQVK SAQVK SAQVK SAQVK SAQVK SAQVK SAQVK SAQVK SAQX2K RDYTR RDYTR RDHTE RDHTE RDHTE RDHTE RDHTE RDHTE RNHTE RDHTE RDHTE RNHTE RNHTE RNHSE RX3HX4K NPRR NPRR NPLR NPLR NELR NPTR NQTR NQTR NPTR NPTR NPTR NPTR NPTR NPTR NX5TR
代表每个EPSPS亚类的DNA编码序列从由来源生物提取的基因组DNA分离。编码来自细菌来源生物的EPSPS的天然基因可以在本文中称作aroA基因或者EPSPS编码序列。分离方法涉及使用与靶DNA分子同源或者互补的DNA引物分子。通过称作聚合酶链式反应(PCR)的DNA扩增方法从基因组DNA分离靶DNA分子。该方法使用酶促技术产生靶多核苷酸的一条序列的多个拷贝,在本发明中,靶DNA分子编码草甘膦抗性EPSPS酶。该扩增方法基础是:温度改变以变性、然后再退火DNA引物分子、接着延伸以在侧翼DNA引物之间的区域中合成新的DNA链的多个循环。通常,通过本领域已知的多种多核苷酸扩增方法(包括PCR)中的任何方法完成DNA扩增。多种扩增方法是本领域已知的并且还被描述于美国专利号4,683,195和4,683,202和PCR Protocols:A Guide to Methods and Applications,ed.Innis et ah,Academic Press,San Diego,1990中。已经开发了PCR扩增方法用来扩增长达22kb(千碱基)的基因组DNA和长达42kb的噬菌体DNA(Cheng等人,Proc.Natl.Acad.Sci.USA 91:5695-5699,1994)。这些方法以及DNA扩增领域中已知的其他方法可以用于实施本发明。
本发明的核酸探针和引物在严格条件下与靶DNA序列杂交。杂交指核酸链通过碱基配对与互补链结合的能力。当两条核酸链中的互补序列相互结合时,发生杂交。核酸分子或者其片段能够在一定条件下与其他核酸分子特异杂交。如在本文中所用地,两种核酸分子如果能够形成反平行的、双链核酸结构,那么它们就被认为是能够相互特异杂交的。核酸分子如果与另一核酸分子显示出完全互补性,那么说它们是“互补的”。如在本文中所用地,当一个分子的每个核苷酸都与另一个分子的核苷酸互补时,那么说它们是“完全互补的”。当两个分子可以以足够允许它们至少在常规“低严格”条件下保持相互退火的稳定性相互杂交时,那么说这两个分子是“最小互补的”。类似地,如果分子以足够允许它们至少在常规“高严格”条件下保持相互退火的稳定性相互杂交以时,那么说这两个分子是“互补的”。常规的严格条件由Sambrook等人,1989,和Haymes等人,在:Nucleic AcidHybridization,A Practical Approach,IRL Press,Washington,DC(1985)中描述,本文中称为Sambrook等人,1989。因此,与完全互补性的偏离是允许的,只要此类偏离不完全排除分子形成双链结构的能力。为了将核酸分子用作引物或探针,仅需要它在序列上足够互补以能够在使用的特定溶剂和盐浓度下形成稳定的双链结构。
本文所用的“高度同源的DNA分子”是在高严格条件下能与它所比较的多核苷酸互补体特异杂交的多核苷酸分子。术语“严格条件”由Sambrook等人,1989,在9.52-9.55中讨论的特异杂交步骤关于核酸探针与靶核酸(即,特定目的核酸序列)的杂交进行功能上的定义。也参见Sambrook等人,1989,9.47-9.52,9.56-9.58;Kanehisa,(Nucl.Acids Res.12:203-213,1984);和Wetmur和Davidson,(J.MoI.Biol.31:349-370,1988)。因此,可以使用本发明的核苷酸序列,因为它们能够与DNA片段的互补序列段选择性形成二体分子。取决于设想的应用,可以使用不同杂交条件来实现探针对靶序列的不同程度的选择性。对于需要高选择性的应用,将通常希望使用相对高的严格条件来形成杂交体,例如,将选择相对的低盐和/或高温条件,如在约0.02M到约0.15M NaCl,约50℃到约70℃的温度下所提供的条件。高严格条件为例如用高严格性洗涤缓冲液(0.2X SSC,0.1%SDS,65℃)洗涤杂交滤器(filter)至少两次。促进DNA杂交的合适的中等严格条件(如约45℃下6.0x氯化钠/柠檬酸钠(SSC),然后在50℃下用2.0x SSC洗涤)是本领域技术人员已知的或者可以在Current Protocols inMolecular Biology,John Wiley & Sons,N.Y.(1989),6.3.1-6.3.6中找到。此外,洗涤步骤中的盐浓度可以选自50℃下约2.0x SSC的低严格性到50℃下约0.2x SSC的高严格性。此外,洗涤步骤中的温度可以从室温,约22℃的低严格条件增加到约65℃的高严格条件。温度和盐都可以改变,或者温度或者盐浓度中任意一种可以保持恒定,而另一种变量改变。此类选择性条件很少能忍受探针和模板或者靶标链之间的错配。通过杂交来检测DNA序列是本领域技术人员公知的,并且美国专利号4,965,188和5,176,995的教导是杂交分析方法的示例性方法。本发明提供了鉴定转基因的草甘膦耐受性植物种子的方法,其包括步骤:a)从种子分离基因组DNA;和b)将DNA探针或者引物分子与基因组DNA杂交,其中DNA探针或者引物分子与选自SEQ ID NO:19-32和33-37组成的组的DNA序列的部分同源或者互补;和c)检测杂交产物。该方法可以用于DNA检测试剂盒,该试剂盒是使用本文公开的组合物和DNA检测领域公知的方法开发的。
本发明的EPSPS编码多核苷酸分子由核苷酸序列定义,其在本文用来表示核苷酸的线性排列以形成作为个别的单链或者二体中的多核酸分子的正义和互补链的多核苷酸。本文所用的术语“编码序列”和“编码多核苷酸分子”指当置于合适的调节分子控制下时翻译成多肽(通常通过mRNA)的多核苷酸分子。编码序列的边界由5’-末端的翻译起始密码子和3’-末端的翻译终止密码子决定。编码序列可以包括,但不限于,基因组DNA、cDNA和嵌合的多核苷酸分子。编码序列可以是人工DNA。本文所用的人工DNA是指非天然发生的DNA多核苷酸。可以通过多种方法设计人工DNA分子,所述方法为例如本领域已知的方法,所述方法基于替代第一个多核苷酸的密码子以产生等同的或者甚至改进的第二代人工多核苷酸,其中该新的人工多核苷酸用于在转基因植物中增强表达。设计方面通常使用密码子选择表,该表通过对从植物、植物型、科或者属分离的编码序列集合中密码子的发生频率编辑得到。其他设计方面包括减少多聚腺苷酸化信号、内含子剪接位点或者序列的长AT或者GC序列的发生频率(美国专利5,500,365)。全长编码序列或者其片段可以使用本领域技术人员已知的方法由人工DNA制备。
在本发明的特定实施方案中,人工DNA编码草甘膦抗性EPSPS的多肽,例如,使用WO04009761中描述的多种密码子选择表和方法构建本发明的人工DNA分子,如Tm.aroA.nno-Gm(SEQ ED NO:33)、Cc.aroA.nno-At(SEQ ID NO:34)、Xc.aroA.nno-At(SEQ ID NO:35)、Cc.aroA.nno-mono(SEQ ED NO:36)、Xc.aroA.nno-mono(SEQ ID NO:37),预期它们可用于下面的至少一种:赋予转化的植物细胞或者转基因植物中草甘膦耐受性,提高植物中草甘膦抗性酶的表达,和用作选择性标记将其他目的性状引入植物。
编码本发明的草甘膦抗性EPSPS多肽的多核酸分子可以与其他非天然的或者“异源”多核苷酸序列以多种方式组合。“异源的”序列是指任何在自然中没有发现与编码本发明的多肽的多核苷酸序列连接的序列。尤其有兴趣的是连接的多种遗传调节分子,它们用以提供EPSPS多肽在细菌或者植物细胞中的表达。
异源遗传调节分子是本发明的多核酸分子的组分,并且当可操作地连接时提供转基因,所述组分包括位于多核苷酸序列上游(5’非编码序列)、内部或者下游(3’非翻译序列)的多核苷酸分子,并且影响相关多核苷酸序列的转录、RNA加工或者稳定性,或者翻译。调节分子可以包括,但不限于启动子、翻译前导序列(例如,美国专利号5,659,122)、内含子(例如,美国专利号5,424,412),和转录终止区。
在一个实施方案中,本发明的嵌合DNA分子可以含有导致EPSPS多肽过表达的启动子,其中“过表达”指通常不存在于该宿主细胞中的多肽的表达,或者存在于所述宿主细胞中的多肽以高于编码该多肽的内源基因通常的表达水平的水平表达。可以导致本发明的多肽过表达的启动子,是本领域中公知的,例如,植物病毒启动子(P-CaMV35S,美国专利号5,352,605;P-FMV35S,美国专利号5,378,619和5,018,100),或者两种的嵌合组合(例如,美国专利号6,660,911)。
本发明的DNA构建体的启动子的表达水平或者模式可被修饰以增强其表达。可以用本领域技术人员已知的方法向基因的5’序列插入增强元件(例如,CaMV35S启动子的亚结构域,Benfey等人,EMBO J.9:1677-1684,1990)。在一个实施方案中,可以加入增强元件以产生下述启动子,其包括本发明的基因的天然启动子的时间和空间表达,但是具有数量上更高水平的表达。类似地,通过用已确定特异激活或者抑制基因表达的元件(例如,花粉特异的元件,Eyal等人,1995 Plant Cell7:373-384)修饰启动子的5’区,可以完成启动子的组织特异性表达。术语“启动子序列”或者“启动子”指下述多核苷酸序列,当以顺式于编码多肽的结构多核苷酸序列定位时,能通过指导编码多肽的一种或多种mRNA分子表达的方式发挥功能。此类启动子区通常在多肽编码区的起始位点三核苷酸ATT的上游发现。启动子分子还可以包括这样的DNA序列,从所述DNA序列发生非编码RNA分子的转录,如启动反义RNA、转移RNA(tRNA)或者核糖体RNA(rRNA)序列的转录。转录涉及代表DNA二体的一条链的RNA链的合成。转录终止反应所需的DNA的序列称作3’转录终止区。
优选地,所选的特定启动子应当能够导致足够表达以导致产生有效量的本发明的EPSPS酶,使得植物细胞耐受草甘膦。除了已知导致植物细胞中DNA转录的启动子外,还可以鉴定用于本发明的其他启动子,所述鉴定通过筛选植物cDNA文库中选择性或者优选在靶组织中表达的基因然后从基因组DNA文库确定启动子区来进行。
认识到可以用于本发明的额外的启动子描述于例如美国专利号6,660,911;5,378,619;5,391,725;5,428,147;5,447,858;5,608,144;5,608,144;5,614,399;5,633,441;5,633,435;和4,633,436。还应认识到调节序列的精确边界不能被完全界定,并且不同长度的DNA片段可以具有相同的启动子活性。除了本文描述的启动子外,本领域技术人员可以鉴定出在本发明中起作用以提供草甘膦耐受性EPSPS酶在植物细胞中的表达的启动子。
翻译前导序列是位于基因的启动子序列和编码序列之间的DNA遗传元件。翻译前导序列存在于翻译起始序列上游的完全加工的mRNA中。翻译前导序列可以影响初始转录物向mRNA的加工、mRNA稳定性或翻译效率。翻译前导序列的实例包括玉米和牵牛花热休克蛋白前导序列(美国专利号5,362,865),植物病毒外壳蛋白前导序列、植物核酮糖二磷酸羧化酶-加氧酶前导序列,等等(Turner和Foster,Molecular Biotechnology 3:225,1995)。
转运肽一般指当连接到目的蛋白质时将该蛋白质导向特定组织、细胞、亚细胞位置或者细胞器的肽分子。例子包括,但不限于,叶绿体转运肽、核靶定信号,和液泡信号。叶绿体转运肽尤其可用于本发明以将EPSPS酶的表达导向叶绿体。叶绿体转运肽(CTP)也称作转运信号(TS-),其可被工程化以融合到将靶向的植物叶绿体的蛋白质的N末端。许多定位于叶绿体的蛋白质从核基因作为前体表达并且通过CTP靶向叶绿体,CTP在输出步骤中被除去。叶绿体蛋白质的例子包括核酮糖-1,5-二磷酸羧化酶的小亚基(RbcS2)、铁氧还蛋白、铁氧还蛋白氧化还原酶、集光复合体蛋白I和蛋白II,和硫氧还蛋白II。已经在体内和体外证明通过使用与CTP的蛋白质融合可以将非叶绿体蛋白质靶向叶绿体,并且CTP足以将蛋白质靶向叶绿体。合适的叶绿体转运肽,如拟南芥(Arabidopsis thaliana)EPSPS CTP(Klee等人,MoI.Gen.Genet.210:437-442,1987)和Petunia hybrida EPSPS CTP(della-Cioppa等人,Proc.Natl.Acad.Sci.USA 83:6873-6877,1986)的掺入已经表明能将异源蛋白质靶向转基因植物中的叶绿体。已经表明本发明的小麦GBSS(颗粒结合的淀粉合酶)CTP(TS-Ta.Wxy,SEQ IDNO:38)在所希望的氨基酸位点的加工中提供了出乎预料的高度精确性。例如,其中小麦GBSS CTP与CP4 EPSPS(SEQ ID NO:39)或者Xc EPSPS(SEQ ID NO:40)或者Cc EPSPS(SEQ ID NO:41)融合的多肽分子是本发明的一方面。本领域技术人员将认识到可以制备多种嵌合构建体,其利用特定CTP将异源EPSPS输出到植物细胞叶绿体的功能性。此外,分离的小麦GBSS CTP可以可操作地连接农学上重要的异源编码序列,以提供所述多肽向植物叶绿体的转运和导致转运肽加工的高度精确性。从输出到叶绿体受益的农学上重要的蛋白质是在植物细胞质中不稳定或者当存在于细胞质中时对植物细胞有毒的蛋白质。
3’非翻译区或者3’转录终止区指连接到结构多核苷酸分子或者位于其下游的DNA分子,其包括提供多腺苷酸化信号和其他能够影响转录、mRNA加工或者基因表达的调节信号的多核苷酸。多腺苷酸化信号在植物中发挥功能,导致在mRNA前体的3’末端加入多腺苷酸化核苷酸。多腺苷酸化序列可以来自天然基因、来自多种植物基因,或者来自T-DNA基因。3’转录终止区的例子是胭脂碱合成酶3’区(nos 3′;Fraley等人,Proc.Natl.Acad.Sci.USA 80:4803-4807,1983)。Ingelbrecht等人,(Plant Cell 1:671-680,1989)举例说明了不同3’非翻译区的用途。
本文中所用的重组DNA技术中的实验步骤是本领域公知的和通常使用的。标准技术用于克隆、DNA和RNA分离、扩增和纯化。根据生产商的说明书进行涉及DNA连接酶、DNA聚合酶、限制性内切酶等等的酶促反应。这些技术和多种其他技术通常根据Sambrook等人,(1989)进行。
用于产生草甘膦抗性细胞的EPSPS酶的酶促动力学需要展示出足够的底物结合活性(Km PEP)和对草甘膦抑制的足够抗性(Ki glyp)以在草甘膦存在下有效发挥功能。可以针对展示出对草甘膦抑制的足够抗性在体外检测EPSPS酶。该检测法用于针对在草甘膦存在下时的功能性来筛选EPSPS酶。当确定用于工程化植物以得到草甘膦耐受性的酶的功用时,应该考虑Km PEP和Ki glyp的绝对水平和低Km PEP和高Ki glyp之间的比率。
植物重组DNA构建体和转化的植物
转基因作物植物含有插入作物植物细胞的基因组的外源多核苷酸分子。作物植物细胞包括但不限于植物细胞,还包括悬浮培养物、胚、分生组织区、愈伤组织、叶、根、嫩枝、配子体、孢子体、胚珠、花粉和小孢子,和种子和果实。“外源的”是指多核苷酸分子来自植物的外面并且该多核苷酸分子插入植物细胞的基因组中。外源多核苷酸分子可以具有天然发生的或者非天然发生的多核苷酸序列。本领域技术人员理解外源多核苷酸分子可以是来自与该多核苷酸分子所导入的植物不同的生物或者可以是来自与该多核苷酸分子所导入的植物相同的植物物种的多核苷酸分子。当在转基因植物中表达时该外源多核苷酸可以提供农学上重要的性状。
本发明提供了用于产生耐受草甘膦的转基因植物作物的嵌合DNA分子。本领域技术人员公知的方法可以用于制备本发明的嵌合DNA分子。这些方法包括体外重组DNA技术、合成技术,和体内遗传重组。例如,Sambrook等人,(1989)中描述的技术。所述方法产生的外源多核苷酸分子可以通过农杆菌介导的转化或者植物转化领域技术人员已知的其他方法转移进作物植物细胞。
将本发明的嵌合DNA分子插入DNA构建体以繁殖和转化植物细胞。DNA构建体通常是双Ti质粒边界DNA构建体,其具有从根癌土壤杆菌(Agrobacterium tumefaciens)分离的包含T-DNA的Ti质粒的右边界(RB或者AGRtu.RB)和左边界(LB或AGRtu.LB)区,其与土壤杆菌细胞提供的转移分子允许T-DNA整合到植物细胞的基因组中。DNA构建体还含有载体骨架DNA节段(segment),其提供细菌细胞中的复制功能和抗体选择,例如,大肠杆菌复制起点,如ori322,宽宿主范围复制起点,如oriV或者oriRi,和选择标记的编码区,如Spec/Strp,其编码Tn7氨基糖苷腺苷酰转移酶(aadA),其赋予对大观霉素(spectinomycin)或者链霉素的抗性,或者庆大霉素(Gm,Gent)选择标记基因。对于植物转化而言,宿主细菌菌株通常是根癌土壤杆菌ABI、C58或者LB A4404,然而,植物转化领域技术人员已知的其他菌株也可以在本发明中起作用。
在本发明的优选实施方案中,将产生表达草甘膦抗性EPSPS的转基因植物。用于将编码EPSPS酶的多核苷酸序列导入植物细胞的多种方法是本领域技术人员已知的并且包括,但不限于:(1)物理方法,如微注射、电穿孔,和微粒介导的递送(Biolistics或者基因枪技术);(2)病毒介导的递送方法;和(3)土壤杆菌介导的转化方法。
用于转化植物细胞的最常用方法是:土壤杆菌介导的DNA转移方法和Biolistics或者微粒轰击介导的方法(如,基因枪)。通常,希望使用核转化,但是当希望特异性转化质体,如叶绿体或者造粉体(amyloplast)时,可以利用所希望的多核苷酸的微粒介导的递送转化植物质体。
土壤杆菌介导的植物基因转化涉及几个步骤。第一步通常称作“接种”,其中将毒性土壤杆菌和植物细胞首先相互接触。接种后,在适于生长和T-DNA转移的条件下,将土壤杆菌和植物细胞/组织一起生长几小时到几天或者更长时间。该步骤称作“共培养”。共培养和T-DNA递送后,用杀细菌剂或者抑菌剂处理植物细胞,以杀死保持与外植体接触和/或保持在含有外植体的容器中的土壤杆菌。如果在不存在促进转基因植物细胞较之非转基因植物细胞优先生长的选择试剂的存在下进行所述处理,那么这通常称作“延迟”步骤。如果在有利于转基因植物细胞的选择压力存在下进行,那么所述处理称作“选择”步骤。当使用“延迟”时,其通常伴随着一个或多个“选择”步骤。
关于微粒轰击(美国专利号5,550,318;美国专利号5,538,880;美国专利号5,610,042),将微粒用核酸包被并通过推进力递送到细胞。示例性微粒包括由钨、铂,和优选金组成的那些微粒。通过加速将DNA递送到植物细胞的方法的阐明性实施方案是Biolistics Particle DeliverySystem(BioRad,Hercules,CA),其可以用于推进用DNA包被的微粒或者细胞通过屏障,如不锈钢或者Nytex屏障,到达用悬浮培养的单子叶植物细胞覆盖的滤器表面。
从多种转化的外植体再生、发育和培养植物在本领域详细记载。该再生和生长方法通常包括选择所转化的细胞并培养那些个体化的细胞经历胚发育的通常阶段到生根的小植株阶段。转基因胚和种子类似地再生。之后将得到的转基因生根的幼苗植入合适的植物生长培养基,如土壤中。暴露于选择剂后存活的细胞,或者在筛选测定中为阳性的细胞可以在维持植物再生的培养基中培养。将正发育的小植株转移到土壤较少的植物生长混合物中,并使幼苗受冷而变得耐寒,之后转移到温室或者生长室用于成熟。
本发明的嵌合DNA分子可以用于任何可转化的细胞或者组织。本文所用的可转化的是指能够进一步繁殖得到植物的细胞或者组织。本领域技术人员将理解许多植物细胞或组织是可转化的,其中在插入外源DNA后在合适的培养条件下,植物细胞或者组织可以形成分化的植物。适于这些目的组织可以包括但不限于未成熟的胚、盾片组织、悬浮细胞培养物、未成熟的花序、芽分生组织、结节外植体、愈伤组织、下胚轴组织、子叶、根和叶。
可以使得含有本发明的嵌合DNA分子的植物包括,但不限于,洋槐、苜蓿、大麦、豆、甜菜、黑莓、蓝莓、花茎甘蓝、抱子甘蓝、卷心菜、芸苔、香瓜、胡萝卜、木薯、花椰菜、芹菜、樱桃、芫荽、柑桔、金钱橘、咖啡、玉米、棉花、黄瓜、Douglas冷杉、茄子、菊苣、宽叶莴苣、桉树、茴香、无花果、林木、葫芦、葡萄、葡萄柚、蜜汁、豆薯、猕猴桃、莴苣、韭、柠檬、酸柚、火炬松、芒果、甜瓜、蘑菇、坚果、燕麦、秋葵、洋葱、桔子、观赏植物、木瓜、欧芹、豌豆、桃、花生、梨、胡椒、柿、松、菠萝、车前草、李子、石榴、白杨、马铃薯、西葫芦、柑橘、辐射松、紫蒿苣(radicchio)、萝卜、覆盆子、稻、黑麦、高梁、南方松、大豆、菠菜、南瓜、草莓、甜菜、甘蔗、向日葵、红薯、苏合香、红橘、茶、烟草、番茄、草皮、藤、西瓜、小麦、山药和夏南瓜。
提供下面的实施例以更好地阐明本发明的实施并且这些实施例决不应以任何方式该解释为对本发明范围的限制。本领域技术人员将理解可以对本文描述的方法和基因进行多种修改、增加、替换、删减等等而不背离本发明的精神和范围。除非另外指出,将根据相关领域技术人员惯用用法理解本文的术语。分子生物学中常用数据的定义可以见Rieger等人,Glossary of Genetics:Classical and Molecular,5thedition,Springe- Verlag:New York,(1991);和Lewin,Genes V,Oxford University Press:New York,(1994)。使用在37 CFR[section]1.822中给出的关于DNA的术语。使用氨基酸残基的单字母和三字母命名。
实施例
实施例1
分离EPSPS DNA编码序列
从美国典型培养物保藏中心(ATCC)(American Type CultureCollection(ATCC),Manassas,VA)得到Thermatoga maritima(Tm)(保藏号43589D)基因组DNA。基因组DNA用作PCR(High Fidelity PCR试剂盒,Roche,Indianapolis,IN)中的模板,使用DNA引物来扩增TmEPSPS编码序列。基于T.maritima EPSPS多核苷酸序列(Genbank#Q9WYI0)的多核苷酸序列设计DNA引物。PCR设置为在如下2X50μL(微升)反应液中进行:dH2O 80μL;10mM dNTP 2μL;10X缓冲液10μL;基因组DNA(50ng,纳克)μL;Tm EPSPS 5′引物(SEQ ID NO:42)(10μM)3μL;Tm EPSPS 3′引物(SEQ ID NO:43)(10μM)3μL;酶1μM。在MJ Research PTC-200热循环仪(MJ Research,Waltham,MA)上使用下面的程序进行PCR:步骤194℃3分钟,步骤294℃20秒;步骤354℃20秒;步骤468℃20秒;步骤5转向步骤2,30次;步骤6结束。用QIAquick Gel Extraction试剂盒(Qiagen Corp.,Valencia,CA)纯化PCR产物。用NdeI和PvuI消化所纯化的产物并使用Roche Rapid Ligation试剂盒通过连接插入质粒载体pET19b(Novagen,Madison,WI)中。使用生产商(Stratagene Corp,La Jolla,CA)提供的方法将连接产物转化到感受态大肠杆菌DH5α中。通过QIAprepSpin Miniprep试剂盒(Qiagen Corp.Valencia,CA)从转化的大肠杆菌纯化pMON58454(图1)质粒DNA,并通过限制酶分析验证插入片段。从独立克隆产生Tm EPSPS天然(nat)编码序列的DNA序列(CR-Tm.aroA-nat,SEQ ID NO:28)并通过标准DNA测序方法验证。使用生产商提供的方法,将含有His-Tag验证过的Tm.aroA插入片段的pMON58454质粒DNA转化进BL21(DE3)pLysS菌株(Stratagene,LaJolla,CA),用于蛋白质表达和纯化。
从ATCC得到新月柄杆菌(Cc)的基因组DNA。该基因组DNA用作PCR中的模板以扩增Cc EPSPS编码序列。基于编码新月柄杆菌EPSPS(Genbank#AE006017)的编码序列设计PCR的寡核苷酸引物。在引物的5’-末端掺入限制性内切酶识别位点以方便克隆。从Roche购买Long Temp PCR试剂盒(目录号1681834)。PCR设置为在如下50μL反应液中进行:dH2O 40μL;2mM dNTP 1μL;10X缓冲液5μL;DNA 1μL(200-300ng);Cc oligo-for(SEQ ID NO:44)1μL;Cc oligo-rev(SEQ ID NO:45)1μL;taq mix 1μL。在MJ Research PTC-200热循环仪上使用下面的程序进行PCR:步骤1 94℃3分钟,步骤2 94℃20秒;步骤3 62℃30秒;步骤4 68℃94秒;步骤5转向步骤2,30次;步骤6结束。从基因组DNA扩增出~1.3kb预期大小的片段。用Qiagen GelPurification试剂盒(目录号28104)纯化PCR片段。用限制酶NdeI和XhoI消化所纯化的PCR片段,并通过连接到用相同酶消化的质粒pET19b(Novagen)将其插入。按照生产商的使用说明,用连接混合物用去转化感受态大肠杆菌菌株DH5α(Invitrogen,Carlsbad,CA)。将转化细胞涂布到含有终浓度为0.1mg/mL的羧苄青霉素的培养皿中。然后将培养皿在37℃培养过夜。第二天挑选单个菌落并用于接种含有0.1mg/mL氨苄青霉素的3mL液体培养基。液体培养物在37℃以250转/分钟(rpm)搅拌下培养过夜。用Qiagen miniprep试剂盒(目录号27160)从1mL液体培养物制备质粒DNA。将DNA用50μL去离子水洗脱。从独立克隆产生Cc EPSPS天然(nat)编码序列(CR-CAUcr.aroA-nat,SEQ ID NO:23)的DNA序列并通过标准DNA测序方法验证。使用生产商提供的方法,将从经验证克隆得到的pMON42488(图2)质粒转化进BL21(DE3)pLysS菌株,用于蛋白质表达和纯化。
从ATCC得到野油菜黄单胞菌(Xc)(ATCC#33913D)的基因组DNA。该基因组DNA用作PCR中的模板以扩增Xc EPSPS编码序列。基于编码野油菜黄单胞菌EPSPS(Genbank#XAN202351)的编码序列设计PCR的寡核苷酸引物。在引物的5’-末端掺入限制性内切核酸酶识别位点以方便克隆。从Invitrogen购买SuperMix High Fidelity PCR试剂盒(目录号10790-020)。PCR设置为在如下50μL反应液中进行:SuperMix缓冲液45μL;DNA 1μL(75-200ng);10μM Xabcp-AIF(SEQID NO:46)1μL;10μM Xancp-AIR(SEQ ID NO:47)1μL。在MJResearch PTC-200热循环仪上使用下面的程序进行PCR:步骤1 94℃2分钟,步骤2 94℃20秒;步骤3 56℃30秒;步骤4 68℃1分钟40秒;步骤5转向步骤2,30次;步骤6结束。从基因组DNA扩增出~1.3kb预期大小的片段。将4μL PCR反应液中的PCR片段插入Invitrogen的Zero Blunt TOPO载体(目录#K2800-20)并转化进大肠杆菌菌株DH5α(Invitrogen)。第二天挑选单个菌落并用于接种含有0.5mg/mL卡那霉素的3mL液体培养基。液体培养物在37℃以250转/分钟(rpm)搅拌下培养过夜。用Qiagen miniprep试剂盒(目录号27160)从1mL液体培养物制备质粒DNA。将DNA用50μL去离子水洗脱。通过标准DNA测序方法对19个独立克隆的完整编码区(CR-)进行测序并验证。然后用限制酶NdeI和XhoI消化具有经证实序列(CR-Xc.aroA-nat,SEQ IDNO:20)的TOPO载体的PCR片段,并通过连接到用相同酶消化的质粒pET19b(Novagen)将其插入。按照生产商的使用说明,将来自经证实的克隆的pMON58477(图3)质粒DNA转化进BL21(DE3)pLysS菌株,用于蛋白质表达和纯化。
从ATCC得到空肠弯曲杆菌(Cj)(#700819D)的基因组DNA。使用基于PCR的DNA扩增方法和DNA引物分离EPSPS编码序列。使用来自Roche的High Fidelity PCR试剂盒。基于空肠弯曲杆菌EPSPS编码序列(Genbank#CJU10895)的公开序列设计引物。PCR设置为在如下2×50μL反应液中进行:dH2O 80μL;10mM dNTP 2μL;10X缓冲液10uL;基因组空肠弯曲杆菌DNA(50ng)μL;CampyEPSPS 5’引物(SEQ ID NO:48)(10μM)3μL;CampyEPSPS 3′引物(SEQ ID NO:49)(10μM)3μL;酶1μL。在MJ Research PTC-200热循环仪上使用下面的程序进行PCR:步骤1 94℃3分钟,步骤2 94℃20秒;步骤3 54℃20秒;步骤4 68℃20秒;步骤5转向步骤2,30次;步骤6结束。用QIAquick Gel Extraction试剂盒(Qiagen Corp.)纯化PCR产物。用NdeI和PvuI消化所纯化的PCR产物,并使用Roche Rapid Ligation试剂盒通过连接到质粒载体pET19b(Novagen)将其插入。用连接混合物转化感受态大肠杆菌菌株DH5α(Invitrogen,Carlsbad,CA)。通过QIAprep Spin Miniprep试剂盒(Qiagen Corp)从转化的大肠杆菌纯化pMON76553(图4)质粒DNA,并通过限制酶分析证实插入片段。从独立克隆产生Cj EPSPS天然编码序列的DNA序列(CR-Cj.aroA-nat,SEQ ID NO:32)并通过标准DNA测序方法验证。将来自经验证的克隆的pMON76553(图4)质粒DNA转化进BL21(DE3)pLysS菌株用于蛋白质表达和纯化。
从ATCC得到幽门螺旋杆菌(Hp)(保藏号#700392D)的基因组DNA。使用基于PCR的DNA扩增方法和DNA引物分离EPSPS编码序列,所述引物是从Genbank#HP0401中发现的EPSPS的DNA序列设计的。使用来自Roche的High Fidelity PCR试剂盒和关于幽门螺旋杆菌EPSPS编码序列的分离所描述的PCR条件。使用的DNA引物为HelpyEPSPS 5′(SEQ ID NO:50)和HelpyEPSPS 3′(SEQ ED NO:51)。用NdeI和PvuI消化所纯化的PCR产物,并使用Roche RapidLigation试剂盒通过连接到质粒载体pET19b(Novagen)将其插入。连接产物转化进感受态大肠杆菌DH5α(Invitrogen)中。通过QIAprepSpin Miniprep试剂盒(Qiagen Corp)从转化的大肠杆菌纯化pMON58453(图5)质粒DNA,并通过限制酶分析证实插入片段。从独立克隆产生Hp EPSPS天然编码序列的DNA序列(CR-Helpy.aroA-nat,SEQ ID NO:31)并通过标准DNA测序方法验证。将来自经验证的克隆的pMON58453质粒DNA转化进BL21(DE3)pLysS菌株用于蛋白质表达和纯化。
实施例2
EPSPS酶表达和活性测定
含有EPSPS编码序列的质粒DNA(图1pMON58454,T.maritimaEPSPS(CR-Tm.aroA-nat);图2.pMON42488,新月柄杆菌EPSPS(CR-CAUcr.aroA.nat);图3.pMON58477,X.campestris EPSPS(CR-Xc.aroA.nat);图4.pMON76553,空肠弯曲杆菌EPSPS(CR-Cj.aroA-n at);图5.pMON58453幽门螺旋杆菌EPSPS(CR-Helpy.aroA-nat);图6.pMON21104根癌土壤杆菌CP4 EPSPS(CR-AGRtu.aroA-CP4.nno),和图7.pMON70461玉米EPSPS(CR-Zm.EPSPS))被包含在BL21trxB(DE3)pLysS菌株中用于蛋白质表达和纯化。
从含有EPSPS酶的编码序列的嵌合DNA分子表达EPSPS蛋白质并使用pET系统手册第九版(Novagen)中描述的方案部分纯化所述蛋白质。将单个菌落或者几微升(μL)甘油原种接种进4ml(毫升)含有0.1mg/mL(毫克/毫升)羧苄青霉素的Luria Broth(LB)培养基。培养物在37℃摇动下培育4小时。将培养物在4℃保存过夜。第二天早晨,1ml过夜培养物用于接种含有0.1mg/mL羧苄青霉素的100mL新鲜的LB培养基。培养物在37℃下摇动培养4-5小时,然后将培养物置于4℃5-10分钟。然后用IPTG(NAME,1mM终浓度)诱导培养物并在30℃下摇动培养4小时,或者在20℃下摇动培养过夜。通过以7000rpm(转/分钟)在4℃离心20分钟收获细胞。除去上清液并将细胞在-70℃冷冻备用。通过将细胞沉淀物重悬浮在BugBuster试剂(Novagen)(使用5mL试剂/g细胞)中来提取蛋白质。向重悬浮物加入Benzonase(125单位,Novagen),并将细胞悬浮物在旋转混合器上室温下培养20分钟。通过以10,000rpm室温下离心20分钟除去细胞碎屑。使上清液穿过0.45μm(微米)注射器端滤器并转移到新管。用10mL 5mM咪唑,0.5M NaCl,20mM Tris-HCl pH 7.9(1X结合缓冲液)平衡含有1.25mL His-Bind树脂的预装柱。向柱中装载制备的细胞提取物。细胞提取物排出后,用10mL 1X结合缓冲液洗柱,然后用10mL 60mM咪唑,0.5M NaCl,20mM Tris-HCl pH 7.9(1X洗涤缓冲液)洗。用5mL 1M咪唑,0.5MNaCl,20mM Tris-HCl pH 7.9(1X洗脱缓冲液)洗脱蛋白质。最后,将蛋白质对50mM Tris-HCl pH 6.8透析。用Ultrafree离心装置将所得蛋白质溶液(Biomax-10K MW截断,Millipore Corp.,Beverly,MA)浓缩为~0.1-0.4mL。将蛋白质用50mM Tris pH 6.8稀释到10mg/mL和1mg/mL,加入30%终浓度的甘油并保存于-20℃。用Bio-Rad蛋白质测定法(Bio-Rad Laboratories,Hercules,CA)测定蛋白质浓度。用BSA产生标准曲线1-5μg(微克)。将样品(10μL)加入96孔板的孔中并与200μL Bio-Rad蛋白质测定试剂(1份浓缩的染料试剂:4份水)混合。~5分钟后用SpectraMAX 250平板读数器(Molecular DevicesCorporation,Sunnyvale,CA)在OD595对样品读数并与标准曲线比较。
EPSPS酶试验含有50mM K+-HEPES pH 7.0和1mM莽草酸-3-磷酸(测定混合物)。通过将待测混合物(30μL)与酶(10μL)和不同浓度的[14C]PEP以50μL总体积进行温育来测定Km-PEP。用50μL 90%乙醇/0.1M乙酸pH 4.5(淬灭溶液)在不同时间后淬灭反应。以14,000rpm离心样品并通过HPLC分析14C-EPSP的产生。通过HPLC放射测定法测定14C-PEP向14C-EPSP的转化率百分数,该测定使用AX100弱阴离子交换HPLC柱(4.6×250mm,SynChropak),将0.26M无梯度磷酸钾洗脱液(pH6.5)以1mL/min与Ultima-Flo AP混合物以3mL/min(Packard)混合。将每单位时间的部分转换乘以底物的最初浓度来计算初速度。
将待测混合物(30μL)与和不与草甘膦和14C-PEP(10μL,2.6mM)温育来测定抑制常数(Ki)。加入酶(10μL)开始反应。2分钟后用淬灭溶液淬灭测定。样品以14,000rpm离心并按上文所述来测定14C-PEP向14C-EPSP的转化率。使用GraFit软件(Erithacus Software,UK)分析稳态和IC50数据。使用等式Ki=[IC]50/(1+[S]/Km)从IC50值计算Ki值。进行测定,使得14C-PEP向14C-EPSP转换<30%。在这些测定中,牛血清白蛋白(BSA)和磷酸烯醇丙酮酸获得自Sigma。磷酸烯醇-[1-14C]丙酮酸(29mCi/mmol)获得自Amersham Corp.,Piscataway,NJ。
在表2中显示了EPSPS酶分析的结果。将本发明的EPSPS酶的动力学参数与II类CP4 EPSPS和I类野生型玉米EPSPS(WT玉米)比较。所有EPSPS酶都具有等于或者好于内源WT玉米酶的Km-PEP,并且所有都相对于该I类酶抗草甘膦。此外,一些EPSPS酶的低Km-PEP可以用于增强莽草酸生物合成途径中的底物的通量,从而提供途径中产物的增加。
表2.EPSPS稳态动力学参数
酶* Km-PEP(μM) Ki(μM) Ki/Km
CP4 EPSPS新月柄杆菌(SEQ IN NO:9)海栖热袍菌(SEQ ID NO:14)幽门螺旋杆菌(SEQ IN NO:17)空肠弯曲杆菌(SEQ IN NO:18)野油菜黄单胞菌(SEQ ID NO:6)WT玉米 14.4 2.0 1.4 2.1 7.4 27.6 27 5100 140.6 900 12.9 22.4 2500 0.5 354.2 70.3 643 6.1 3.0 90.6 0.02
实施例3 植物嵌合DNA构建体
将编码本发明的EPSPS蛋白质的DNA分子制成植物表达DNA构建体以转化到植物细胞。例如,嵌合DNA构建体:pMON81523(图8)和pMON81524(图9)含有植物表达盒,其包含调节元件:启动子分子、前导分子(L-At.Act7,拟南芥Act7前导DNA分子)和内含子分子(I-At.Act7,拟南芥Act7内含子DNA分子),其在植物中发挥功能以提供连接3’转录终止区的可操作地连接的嵌合CTP-EPSPS编码序列的足够表达。嵌合TS-At.ShkG-CTP2-Cc.aroA.nno-At DNA分子包含在pMON81523的NcoI/KpnI DNA片段中。TS-At.ShkG-CTP2 DNA分子编码从拟南芥ShkG基因分离的转运信号(TS),也称作At.CTP2(Klee等人,MoI.Gen.Genet.210:47442,1987)。Cc.aroA.nno-At是编码新月柄杆菌EPSPS蛋白质的人工多核苷酸,设计人工多核苷酸(SEQ IDNO:34)以增强植物细胞中的表达,使用拟南芥(At)或者大豆(Glycinemax)(Gm)用法表(例如,在WO04009761中阐明的表)进行所述设计,所述人工多核苷酸是对从新月柄杆菌分离的天然多核苷酸序列的修饰(SEQ ID NO:23)。终止区(T-)是豌豆(Pisum sativum,Ps)核酮糖1,5-二磷酸羧化酶(称作E9 3′或者T-Ps.RbcS,Coruzzi,等人,EMBO J.3:1671-1679,1984)。pMON81523中还含有植物表达盒,其提供了选择性标记基因,用于使用glufosinate除草剂来选择转基因植物细胞,其是P-CaMV.35S/Sh.bar编码区/T-AGRtu.nos。植物表达盒侧翼为根瘤土壤杆菌Ti质粒右边界(RB)和左边界(LB)DNA区。植物嵌合DNA构建体pMON81524含有可操作地连接DNA分子如pMON81523的调节元件,不同之处只是使用Cc.aroA.nat多核苷酸(SEQ ID NO:23),这是天然新月柄杆菌多核苷酸分子。为比较的目的而言,植物嵌合DNA构建体pMON81517(图10)含有与pMON81523和pMON81524相同的可操作地连接的DNA分子,不同之处只是根瘤土壤杆菌菌株CP4EPSPS编码区(AGRtu.aroA-CP4)用于代替新月柄杆菌多核苷酸。通过土壤杆菌介导的转化方法将这些DNA构建体的转化DNA插入植物细胞,如拟南芥和烟草细胞的基因组,以提供转基因草甘膦耐受性植物。
制备额外的植物嵌合DNA构建体,其含有Cc.aroAnno-At多核苷酸(pMON58481,图11)和X.campestris人工多核苷酸(SEQ ID NO:35)Xc.aroA.nno-At(pMON81546,图12)。驱动这些多核苷酸的调节遗传元件是嵌合启动子(P-FMV.35S-At.Tsfl)、前导序列(L-At.Tsf1)和内含子(I-At.Tsf1)(美国专利6,660,911,SEQ ID NO:28)和T-Ps.RbcS2终止区。Xc.aroA.nno-At是编码X.campestris EPSPS蛋白质的人工多核苷酸,使用拟南芥密码子选择表(例如,WO04009761,表2)设计人工多核苷酸(SEQ ID NO:35)以增强在植物细胞中的表达,所述人工多核苷酸修饰了从X.campestris分离的天然多核苷酸序列(SEQ ID NO:20)。通过土壤杆菌介导的方法,将这些DNA构建体的转化DNA插入植物细胞,,如大豆细胞的基因组中,以提供转基因草甘膦耐受性大豆植物。
可以设计嵌合植物DNA构建体以在单子叶植物细胞中表达。例如,pMON68922(图13)和pMON68921(图14)含有用于在单子叶植物细胞中表达的植物表达盒和调节元件和编码序列。此外,修饰新月柄杆菌EPSPS和X.campestris EPSPS编码序列的DNA以增强在单子叶植物细胞中的表达。Xc.aroA.nno-mono是编码X.campestris EPSPS蛋白质的人工多核苷酸,使用单子叶植物密码子选择表(例如,WO04009761,表3)设计用于增强植物细胞中表达的人工多核苷酸(SEQID NO:37),所述人工多核苷酸修饰了从X.campestris分离的天然多核苷酸序列(SEQ ID NO:20)。Cc.aroA.nno-mono是编码新月柄杆菌EPSPS蛋白质的人工多核苷酸,使用单子叶植物密码子选择表(例如,WO04009761,表3)设计用于增强植物细胞中表达的人工多核苷酸(SEQID NO:36),所述人工多核苷酸修饰了从新月柄杆菌分离的天然多核苷酸序列(SEQ ID NO:23)。pMON68921(图14)、pMON68922(图13)、pMON81568(图16)和pMON81575(图17)的调节元件包含启动子(P-)、前导序列(L-)、内含子(I-)、(TS-)转运信号,和终止(T-)DNA分子。在这些例子中,调节元件是分离的稻微管蛋白A基因元件,并且在这些DNA构建体中阐明为P-Os.TubA、L-Os.TubA、I-Os.TubA和T-Os.TubA,或者来自稻肌动蛋白基因1元件并且在这些DNA构建体中阐明为P-Os.Act1、L-Os.Actl和I-Os.Act1。编码从小麦GBSS编码序列(Genbank X57233)分离的CTP的DNA分子在本文中称作TS-Ta.Wxy,其经修饰以融合到Xc.aroA.nno-mono多核苷酸以产生嵌合的DNA分子(SEQ ID NO:40)并且也融合到Cc.aroA.nno-mono以产生嵌合的DNA分子(SEQ ID NO:41),这些DNA分子分别可操作地连接在pMON68921和pMON68922中。通过土壤杆菌介导的转化方法,将这些DNA构建体的转化DNA插入植物细胞,例如,玉米细胞的基因组中,以提供转基因草甘膦耐受性玉米植物。
实施例4 植物转化
通过Bechtold N,等人,CR Acad Sci Paris Sciences di la vie/lifesciences 316:1194-1199,(1993)描述的土壤杆菌介导的方法转化拟南芥胚。该方法已经经修改,以用于本发明的构建体以提供转化拟南芥和选择草甘膦耐受性表型的快速和有效的方法。
通过在含有10ml Luria Broth和抗生素,如大观霉素(100mg/ml)、氯霉素(25mg/ml)、卡那霉素(50mg/ml)或者如本领域技术人员确定的合适的抗生素每种1ml/L的培养管中进行培养,将含有嵌合DNA构建体,如pMON81523、pMON81524和pMON81517的土壤杆菌菌株ABI制备为接种物。将培养物在黑暗中28℃下摇动约16-20小时。
通过离心沉淀土壤杆菌接种物并将其重悬浮于具有0.44nM苯甲基氨基嘌呤(10μl 1.0mg/L贮存液溶于每升DMSO)和0.02%SilwetL-77的25ml浸润培养基(Infiltration Medium)(MS基础盐(BasalSalts)0.5%,Gamborg的B-5维生素1%,蔗糖5%,MES 0.5g/L,pH5.7)中,至OD600为0.6。
将成熟的开花拟南芥植物在真空室中用土壤杆菌接种物真空浸润,通过将含有所述植物的花盆翻转到接种物中进行浸润。将真空室密封,施加真空数分钟,突然释放真空,吸干花盆以除去过量接种物,用塑料罩覆盖花盆并将花盆置于生长室中21℃16小时光和70%湿度的条件下。接种物真空浸润后约2周,用Lawson 511授粉袋覆盖每株植物。浸润后约4周,停止对植物浇水使植物枯萎。枯萎后约2周收获种子。
通过萌发选择方法从非转基因植物选择浸润的种子胚产生的转基因拟南芥植物。将收获的种子表面消毒,然后涂布到选择培养基平板的表面,该平板含有MS基础盐4.3g/L,Gamborg B-5(500X)2.0g/L,蔗糖10g/L,MES 0.5g/L,和8g/L Phytagar与羧苄青霉素250mg/L,头孢噻肟100mg/L,和PPM 2ml/L和高压灭菌后作为过滤除菌液体溶液加入的合适的选择试剂。选择试剂可以是抗生素或者杀生素,例如,取决于用于转化胚的DNA构建体和其中含有的植物表达盒,卡那霉素60mg/L、草甘膦40-60μM或者bialaphos 10mg/L是掺入培养基的合适的浓度。当使用草甘膦选择时,从基础培养基除去蔗糖。将平板置于4℃盒子中,允许种子春化~2-4天。种子春化后,转移到生长室,该生长室中使用冷白光电灯泡,使用16/8光/暗周期和23℃的温度。~23℃下和16/8光周期下5-10天后,将可以见到所转化的植物为绿色植物。额外1-2周后,植物将具有至少一组真叶。将植物转移到土壤,用萌发罩覆盖,并移入生长室,保持覆盖,直到新的生长明显呈现,这通常需要5-7天。
烟草转化
通过在含有10ml Luria Broth和抗生素,如1ml/L每种大观霉素(100mg/ml)、氯霉素(25mg/ml)、卡那霉素(50mg/ml)或者如本领域技术人员确定的合适的抗生素的培养管中进行培养,将含有嵌合DNA构建体,如pMON81523、pMON81524和pMON81517的土壤杆菌菌株ABI制备为接种物。将培养物在黑暗中28℃下摇动约16-20小时。
如下进行烟草转化:通过体外繁殖保持原种烟草植物。将茎干切成切片并置于phytatrays中。切割叶组织并置于MS 104的固态预培养物平板中,该平板中已经加入2ml液态TXD培养基(表3.基础培养基配方)和无菌Whatman滤片。在温室(23℃,连续光)中预培养外植体1-2天。在接种前一天,将一接种环10μl的、含有DNA构建体之一的转化的土壤杆菌置于含有含合适抗生素的10ml YEP培养基的管中以保持DNA构建体的选择。将管置于摇床中在28℃下生长过夜。用TXD培养基调节土壤杆菌的OD600至0.15-0.30OD600。通过将7-8ml液体土壤杆菌悬浮物直接移液到预培养物板上覆盖外植体组织来接种烟草叶组织。让土壤杆菌在平板上保持15分钟。倾斜平板并使用无菌的10ml宽孔移液器吸出液体。将外植体在这些相同的平板上共同培养2-3天。然后将外植体转移到含有MS104中,其中MS104含有高压灭菌后加入的这些添加剂:500mg/L羧苄青霉素、100mg/L头孢噻肟、150mg/L vanamycin和300mg/L卡那霉素。3-4周后,将愈伤组织转移到新鲜的含有卡那霉素的培养基中。6-8周时,应该从愈伤组织切除芽并在MS0+500mg/L羧苄青霉素+100mg/L卡那霉素上培养并让其生根。然后将生根的芽在2-3周后转移到土壤。
表3.基础培养基配方
MS0
4.4g MS B-5
30g蔗糖
9g Sigma TC琼脂
MS104
4.4g MS基础盐+B5维生素
30g蔗糖
1.0mg BA
0.1mg NAA
9g Sigma TC琼脂
TXD
4.3g Gibco MS
2ml Gamborg B-5 500X
8ml pCPA(0.5mg/ml)
0.01ml激动素(0.5mg/ml)
30g蔗糖
大豆转化
基本上如美国专利5,569,834和美国专利5,416,011中描述的向大豆细胞中转化入DNA构建体pMON58481和pMON81546,所述专利通过引用完整并入本文。
作物转化
通过土壤杆菌介导的转化方法,将包含本发明的EPSPS编码序列的嵌合DNA构建体转入玉米植物细胞。例如,使用含有本发明的双元DNA构建体的无害化(disarmed)的土壤杆菌菌株C58。通过三亲株交配方法将DNA构建体转移到土壤杆菌(Ditta等人,Proc.Natl.Acad.Sci.77:7347-7351,1980)。用甘油原种或者新鲜划线的平板启动含有pMON68922或pMON68921的土壤杆菌的液体培养物,并在液体LB培养基(pH7.0)中摇动下(约150转/分钟,rpm)26-28℃下过夜生长到对数生长中期,所述培养基含有50mg/l(毫克/升)卡那霉素,和50mg/l链霉素或者50mg/l大观霉素,和25mg/l氯霉素与200μM乙酰丁香酮(AS)。将土壤杆菌细胞重悬浮在接种培养基(液体CM4C,如美国专利6,573,361的表8描述)中并调节细胞密度,使得当用分光光度计在660nm的波长下测量时,重悬浮的细胞的光密度为1(即,OD660)。用土壤杆菌接种新鲜分离的II型未成熟HiIIxLH198和HiII玉米胚并在黑暗中23℃下共培养2-3天。然后将胚胎转移到补加500mg/l羧苄青霉素(Sigma-Aldrich,St Louis,MO)和20μM AgNO3)的延迟培养基中并在28℃下培养4到5天。所有随后的培养物都保持在该温度下。
接种后1周除去玉米胚芽鞘。将胚转移到补充有500mg/1羧苄青霉素和0.5mM草甘膦的第一选择培养基(N61-0-12,如美国专利5,424,412的表1中描述)。2周后,将存活组织转移到补加500mg/1羧苄青霉素和1.0mM草甘膦的第二选择培养基(N61-0-12)。将存活的愈伤组织在1.0mM草甘膦上每两周传代培养一次,进行约3次传代培养。当鉴定了草甘膦耐受性组织时,将组织扩大(bulked up)用于再生。为了再生,将愈伤组织转移到补充0.1μM脱落酸(ABA;Sigma-Aldrich,St Louis,MO)的再生培养基(MSOD,如美国专利5,424,412的表1中描述)中,并培养2周。将再生的愈伤组织转移到高蔗糖培养基并培养2周。将小植株转移到培养容器中的MSOD培养基(无ABA)并培养2周。然后,将生根的植物转移到土壤。植物可以用草甘膦处理,收集R1种子,种植,并用草甘膦处理这些植物。
玉米细胞转化方法领域中的技术人员可以修改该方法以提供含有本发明的嵌合DNA分子的转基因玉米植物,或者使用已知能提供转基因单子叶植物的其他方法,如微粒枪。
实施例5
耐受草甘膦的转基因植物
用有效剂量的草甘膦处理用DNA构建体pMON81517和pMON81523转化的转基因拟南芥植物和用DNA构建体pMON81517、pMON81523和pMON81524转化的转基因烟草植物,以展示营养耐受性和生殖耐受性。使用Roundup UltraTM——一种草甘膦制剂和TrackSprayer装置(Roundup UltraTM是Monsanto公司的一个注册商标),用温室喷雾试验测试植物。植物在“两片”真叶或者更高生长阶段时处理,并且在应用Roundup喷雾时叶子是干燥的。所用的制剂是Roundup UltraTM,其是3lb/加仑a.e.(酸当量)制剂。所用的校准如下:
对于20加仑/英亩喷雾体积:
喷嘴速度:9501均匀流
喷雾压力:40psi(磅/平方英寸)
喷雾高度:株冠和喷嘴头之间18英寸
轨迹速度:1.1英尺/秒,对应于1950-1.0伏特。
制剂: Roundup UltraTM(1lbs.酸当量/加仑)
喷雾浓度将取决于所希望的测试范围而变。例如,如果希望使用8oz/英亩的速率,就使用3.1ml/L的工作溶液,如果希望使用64oz/英亩的速率,使用24.8ml/L的工作范围。通过以24oz/英亩的速率喷雾应用草甘膦处理拟南芥植物,然后评估对草甘膦伤害的营养耐受性和繁殖耐受性,结果在表4中显示。这些结果展示了用两种不同的EPSPS基因土壤杆菌菌株CP4 EPSPS(pMON81517)和新月柄杆菌EPSPS-At(pMON81523,含有Cc EPSPS的人工形式,具有双子叶植物密码子偏爱)转化的拟南芥对草甘膦的耐受性。产生了许多转基因植物,它们被确定对草甘膦营养性耐受(#Veg耐受性植物)。让草甘膦处理的和未处理的植物开发和结实。种子的存在表明植物是能育的。对于含有pMON81517(61%)和pMON81523(56%)的转基因植物的生育力得分观察到类似结果,如表4所示。这些结果表明含有Cc EPSPS的编码序列的嵌合DNA分子向转基因植物提供的耐受性与商业CP4 EPSPS基因的水平大概相同。表5显示了以24oz/A和96oz/A处理的对pMON81517(CP4 EPSPS)、pMON81523(Cc EPSPS人工的)和pMON81524(Cc EPSPS天然的)转基因的烟草植物中的繁殖耐受性(%能育的植物)。来自每种构建体的转基因烟草植物的营养性草甘膦耐受性在两种速率下都高于90%。在96oz/A下,繁殖耐受性表明编码经修饰以增强表达的CcEPSPS的人工DNA分子(pMON81523)提供了相对于天然DNA分子(pMON81524)的提高的繁殖耐受性。繁殖耐受性类似于用商业标准品(CP4 EPSPS)所观察到的繁殖耐受性。该实施例提供了证据,证明编码草甘膦抗性EPSPS酶的DNA分子的修饰(表1)可以提供在含有它们的转基因植物中观察到的草甘膦耐受性的提高。
表4.转基因拟南芥中对草甘膦的耐受性
草甘膦处理24oz/A
构建体 #Veg耐受性植物 #能育的植物 #不育的植物 %不育的
PMON81517 62 38 24 61%
PMON81523 61 34 27 56%
未处理的对照
构建体 #植物 能育的植物 不育的植物* %不育的
PMON81517 19 13 6 68%
PMON81523 28 22 6 79%
*该组含有发育延迟的植物并且分类为不育的。
表5.转基因烟草植物的生育力作为草甘膦耐受性的指示
构建体 %能育的植物24oz/A %能育的植物96oz/A
PMON81517 38 23
PMON81523 34 20
PMON81524 37 0
观察到用本发明的DNA构建体转化的玉米植物耐受草甘膦处理,尤其DNA构建体pMON81568和pMON81575表现出来自那些被转化的植物的草甘膦耐受性植物的高百分比。用pMON81568转化玉米细胞导致33%转化效率并且60%转基因植物耐受草甘膦的应用。用pMON81575转化玉米细胞导致33%转化效率并且36%转基因植物耐受草甘膦应用。
实施例6
已经观察到叶绿体转运肽并不总是精确地处理,有时在连接的多肽中切割,有时在CTP多肽中切割。这导致产生了具有可变的N-末端的经加工多肽。进行实验来测试多种CTP在CTP和草甘膦抗性EPSPS,例如,CP4 EPSPS的接点精确加工的能力。产生新的DNA构建体,其利用与CP4 EPSPS编码序列融合的小麦GBSS CTP(TS-Ta.Wxy,SEQ ID NO:38,和CTP-CP4 EPSPS多肽SEQ ID NO:39,图15pMON58469)、玉米淀粉分枝酶II CTP(Zm CsbII,pMON66353,Genbank L08065)、稻可溶性淀粉合成酶CTP(Os.Sss,pMON66354,Genbank D16202)、稻EPSPS CTP(Os.EPSPS,pMON66355)、稻GBSSCTP(Os.GBSS,pMON66356,Genbank X62134)、稻色氨酸合酶CTP(Os.trypB,pMON66357,Genbank AB003491)和玉米核酮糖二磷酸羧化酶-加氧酶CTP(Zm.RbcS2 CTP,pMON58422)来产生嵌合多肽。对含有嵌合CTP-CP4 EPSPS DNA编码序列的DNA构建体测试在玉米原生质体中的加工。通过电穿孔向玉米叶子原生质体细胞中导入每种DNA构建体的纯化的质粒DNA。收集细胞并提取总蛋白质。将蛋白质提取物在聚丙烯酰胺凝胶上分离并进行蛋白质印迹分析(Sambrook等人,1989),该分析使用抗-CP4 EPSPS抗体。结果表明一些CTP-CP4EPSPS融合多肽产生了多种加工的蛋白质产物。尤其观察到Zm.CsbIICTP-CP4 EPSPS、Os.Sss CTP-CP4 EPSPS、Zm.RbCS2 CTP-CP4EPSPS和Os.TrypB CTP-CP4 EPSPS在玉米原生质体细胞中产生这些产物。
通过微粒枪(例如,通过美国专利6,365,807和6,288,312中提供的方法)将DNA构建体转化到稻细胞,并将细胞再生成植物。对叶和种子组织的分析表明稻EPSPS CTP也在稻种子组织中产生多种蛋白质产物。从转基因稻种子纯化小麦GBSS CTP-CP4 EPSPS蛋白质产物并确定N-末端序列,将拟南芥EPSPS CTP2-CP4 EPSPS DNA构建体(pMON32525)也转化到稻中并从稻种子纯化它的蛋白质产物并对N-末端测序。表6中所示结果表明当小麦GBSS CTP融合稻EPSPS多肽时,发现了单一的精确加工的成熟EPSPS。发现拟南芥CTP产生至少三种蛋白质产物,一种被正确地加工,发现被加工成从成熟EPSPS除去了两个氨基酸,一种被加工成具有来自CTP的一个额外氨基酸。在所测试的CTP-EPSPS融合多肽中,仅仅小麦GBSS CTP提供了成熟EPSPS的精确加工。产生了额外的嵌合DNA分子,其编码融合到Xc EPSPS(SEQ ID NO:40)和Cc EPSPS(SEQ ID NO:41)的小麦GBSS CTP。小麦GBSS CTP可以融合到任意EPSPS以增强到成熟EPSPS的精确加工,具体地,来自表1的CP4 EPSPS和EPSPS。而且,其他农学上有用的蛋白质可以融合小麦GBSS CTP以用作转基因为作物植物提供新的表型。
表6.对转基因植物产生的CTP-EPSPS的N-末端分析
成熟 CP4 EPSPS MLHGAXSRXATA...
小麦 GBSS CTP-CP4 EPSPS MLHGAXSRXATA...
拟南芥CTP-CP4 EPSPS MLHGAXSRXATA...
GASSRPATA...
XMLHGASXRPAT...
已经阐明了描述了本发明的原理,本发明可以在编排和细节上修改,而不背离这些原理,这对本领域技术人员来说应当是明显的。我们要求所有这些修改都在本发明的精神和范围内。
本说明书中引用的所有出版物和公布的专利文献都通过引用并入本文,这与每份单独的出版物或者专利申请都特别和个别地通过参考并入本文一样。
<110>Alibhai,Murtaza F.
Chay,Catherine
Flasinski,Stanislaw
Lu,Maolong
Stallings,Williams C
Sammons,R.Douglas
<120>微生物草甘膦抗性EPSPS
<130>11899.0246.00PC00
<160>51
<210>1
<211>4
<212>PRT
<213>人工序列
<220>
<223>EPSPS蛋白的基序1,其中X是G,A,S,或P
<220>
<221>不确定
<222>(1)..(4)
<223>在所有的Xaa位置上不确定
<220>
<221>VARIANT
<222>(1)..(1)
<223>X=g,a,s,或p
<400>1
Xaa Asp Lys Ser
1
<210>2
<211>5
<212>PRT
<213>人工序列
<220>
<223>EPSPS蛋白的基序2,其中X是任何氨基酸
<220>
<221>不确定
<222>(1)..(5)
<223>在所有的Xaa位置上不确定
<220>
<221>VARIANT
<222>(4)..(4)
<223>X=任何氨基酸
<400>2
Ser Ala Gln Xaa Lys
1 5
<210>3
<211>5
<212>PRT
<213>人工序列
<220>
<223>EPSPS蛋白的基序3
<220>
<221>不确定
<222>(1)..(5)
<223>在所有的Xaa位置上不确定
<220>
<221>VARIANT
<222>(2)..(5)
<223>X2=d或n
X3=y或h
X4=t或s
X5=r或e
<400>3
Arg Xaa Xaa Xaa Xaa
1 5
<210>4
<211>4
<212>PRT
<213>人工序列
<220>
<223>EPSPS的基序4
<220>
<221>不确定
<222>(1)..(4)
<223>在所有的Xaa位置上不确定
<220>
<221>VARIANT
<222>(2)..(3)
<223>X2=p,e,或q
X3=r或l
<400>4
Asn Xaa Xaa Arg
1
<210>5
<211>442
<212>PRT
<213>Xylella fastidiosa
<400>5
Met Ser His Arg Thr His Asp Tyr Trp Ile Ala His Gln Gly Thr Pro
1 5 10 15
Leu His Gly Val Leu Ser Ile Pro Gly Asp Lys Ser Ile Ser His Arg
20 25 30
Ala Val Met Phe Ala Ala Leu Ala Asp Gly Thr Ser Arg Ile Asp Gly
35 40 45
Phe Leu Glu Ala Glu Asp Thr Cys Ser Thr Ala Glu Ile Leu Ala Arg
50 55 60
Leu Gly Val Arg Ile Glu Thr Pro Leu Ser Thr Gln Arg Ile Val His
65 70 75 80
Gly Val Gly Val Asp Gly Leu Gln Ala Ser His Ile Pro Leu Asp Cys
85 90 95
Gly ASn Ala Gly Thr Gly Met Arg Leu Leu Ala Gly Leu Leu Val Ala
100 105 110
Gln Pro Phe Asp Ser Val Leu Val Gly Asp Ala Ser Leu Ser Lys Arg
115 120 125
Pro Met Arg Arg Val Thr Asp Pro Leu Ser Gln Met Gly Ala Arg Ile
130 135 140
Asp Thr Ser Asp Asp Gly Thr Pro Pro Leu Arg Ile Tyr Gly Gly Gln
145 150 155 160
Leu Leu His Gly Ile Asp Phe Ile Ser Pro Val Ala Ser Ala Gln Ile
165 170 175
Lys Ser Ala Val Leu Leu Ala Gly Leu Tyr Ala Arg Asn Glu Thr Val
180 185 190
Val Arg Glu Pro His Pro Thr Arg Asp Tyr Thr Glu Arg Met Leu Thr
195 200 205
Ala Phe Gly Val Asp Ile Asp Val Ser Thr Gly Cys Ala Arg Leu Arg
210 215 220
Gly Gly Gln Arg Leu Cys Ala Thr Asp Ile Thr Ile Pro Ala Asp Phe
225 230 235 240
Ser Ser Ala Ala Phe Tyr Leu Val Ala Ala Ser Val Ile Pro Gly Ser
245 250 255
Asp Ile Thr Leu Arg Ala Val Gly Leu Asn Pro Arg Arg Ile Gly Leu
260 265 270
Leu Thr Val Leu Arg Leu Met Gly Ala Asn Ile Val Glu Ser ASn Arg
275 280 285
His Glu Gln Gly Gly Glu Pro Val Val Asp Leu Arg Val Arg Tyr Ala
290 295 300
Pro Leu Gln Gly Thr Arg Val Pro Glu Asp Leu Val Ala Asp Met Ile
305 310 315 320
Asp Glu Phe Pro Ala Leu Phe Val Ala Ala Ala Ala Ala Glu Gly Gln
325 330 335
Thr Val Val Ser Gly Ala Ala Glu Leu Arg Val Lys Glu Ser Asp Arg
340 345 350
Leu Ala Ala Met Val Thr Gly Leu Arg Val Leu Gly Val Gln Val Asp
355 360 365
Glu Thr Ala Asp Gly Ala Thr Ile His Gly Gly Pro Ile Gly His Gly
370 375 380
Thr lle Ash Ser His Gly Asp His Arg Ile Ala Met Ala Phe Ser Ile
385 390 395 400
Ala Gly Gln Leu Ser Val Ser Thr Val Arg Ile Glu Asp Val Ala ASn
405 410 415
Val Ala Thr Ser Phe Pro Asp Tyr Glu Thr Leu Ala Arg Ser Ala Gly
420 425 430
Phe Gly Leu Glu Val Tyr Cys Asp Pro Ala
435 440
<210>6
<211>438
<212>PRT
<213>Xanthomonas campestris
<400>6
Met Ser Asn Ser Ser Gln His Trp Ile Ala Gln Arg Gly Thr Ala Leu
1 5 10 15
Gln Gly Ser Leu Thr Ile Pro Gly Asp Lys Ser Val Ser His Arg Ala
20 25 30
Val Met Phe Ala Ala Leu Ala Asp Gly Thr Ser Lys Ile Asp Gly Phe
35 40 45
Leu Glu Gly Glu Asp Thr Arg Ser Thr Ala Ala Ile Phe Ala Gln Leu
50 55 60
Gly Val Arg Ile Glu Thr Pro Ser Ala Ser Gln Arg Ile Val His Gly
65 70 75 80
Val Gly Val Asp Gly Leu Gln Pro Pro Gln Gly Pro Leu Asp Cys Gly
85 90 95
Asn Ala Gly Thr Gly Met Arg Leu Leu Ala Gly Val Leu Ala Ala Gln
100 105 110
Arg Phe Asp Ser Val Leu Val Gly Asp Ala Ser Leu Ser Lys Arg Pro
115 120 125
Met Arg Arg Val Thr Gly Pro Leu Ala Gln Met Gly Ala Arg Ile Glu
130 135 140
Thr Glu Ser Asp Gly Thr Pro Pro Leu Arg Val His Gly Gly Gln Pro
145 150 155 160
Leu Gln Gly Ile Thr Phe Ala Ser Pro Val Ala Ser Ala Gln Val Lys
165 170 175
Ser Ala Val Leu Leu Ala Gly Leu Tyr Ala Ala Gly Glu Thr Ser Val
180 185 190
Ser Glu Pro His Pro Thr Arg Asp Tyr Thr Glu Arg Met Leu Ser Ala
195 200 205
Phe Gly Val Asp Ile Ala Phe Ser Pro Gly Gln Ala Arg Leu Arg Gly
210 215 220
Gly Gln Arg Leu Arg Ala Thr Asp Ile Ala Val Pro Ala Asp Phe Ser
225 230 235 240
Ser Ala Ala Phe Phe Ile Val Ala Ala Ser Ile Ile Pro Gly Ser Asp
245 250 255
Val Thr Leu Arg Ala Val Gly Leu Asn Pro Arg Arg Thr Gly Leu Leu
260 265 270
Ala Ala Leu Arg Leu Met Gly Ala Asp Ile Val Glu Asp Asn His Ala
275 280 285
Glu His Gly Gly Glu Pro Val Ala Asp Leu Arg Val Arg Tyr Ala Pro
290 295 300
Leu Gln Gly Ala Gln lle Pro Glu Ala Leu Val Pro Asp Met Ile Asp
305 310 315 320
Glu Phe Pro Ala Leu Phe Val Ala Ala Ala Ala Ala Arg Gly Asp Thr
325 330 335
Val Val Ser Gly Ala Ala Glu Leu Arg Val Lys Glu Ser Asp Arg Leu
340 345 350
Ala Ala Met Ala Thr Gly Leu Arg Ala Leu Gly Ile Val Val Asp Glu
355 360 365
Thr Pro Asp Gly Ala Thr Ile His Gly Gly Thr Leu Gly Ser Gly Val
370 375 380
Ile Glu Ser His Gly Asp His Arg lle Ala Met Ala Phe Ala Ile Ala
385 390 395 400
Gly Gln Leu Ser Thr Gly Thr Val Gln Val Asn Asp Val Ala Asn Val
405 410 415
Ala Thr Ser Phe Pro Gly Phe Asp Ser Leu Ala Gln Gly Ala Gly Phe
420 425 430
Gly Leu Ser Ala Arg Pro
435
<210>7
<211>467
<212>PRT
<213>Rhodopseudomonas palustris
<400>7
Met Pro Lys Ala Ala Arg Arg Arg Asp Ala Arg Pro Asn His Pro Gln
1 5 10 15
Pro Arg Gly Thr Thr Ile Leu Thr Asp Ser Asn Gln Pro Met Pro Leu
20 25 30
Gln Ala Arg Lys Ser Gly Ala Leu His Gly Thr Ala Arg Val Pro Gly
35 40 45
Asp Lys Ser Ile Ser His Arg Ala Leu Ile Leu Gly Ala Leu Ala Val
50 55 60
Gly Glu Thr Arg Ile Ser Gly Leu Leu Glu Gly Glu Asp Val Ile Asn
65 70 75 80
Thr Ala Lys Ala Met Arg Ala Leu Gly Ala Lys Val Glu Arg Thr Gly
85 90 95
Asp Cys Glu Trp Arg Val His Gly Val Gly Val Ala Gly Phe Ala Thr
100 105 110
Pro Glu Ala Pro Leu Asp Phe Gly Asn Ser Gly Thr Gly Cys Arg Leu
115 120 125
Ala Met Gly Ala Val Ala Gly Ser Pro Ile Val Ala Thr Phe Asp Gly
130 135 140
Asp Ala Ser Leu Arg Ser Arg Pro Met Arg Arg Ile Val Asp Pro Leu
145 150 155 160
Glu Leu Met Gly Ala Lys Val Val Ser Ser Ser Glu Gly Gly Arg Leu
165 170 175
Pro Leu Ala Leu Gln Gly Ala Arg Asp Pro Leu Pro Ile Leu Tyr Arg
180 185 190
Thr Pro Val Pro Ser Ala Gln Ile Lys Ser Ala Val Leu Leu Ala Gly
195 200 205
Leu Ser Ala Pro Gly Ile Thr Thr Val Ile Glu Ala Glu Ala Ser Arg
210 215 220
Asp His Thr Glu Leu Met Leu Gln His Phe Gly Ala Thr Ile Val Thr
225 230 235 240
Glu Ala Glu Gly Ala His Gly Arg Lys Ile Ser Leu Thr Gly Gln Pro
245 250 255
Glu Leu Arg Gly Ala Pro Val Val Val Pro Ala Asp Pro Ser Ser Ala
260 265 270
Ala Phe Pro Met Val Ala Ala Leu Val Val Pro Gly Ser Asp Ile Glu
275 280 285
Leu Thr Asp Val Met Thr Asn Pro Leu Arg Thr Gly Leu Ile Thr Thr
290 295 300
Leu Arg Glu Met Gly Ala Ser Ile Glu Asp Ser Asp Val Arg Gly Asp
305 310 315 320
Ala Gly Glu Pro Met Ala Arg Phe Arg Val Arg Gly Ser Lys Leu Lys
325 330 335
Gly Val Glu Val Pro Pro Glu Arg Ala Pro Ser Met Ile Asp Glu Tyr
340 345 350
Leu Val Leu Ala Val Ala Ala Ala Phe Ala Glu Gly Thr Thr Val Met
355 360 365
Arg Gly Leu His Glu Leu Arg Val Lys Glu Ser Asp Arg Leu Glu Ala
370 375 380
Thr Ala Ala Met Leu Arg Val Asn Gly Val Ala Val Glu Ile Ala Gly
385 390 395 400
Asp Asp Leu Ile Val Glu Gly Lys Gly His Val Pro Gly Gly Gly Val
405 410 415
Val Ala Thr His Met Asp His Arg Ile Ala Met Ser Ala Leu Ala Met
420 425 430
Gly Leu Ala Ser Asp Lys Pro Val Thr Val Asp Asp Thr Ala Phe Ile
435 440 445
Ala Thr Ser Phe Pro Asp Phe Val Pro Met Met Gln Arg Leu Gly Ala
450 455 460
Glu Phe Gly
465
<210>8
<211>488
<212>PRT
<213>Magnetospirillum magnetotactieum
<400>8
Met Phe Pro Thr Leu Cys Gln Asn Glu Lys Ala Trp Ala Val Gln His
1 5 10 15
Gly Thr Gln Val Tyr Asp Ala Lys Gly Ala Cys Asp Arg Ala Ser Ala
20 25 30
Gly Ser Phe Leu Pro Cys Arg Trp Leu Ser Gly Val Ile Met Ala Lys
35 40 45
Pro Leu Ser Ser Arg Lys Ala Ala Pro Leu Ala Gly Ser Ala Arg Val
50 55 60
Pro Gly Asp Lys Ser Ile Ser His Arg Ala Leu Met Leu Gly Ala Leu
65 70 75 80
Ala Val Gly Glu Ser Val ValThr Gly Leu Leu Glu Gly Asp Asp Val
85 90 95
Leu Arg Thr Ala Ala Cys Met Arg Ala Leu Gly Ala Glu Val Glu Arg
100 105 110
Gln Ala Asp Gly Ser Trp Arg Leu Phe Gly Arg Gly Val Gly Gly Leu
115 120 125
Met Glu Pro Ala Asp Ile Leu Asp Met Gly Asn Ser Gly Thr Gly Ala
130 135 140
Arg Leu Leu Met Gly Leu Val Ala Thr His Pro Phe Thr Cys Phe Phe
145 150 155 160
Thr Gly Asp Gly Ser Leu Arg Ser Arg Pro Met Arg Arg Val Ile Glu
165 170 175
Pro Leu Ser Arg Met Gly Ala Arg Phe Val Ser Arg Asp Gly Gly Arg
180 185 190
Leu Pro Leu Ala Val Thr Gly Thr Ser Gln Pro Thr Pro Ile Thr Tyr
195 200 205
Glu Leu Pro Val Ala Ser Ala Gln Val Lys Ser Ala Ile Met Leu Ala
210 215 220
Gly Leu Asn Thr Ala Gly Glu Thr Thr Val Ile Glu Arg Glu Ala Thr
225 230 235 240
Arg Asp His Thr Glu Leu Met Leu Arg Asn Phe Gly Ala Thr Val Arg
245 250 255
Val Glu Asp Ala Glu Gly Gly Gly Arg Ala Val Thr Val Val Gly Phe
260 265 270
Pro Glu Leu Thr Gly Arg Pro Val Val Val Pro Ala Asp Pro Ser Ser
275 280 285
Ala Ala Phe Pro Val Val Ala Ala Leu Leu Val Glu Gly Ser Glu Ile
290 295 300
Arg Leu Pro Gly Val Gly Thr Asn Pro Leu Arg Thr Gly Leu Tyr Gln
305 310 315 320
Thr Leu Leu Glu Met Gly Ala Asp Ile Arg Phe Asp Asn Pro Arg Asp
325 330 335
Gln Ala Gly Glu Pro Val Ala Asp Leu Val Val Arg Ala Ser Arg Leu
340 345 350
Lys Gly Val Asp Val Pro Ala Glu Arg Ala Pro Ser Met Ile Asp Glu
355 360 365
Tyr Pro Ile Leu Ala Val Ala Ala Ala Phe Ala Glu Gly Thr Thr Arg
370 375 380
Met Arg Gly Leu Ala Glu Leu Arg Val Lys Glu Ser Asp Arg Leu Ala
385 390 395 400
Ala Met Ala Arg Gly Leu Ala Ala Cys Gly Val Ala Val Glu Glu Glu
405 410 415
Lys Asp Ser Leu Ile Val His Gly Thr Gly Arg Ile Pro Asp Gly Asp
420 425 430
Ala Thr Val Thr Thr His Phe Asp His Arg Ile Ala Met Ser Phe Leu
435 440 445
Val Met Gly Met Ala Ser Ala Arg Pro Val Ala Val Asp Asp Ala Glu
450 455 460
Ala Ile Glu Thr Ser Phe Pro Ile Phe Val Glu Leu Met Asn Gly Leu
465 470 475 480
Gly Ala Lys Ile Glu Ala Met Gly
485
<210>9
<211>443
<212>PRT
<213>Caulobacter crescentus
<400>9
Met Ser Leu Ala Gly Leu Lys Ser Ala Pro Gly Gly Ala Leu Arg Gly
1 5 10 15
Ile Val Arg Ala Pro Gly Asp Lys Ser Ile Ser His Arg Ser Met Ile
20 25 30
Leu Gly Ala Leu Ala Thr Gly Thr Thr Thr Val Glu Gly Leu Leu Glu
35 40 45
Gly Asp Asp Val Leu Ala Thr Ala Arg Ala Met Gln Ala Phe Gly Ala
50 55 60
Arg Ile Glu Arg Glu Gly Val Gly Arg Trp Arg Ile Glu Gly Lys Gly
65 70 75 80
Gly Phe Glu Glu Pro Val Asp Val Ile Asp Cys Gly Asn Ala Gly Thr
85 90 95
Gly Val Arg Leu Ile Met Gly Ala Ala Ala Gly Phe Ala Met Cys Ala
100 105 110
Thr Phe Thr Gly Asp Gln Ser Leu Arg Gly Arg Pro Met Gly Arg Val
115 120 125
Leu Asp Pro Leu Ala Arg Met Gly Ala Thr Trp Leu Gly Arg Asp Lys
130 135 140
Gly Arg Leu Pro Leu Thr Leu Lys Gly Gly Asn Leu Arg Gly Leu Asn
145 150 155 160
Tyr Thr Leu Pro Met Ala Ser Ala Gln Val Lys Ser Ala Val Leu Leu
165 170 175
Ala Gly Leu His Ala Glu Gly Gly Val Glu Val Ile Glu Pro Glu Ala
180 185 190
Thr Arg Asp His Thr Glu Arg Met Leu Arg Ala Phe Gly Ala Glu Val
195 200 205
Ile Val Glu Asp Arg Lys Ala Gly Asp Lys Thr Phe Arg His Val Arg
210 215 220
Leu Pro Glu Gly Gln Lys Leu Thr Gly Thr His Val Ala Val Pro Gly
225 230 235 240
Asp Pro Ser Ser Ala Ala Phe Pro Leu Val Ala Ala Leu Ile Val Pro
245 250 255
Gly Ser Glu Val Thr Val Glu Gly Val Met Leu Asn Glu Leu Arg Thr
260 265 270
Gly Leu Phe Thr Thr Leu Gln Glu Met Gly Ala Asp Leu Val Ile Ser
275 280 285
Asn Val Arg Val Ala Ser Gly Glu Glu Val Gly Asp Ile Thr Ala Arg
290 295 300
Tyr Ser Gln Leu Lys Gly Val Val Val Pro Pro Glu Arg Ala Pro Ser
305 310 315 320
Met Ile Asp Glu Tyr Pro Ile Leu Ala Val Ala Ala Ala Phe Ala Ser
325 330 335
Gly Glu Thr Val Met Arg Gly Val Gly Glu Met Arg Val Lys Glu Ser
340 345 350
Asp Arg Ile Ser Leu Thr Ala Asn Gly Leu Lys Ala Cys Gly Val Gln
355 360 365
Val Val Glu Glu Pro Glu Gly Phe Ile Val Thr Gly Thr Gly Gln Pro
370 375 380
Pro Lys Gly Gly Ala Thr Val Val Thr His Gly Asp His Arg Ile Ala
385 390 395 400
Met Ser His Leu Ile Leu Gly Met Ala Ala Gln Ala Glu Val Ala Val
405 410 415
Asp Glu Pro Gly Met Ile Ala Thr Ser Phe Pro Gly Phe Ala Asp Leu
420 425 430
Met Arg Gly Leu Gly Ala Thr Leu Ala Glu Ala
435 440
<210>10
<211>445
<212>PRT
<213>Magnetococcus sp.MC-1
<400>10
Met Ser Ser Thr His Pro Gly Arg Thr Ile Arg Ser Gly Ala Thr Gln
1 5 10 15
Asn Leu Ser Gly Thr Ile Arg Pro Ala Ala Asp Lys Ser Ile Ser His
20 25 30
Arg Ser Val Ile Phe Gly Ala Leu Ala Glu Gly Glu Thr His Val Lys
35 40 45
Gly Met Leu Glu Gly Glu Asp Val Leu Arg Thr Ile Thr Ala Phe Arg
50 55 60
Thr Met Gly Ile Ser Ile Glu Arg Cys Ash Glu Gly Glu Tyr Arg Ile
65 70 75 80
Gln Gly Gln Gly Leu Asp Gly Leu Lys Glu Pro Asp Asp Val Leu Asp
85 90 95
Met Gly Asn Ser Gly Thr Ala Met Arg Leu Leu Cys Gly Leu Leu Ala
100 105 110
Ser Gln Pro Phe His Ser Ile Leu Thr Gly Asp His Ser Leu Arg Ser
115 120 125
Arg Pro Met Gly Arg Val Val Gln Pro Leu Thr Lys Met Gly Ala Arg
130 135 140
Ile Arg Gly Arg Asp Gly Gly Arg Leu Ala Pro Leu Ala Ile Glu Gly
145 150 155 160
Thr Glu Leu Val Pro Ile Thr Tyr Asn Ser Pro Ile Ala Ser Ala Gln
165 170 175
Val Lys Ser Ala Ile Ile Leu Ala Gly Leu Asn Thr Ala Gly Glu Thr
180 185 190
Thr Ile Ile Glu Pro Ala Val Ser Arg Asp His Thr Glu Arg Met Leu
195 200 205
Ile Ala Phe Gly Ala Glu Val Thr Arg Asp Gly Asn Gln Val Thr Ile
210 215 220
Glu Gly Trp Pro Asn Leu Gln Gly Gln Glu Ile Glu Val Pro Ala Asp
225 230 235 240
Ile Ser Ala Ala Ala Phe Pro Met Val Ala Ala Leu Ile Thr Pro Gly
245 250 255
Ser Asp Ile Ile Leu Glu Asn Val Gly Met Asn Pro Thr Arg Thr Gly
260 265 270
Ile Leu Asp Leu Leu Leu Ala Met Gly Gly Asn Ile Gln Arg Leu Asn
275 280 285
Glu Arg Glu Val Gly Gly Glu Pro Val Ala Asp Leu Gln Val Arg Tyr
290 295 300
Ser Gln Leu Gln Gly Ile Glu Ile Asp Pro Thr Val Val Pro Arg Ala
305 310 315 320
Ile Asp Glu Phe Pro Val Phe Phe Val Ala Ala Ala Leu Ala Gln Gly
325 330 335
Gln Thr Leu Val Gln Gly Ala Glu Glu Leu Arg Val Lys Glu Ser Asp
340 345 350
Arg Ile Thr Ala Met Ala Asn Gly Leu Lys Ala Leu Gly Ala Ile Ile
355 360 365
Glu Glu Arg Pro Asp Gly Ala Leu Ile Thr Gly Asn Pro Asp Gly Leu
370 375 380
Ala Gly Gly Ala Ser Val Asp Ser Phe Thr Asp His Arg Ile Ala Met
385 390 395 400
Ser Leu Leu Val Ala Gly Leu Arg Cys Lys Glu Ser Val Leu Val Gln
405 410 415
Arg Cys Asp Asn Ile Asn Thr Ser Phe Pro Ser Phe Ser Gln Leu Met
420 425 430
Asn Ser Leu Gly Phe Gln Leu Glu Asp Val Ser His Gly
435 440 445
<210>11
<211>428
<212>PRT
<213>Enterococcus faecalis
<400>11
Met Arg Val Gln Leu Arg Thr Asn Val Lys His Leu Gln Gly Thr Leu
1 5 10 15
Met Val Pro Ser Asp Lys Ser Ile Ser His Arg Ser Ile Met Phe Gly
20 25 30
Ala Ile Ser Ser Gly Lys Thr Thr Ile Thr Asn Phe Leu Arg Gly Glu
35 40 45
Asp Cys Leu Ser Thr Leu Ala Ala Phe Arg Ser Leu Gly Val Asn Ile
50 55 60
Glu Asp Asp Gly Thr Thr Ile Thr Val Glu Gly Arg Gly Phe Ala Gly
65 70 75 80
Leu Lys Lys Ala Lys Asn Thr Ile Asp Val Gly Asn Ser Gly Thr Thr
85 90 95
Ile Arg Leu Met Leu Gly Ile Leu Ala Gly Cys Pro Phe Glu Thr Arg
100 105 110
Leu Ala Gly Asp Ala Ser Ile Ala Lys Arg Pro Met Asn Arg Val Met
115 120 125
Leu Pro Leu Asn Gln Met Gly Ala Glu Cys Gln Gly Val Gln Gln Thr
130 135 140
Glu Phe Pro Pro Ile Ser Ile Arg Gly Thr Gln Asn Leu Gln Pro Ile
145 150 155 160
Asp Tyr Thr Met Pro Val Ala Ser Ala Gln Val Lys Ser Ala Ile Leu
165 170 175
Phe Ala Ala Leu Gln Ala Glu Gly Thr Ser Val Val Val Glu Lys Glu
180 185 190
Lys Thr Arg Asp His Thr Glu Glu Met Ile Arg Gln Phe Gly Gly Thr
195 200 205
Leu Glu Val Asp Gly Lys Lys Ile Met Leu Thr Gly Pro Gln Gln Leu
210 215 220
Thr Gly Gln Asn Val Val Val Pro Gly Asp Ile Ser Ser Ala Ala Phe
225 230 235 240
Phe Leu Val Ala Gly Leu Val Val Pro Asp Ser Glu Ile Leu Leu Lys
245 250 255
Asn Val Gly Leu Asn Gln Thr Arg Thr Gly Ile Leu Asp Val Ile Lys
260 265 270
Asn Met Gly Gly Ser Val Thr Ile Leu Asn Glu Asp Glu Ala Asn His
275 280 285
Ser Gly Asp Leu Leu Val Lys Thr Ser Gln Leu Thr Ala Thr Glu Ile
290 295 300
Gly Gly Ala Ile Ile Pro Arg Leu Ile Asp Glu Leu Pro Ile Ile Ala
305 310 315 320
Leu Leu Ala Thr Gln Ala Thr Gly Thr Thr Ile Ile Arg Asp Ala Glu
325 330 335
Glu Leu Lys Val Lys Glu Thr Asn Arg Ile Asp Ala Val Ala Lys Glu
340 345 350
Leu Thr Ile Leu Gly Ala Asp Ile Thr Pro Thr Asp Asp Gly Leu Ile
355 360 365
Ile His Gly Pro Thr Ser Leu His Gly Gly Arg Val Thr Ser Tyr Gly
370 375 380
Asp His Arg Ile Gly Met Met Leu Gln Ile Ala Ala Leu Leu Val Lys
385 390 395 400
Glu Gly Thr Val Glu Leu Asp Lys Ala Glu Ala Val Ser Val Ser Tyr
405 410 415
Pro Ala Phe Phe Asp Asp Leu Glu Arg Leu Ser Cys
420 425
<210>12
<211>428
<212>PRT
<213>Enterococcus faecalis
<400>12
Met Arg Val Gln Leu Arg Thr Asn Val Lys His Leu Gln Gly Thr Leu
1 5 10 15
Met Val Pro Ser Asp Lys Ser Ile Ser His Arg Ser Ile Met Phe Gly
20 25 30
Ala Ile Ser Ser Gly Lys Thr Thr Ile Thr Asn Phe Leu Arg Gly Glu
35 40 45
Asp Cys Leu Ser Thr Leu Ala Ala Phe Arg Ser Leu Gly Val Asn Ile
50 55 60
Glu Asp Val Gly Thr Thr Ile Thr Val Glu Gly Gln Gly Phe Ala Gly
65 70 75 80
Leu Lys Lys Ala Lys Asn Thr Ile Asp Val Gly Asn Ser Gly Thr Thr
85 90 95
Ile Arg Leu Met Leu Gly Ile Leu Ala Gly Cys Pro Phe Glu Thr Arg
100 105 110
Leu Ala Gly Asp Ala Ser Ile Ser Lys Arg Pro Met Asn Arg Val Met
115 120 125
Leu Pro Leu Asn Gln Met Gly Ala Glu Cys Gln Gly Val Gln Gln Thr
130 135 140
Glu Phe Pro Pro Ile Ser Ile Arg Gly Thr Gln Asn Leu Gln Pro Ile
145 150 155 160
Asp Tyr Thr Met Pro Val Ala Ser Ala Gln Val Lys Ser Ala Ile Leu
165 170 175
Phe Ala Ala Leu Gln Ala Glu Gly Thr Ser Val Val Val Glu Lys Glu
180 185 190
Lys Thr Arg Asp His Thr Glu Glu Met Ile Arg Gln Phe Gly Gly Thr
195 200 205
Leu Glu Val Asp Gly Lys Lys Ile Met Leu Thr Gly Pro Gln Gln Leu
210 215 220
Thr Gly Gln Asn Val Val Val Pro Gly Asp Ile Ser Ser Ala Ala Phe
225 230 235 240
Phe Leu Val Ala Gly Leu Val Val Pro Asp Ser Glu Ile Leu Leu Lys
245 250 255
Asn Val Gly Leu Asn Gln Thr Arg Thr Gly Ile Leu Asp Val lle Lys
260 265 270
Asn Met Gly Gly Ser Val Thr Ile Leu Asn Glu Asp Glu Ala Asn His
275 280 285
Ser Gly Asp Leu Leu Val Lys Thr Ser Gln Leu Thr Ala Thr Glu Ile
290 295 300
Gly Gly Ala Ile Ile Pro Arg Leu Ile Asp Glu Leu Pro Ile Ile Ala
305 310 315 320
Leu Leu Ala Thr Gln Ala Thr Gly Thr Thr Ile Ile Arg Asp Ala Glu
325 330 335
Glu Leu Lys Val Lys Glu Thr Asn Arg Ile Asp Ala Val Ala Lys Glu
340 345 350
Leu Thr Ile Leu Gly Ala Asp Ile Thr Pro Thr Asp Asp Gly Leu Ile
355 360 365
Ile His Gly Pro Thr Ser Leu His Gly Gly Arg Val Thr Ser Tyr Gly
370 375 380
Asp His Arg Ile Gly Met Met Leu Gln Ile Ala Ala Leu Leu Val Lys
385 390 395 400
Glu Gly Thr Val Glu Leu Asp Lys Ala Glu Ala Val Ser Val Ser Tyr
405 410 415
Pro Ala Phe Phe Asp Asp Leu Glu Arg Leu Ser Cys
420 425
<210>13
<211>289
<212>PRT
<213>Enterococcus faecium
<400>13
Met Arg Leu Leu Gln Gln Ile His Gly Leu Arg Gly Thr Val Arg Ile
1 5 10 15
Pro Ala Asp Lys Ser Ile Ser His Arg Ser Ile Met Phe Gly Ala Ile
20 25 30
Ala Glu Gly Thr Thr Thr Ile Gln Asn Phe Leu Arg Ala Glu Asp Cys
35 40 45
Leu Ser Thr Leu His Ala Phe Gln Gln Leu Gly Val Glu Ile Glu Glu
50 55 60
Glu Glu Glu Val Ile Lys Ile His Gly Arg Gly Ser His Ser Phe Val
65 70 75 80
Gln Pro Thr Ala Pro Ile Asp Met Gly Asn Ser Gly Thr Thr Ser Arg
85 90 95
Leu Leu Met Gly Ile Leu Ala Gly Gln Pro Phe Thr Thr Thr Leu Val
100 105 110
Gly Asp Ala Ser Leu Ser Lys Arg Pro Met Gly Arg Val Met Glu Pro
115 120 125
Leu Arg Glu Met Gly Ala Asp Leu Gln Gly Asn Glu Ser Asp Gln Tyr
130 135 140
Leu Pro Ile Thr Val Thr Gly Thr Arg Ser Leu Ser Thr Ile Arg Tyr
145 150 155 160
Asn Met Pro Val Ala Ser Ala Gln Val Lys Ser Ala Leu Leu Phe Ala
165 170 175
Ala Leu Gln Ala Glu Gly Thr Ser Val Ile Val Glu Lys Glu Arg Ser
180 185 190
Arg Asn His Thr Glu Glu Met Ile Arg Gln Phe Gly Gly Arg Ile Thr
195 200 205
Val Glu Asp Lys Thr Ile Met Val Thr Gly Pro Gln Lys Leu Thr Gly
210 215 220
Gln Gln Ile Thr Val Pro Gly Asp Ile Ser Ser Ala Ala Phe Phe Leu
225 230 235 240
Ala Ala Gly Leu Leu Val Pro Glu Ser Gln Leu Leu Leu Lys Asn Val
245 250 255
Gly Val Asn Pro Thr Arg Thr Gly Ile Leu Asp Val Leu Glu Glu Met
260 265 270
Gly Ala Arg Leu Pro Arg Arg Ile Thr Met Asn Ile Thr Asn Arg Leu
275 280 285
Ile
<210>14
<211>354
<212>PRT
<213>Thermotoga maritima
<400>14
Met Lys Val Phe Pro Lys Pro Phe Ala Glu Pro Ile Glu Pro Leu Phe
1 5 10 15
Cys Gly Asn Ser Gly Thr Thr Thr Arg Leu Met Ser Gly Val Leu Ala
20 25 30
Ser Tyr Glu Met Phe Thr Val Leu Tyr Gly Asp Pro Ser Leu Ser Arg
35 40 45
Arg Pro Met Arg Arg Val Ile Glu Pro Leu Glu Met Met Gly Ala Arg
50 55 60
Phe Met Ala Arg Gln Asn Asn Tyr Leu Pro Met Ala Ile Lys Gly Asn
65 70 75 80
His Leu Ser Gly lle Ser Tyr Lys Thr Pro Val Ala Ser Ala Gln Val
85 90 95
Lys Ser Ala Val Leu Leu Ala Gly Leu Arg Ala Ser Gly Arg Thr Ile
100 105 110
Val lle Glu Pro Ala Lys Ser Arg Asp His Thr Glu Arg Met Leu Lys
115 120 125
Asn Leu Gly Val Pro Val Glu Val Glu Gly Thr Arg Val Val Leu Glu
130 135 140
Pro Ala Thr Phe Arg Gly Phe Thr Met Lys Val Pro Gly Asp Ile Ser
145 150 155 160
Ser Ala Ala Phe Phe Val Val Leu Gly Ala Ile His Pro Asn Ala Arg
165 170 175
Ile Thr Val Thr Asp Val Gly Leu Asn Pro Thr Arg Thr Gly Leu Leu
180 185 190
Glu Val Met Lys Leu Met Gly Ala Asn Leu Glu Trp Glu Ile Thr Glu
195 200 205
Glu Asn Leu Glu Pro lle Gly Thr Val Arg Val Glu Thr Ser Pro Asn
210 215 220
Leu Lys Gly Val Val Val Pro Glu His Leu Val Pro Leu Met lle Asp
225 230 235 240
Glu Leu Pro Leu Val Ala Leu Leu Gly Val Phe Ala Glu Gly Glu Thr
245 250 255
Val Val Arg Asn Ala Glu Glu Leu Arg Lys Lys Glu Ser Asp Arg Ile
260 265 270
Arg Val Leu Val Glu Asn Phe Lys Arg Leu Gly Val Glu Ile Glu Glu
275 280 285
Phe Lys Asp Gly Phe Lys Ile Val Gly Lys Gln Ser Ile Lys Gly Gly
290 295 300
Ser Val Asp Pro Glu Gly Asp His Arg Met Ala Met Leu Phe Ser Ile
305 310 315 320
Ala Gly Leu Val Ser Glu Glu Gly Val Asp Val Lys Asp His Glu Cys
325 330 335
Val Ala Val Ser Phe Pro Asn Phe Tyr Glu Leu Leu Glu Arg Val Val
340 345 350
Ile Ser
<210>15
<211>431
<212>PRT
<213>Aquifex aeolicus
<400>15
Met Lys Lys Ile Glu Lys Ile Lys Arg Val Lys Gly Glu Leu Arg Val
1 5 10 15
Pro Ser Asp Lys Ser Ile Thr His Arg Ala Phe Ile Leu Gly Ala Leu
20 25 30
Ala Ser Gly Glu Thr Leu Val Arg Lys Pro Leu Ile Ser Gly Asp Thr
35 40 45
Leu Ala Thr Leu Glu Ile Leu Lys Ala Ile Arg Thr Lys Val Arg Glu
50 55 60
Gly Lys Glu Glu Val Leu Ile Glu Gly Arg Asn Tyr Thr Phe Leu Glu
65 70 75 80
Pro His Asp Val Leu Asp Ala Lys Asn Ser Gly Thr Thr Ala Arg Ile
85 90 95
Met Ser Gly Val Leu Ser Thr Gln Pro Phe Phe Ser Val Leu Thr Gly
100 105 110
Asp Glu Ser Leu Lys Asn Arg Pro Met Leu Arg Val Val Glu Pro Leu
115 120 125
Arg Glu Met Gly Ala Lys Ile Asp Gly Arg Glu Glu Gly Asn Lys Leu
130 135 140
Pro Ile Ala Ile Arg Gly Gly Asn Leu Lys Gly Ile Ser Tyr Phe Ash
145 150 155 160
Lys Lys Ser Ser Ala Gln Val Lys Ser Ala Leu Leu Leu Ala Gly Leu
165 170 175
Arg Ala Glu Gly Met Thr Glu Val Val Glu Pro Tyr Leu Ser Arg Asp
180 185 190
His Thr Glu Arg Met Leu Lys Leu Phe Gly Ala Glu Val Ile Thr Ile
195 200 205
Pro Glu Glu Arg Gly His Ile Val Lys Ile Lys Gly Gly Gln Glu Leu
210 215 220
Gln Gly Thr Glu Val Tyr Cys Pro Ala Asp Pro Ser Ser Ala Ala Tyr
225 230 235 240
Phe Ala Ala Leu Ala Thr Leu Ala Pro Glu Gly Glu Ile Arg Leu Lys
245 250 255
Glu Val Leu Leu Asn Pro Thr Arg Asp Gly Phe Tyr Arg Lys Leu Ile
260 265 270
Glu Met Gly Gly Asp Ile Ser Phe Glu Asn Tyr Arg Glu Leu Ser Asn
275 280 285
Glu Pro Met Ala Asp Leu Val Val Arg Pro Val Asp Asn Leu Lys Pro
290 295 300
Val Lys Val Ser Pro Glu Glu Val Pro Thr Leu Ile Asp Glu Ile Pro
305 310 315 320
Ile Leu Ala Val Leu Met Ala Phe Ala Asp Gly Val Ser Glu Val Lys
325 330 335
Gly Ala Lys Glu Leu Arg Tyr Lys Glu Ser Asp Arg Ile Lys Ala Ile
340 345 350
Val Thr Ash Leu Arg Lys Leu Gly Val Gln Val Glu Glu Phe Glu Asp
355 360 365
Gly Phe Ala lle His Gly Thr Lys Glu Ile Lys Gly Gly Val Ile Glu
370 375 380
Thr Phe Lys Asp His Arg Ile Ala Met Ala Phe Ala Val Leu Gly Leu
385 390 395 400
Val Val Glu Glu Glu Val Ile lle Asp His Pro Glu Cys Val Thr Val
405 410 415
Ser Tyr Pro Glu Phe Trp Glu Asp Ile Leu Lys Val Val Glu Phe
420 425 430
<210>16
<211>395
<212>PRT
<213>Helicobacter pylori
<400>16
Met Gly Glu Asp Cys Leu Ser Ser Leu Glu Ile Ala Gln Asn Leu Gly
1 5 10 15
Ala Lys Val Glu Asn Thr Ala Lys Asn Ser Phe Lys Ile Thr Pro Pro
20 25 30
Thr Thr Ile Lys Glu Pro Asn Lys Ile Leu Asn Cys Asn Asn Ser Gly
35 40 45
Thr Ser Met Arg Leu Tyr Ser Gly Leu Leu Ser Ala Gln Lys Gly Leu
50 55 60
Phe Val Leu Ser Gly Asp Asn Ser Leu Asn Ala Arg Pro Met Lys Arg
65 70 75 80
Ile Ile Glu Pro Leu Lys Ala Phe Gly Ala Lys Ile Leu Gly Arg Glu
85 90 95
Asp Asn His Phe Ala Pro Leu Ala Ile Val Gly Gly Pro Leu Lys Ala
100 105 110
Cys Asp Tyr Glu Ser Pro Ile Ala Ser Ala Gln Val Lys Ser Ala Phe
115 120 125
Ile Leu Ser Ala Leu Gln Ala Gln Gly Ile Ser Ala Tyr Lys Glu Ser
130 135 140
Glu Leu Ser Arg Asn His Thr Glu Ile Met Leu Lys Ser Leu Gly Ala
145 150 155 160
Asn lle Gln Asn Gln Asp Gly Val Leu Lys Ile Ser Pro Leu Glu Lys
165 170 175
Pro Leu Glu Ser Phe Asp Phe Thr Ile Ala Asn Asp Pro Ser Ser Ala
180 185 190
Phe Phe Leu Ala Leu Ala Cys Ala Ile Thr Pro Lys Ser Arg Leu Leu
195 200 205
Leu Lys Asn Val Leu Leu Asn Pro Thr Arg Ile Glu Ala Phe Glu Val
210 215 220
Leu Lys Lys Met Gly Ala His Ile Glu Tyr Val Ile Gln Ser Lys Asp
225 230 235 240
Leu Glu Val lle Gly Asp Ile Tyr Ile Glu His Ala Pro Leu Lys Ala
245 250 255
Ile Ser Ile Asp Gln Asn Ile Ala Ser Leu Ile Asp Glu Ile Pro Ala
260 265 270
Leu Ser Ile Ala Met Leu Phe Ala Lys Gly Lys Ser Met Val Arg Asn
275 280 285
Ala Lys Asp Leu Arg Ala Lys Glu Ser Asp Arg Ile Lys Ala Val Val
290 295 300
Ser Asn Phe Lys Ala Leu Gly lle Glu Cys Glu Glu Phe Glu Asp Gly
305 310 315 320
Phe Tyr Ile Glu Gly Leu Gly Asp Ala Ser Gln Leu Lys Gln His Phe
325 330 335
Ser Lys Ile Lys Pro Pro Ile Ile Lys Ser Phe Asn Asp His Arg Ile
340 345 350
Ala Met Ser Phe Ala Val Leu Thr Leu Ala Leu Pro Leu Glu Ile Asp
355 360 365
Asn Leu Glu Cys Ala Asn Ile Ser Phe Pro Thr Phe Gln Leu Trp Leu
370 375 380
Asn Leu Phe Lys Lys Arg Ser Leu Asn Gly Asn
385 390 395
<210>17
<211>395
<212>PRT
<213>Helicobaeter pylori
<400>17
Met Gly Glu Asp Cys Leu Ser Ser Leu Glu Ile Ala Gln Asn Leu Gly
1 5 10 15
Ala Lys Val Glu Asn Thr Ala Lys Asn Ser Phe Lys Ile Thr Pro Pro
20 25 30
Thr Thr Ile Lys Glu Pro Asn Lys Ile Leu Asn Cys Asn Asn Ser Gly
35 40 45
Thr Thr Met Arg Leu Tyr Ser Gly Leu Leu Ser Ala Gln Lys Gly Leu
50 55 60
Phe Val Leu Ser Gly Asp Asn Ser Leu Asn Ala Arg Pro Met Lys Arg
65 70 75 80
Ile Ile Glu Pro Leu Lys Ala Phe Gly Ala Lys Ile Leu Gly Arg Glu
85 90 95
Asp Asn His Phe Ala Pro Leu Val Ile Leu Gly Ser Pro Leu Lys Ala
100 105 110
Cys His Tyr Glu Ser Pro Ile Ala Ser Ala Gln Val Lys Ser Ala Phe
115 120 125
lle Leu Ser Ala Leu Gln Ala Gln Gly Ala Ser Thr Tyr Lys Glu Ser
130 135 140
Glu Leu Ser Arg Asn His Thr Glu Ile Met Leu Lys Ser Leu Gly Ala
145 150 155 160
Asp Ile His Asn Gln Asp Gly Val Leu Lys Ile Ser Pro Leu Glu Lys
165 170 175
Pro Leu Glu Ala Phe Asp Phe Thr Ile Ala Asn Asp Pro Ser Ser Ala
180 185 190
Phe Phe Phe Ala Leu Ala Cys Ala Ile Thr Pro Lys Ser Arg Leu Leu
195 200 205
Leu Lys Asn Val Leu Leu Asn Pro Thr Arg Ile Glu Ala Phe Glu Val
210 215 220
Leu Lys Lys Met Gly Ala Ser Ile Glu Tyr Ala Ile Gln Ser Lys Asp
225 230 235 240
Leu Glu Met Ile Gly Asp Ile Tyr Val Glu His Ala Pro Leu Lys Ala
245 250 255
Ile Asn Ile Asp Gln Asn Ile Ala Ser Leu Ile Asp Glu Ile Pro Ala
260 265 270
Leu Ser Ile Ala Met Leu Phe Ala Lys Gly Lys Ser Met Val Lys Asn
275 280 285
Ala Lys Asp Leu Arg Ala Lys Glu Ser Asp Arg Ile Lys Ala Val Val
290 295 300
Ser Asn Phe Lys Ala Leu Gly Ile Glu Cys Glu Glu Phe Glu Asp Gly
305 310 315 320
Phe Tyr Val Glu Gly Leu Glu Asp Ile Ser Pro Leu Lys Gln Arg Phe
325 330 335
Ser Arg Ile Lys Pro Pro Leu Ile Lys Ser Phe Asn Asp His Arg Ile
340 345 350
Ala Met Ser Phe Ala Val Leu Thr Leu Ala Leu Pro Leu Glu Ile Asp
355 360 365
Asn Leu Glu Cys Ala Asn Ile Ser Phe Pro Gln Phe Lys His Leu Leu
370 375 380
Asn Gln Phe Lys Lys Gly Ser Leu Asn Gly Asn
385 390 395
<210>18
<211>428
<212>PRT
<213>Campylobacter jejuni
<400>18
Met Lys Ile Tyr Lys Leu Gln Thr Pro Val Asn Ala Ile Leu Glu Asn
1 5 10 15
Ile Ala Ala Asp Lys Ser Ile Ser His Arg Phe Ala Ile Phe Ser Leu
20 25 30
Leu Thr Gln Glu Glu Asn Lys Ala Gln Asn Tyr Leu Leu Ala Gln Asp
35 40 45
Thr Leu Asn Thr Leu Glu Ile Ile Lys Asn Leu Gly Ala Lys Ile Glu
50 55 60
Gln Lys Asp Ser Cys Val Lys Ile Ile Pro Pro Lys Glu Ile Leu Ser
65 70 75 80
Pro Asn Cys lle Leu Asp Cys Gly Asn Ser Gly Thr Ala Met Arg Leu
85 90 95
Met Ile Gly Phe Leu Ala Gly Ile Ser Gly Phe Phe Val Leu Ser Gly
100 105 110
Asp Lys Tyr Leu Asn Asn Arg Pro Met Arg Arg Ile Ser Lys Pro Leu
115 120 125
Thr Gln Ile Gly Ala Arg Ile Tyr Gly Arg Asn Glu Ala Asn Leu Ala
130 135 140
Pro Leu Cys Ile Glu Gly Gln Lys Leu Lys Ala Phe Asn Phe Lys Ser
145 150 155 160
Glu Ile Ser Ser Ala Gln Val Lys Thr Ala Met Ile Leu Ser Ala Phe
165 170 175
Arg Ala Asp Asn Val Cys Thr Phe Ser Glu Ile Ser Leu Ser Arg Asn
180 185 190
His Ser Glu Asn Met Leu Lys Ala Met Lys Ala Pro Ile Arg Val Ser
195 200 205
Asn Asp Gly Leu Ser Leu Glu Ile Asn Pro Leu Lys Lys Pro Leu Lys
210 215 220
Ala Gln Asn Ile Ile Ile Pro Asn Asp Pro Ser Ser Ala Phe Tyr Phe
225 230 235 240
Val Leu Ala Ala Ile Ile Leu Pro Lys Ser Gln Ile Ile Leu Lys Asn
245 250 255
Ile Leu Leu Asn Pro Thr Arg Ile Glu Ala Tyr Lys Ile Leu Gln Lys
260 265 270
Met Gly Ala Lys Leu Glu Met Thr Ile Thr Gln Asn Asp Phe Glu Thr
275 280 285
Ile Gly Glu Ile Arg Val Glu Ser Ser Lys Leu Asn Gly Ile Glu Val
290 295 300
Lys Asp Asn Ile Ala Trp Leu Ile Asp Glu Ala Pro Ala Leu Ala Ile
305 310 315 320
Ala Phe Ala Leu Ala Lys Gly Lys Ser Ser Leu Ile Asn Ala Lys Glu
325 330 335
Leu Arg Val Lys Glu Ser Asp Arg Ile Ala Val Met Val Glu Asn Leu
340 345 350
Lys Leu Cys Gly Val Glu Ala Arg Glu Leu Asp Asp Gly Phe Glu Ile
355 360 365
Glu Gly Gly Cys Glu Leu Lys Ser Ser Lys Ile Lys Ser Tyr Gly Asp
370 375 380
His Arg Ile Ala Met Ser Phe Ala Ile Leu Gly Leu Leu Cys Gly lle
385 390 395 400
Glu Ile Asp Asp Ser Asp Cys Ile Lys Thr Ser Phe Pro Asn Phe Ile
405 410 415
Glu lle Leu Ser Asn Leu Gly Ala Arg Ile Asp Tyr
420 425
<210>19
<211>1329
<212>DNA
<213>Xylella fastidiosa
<400>19
atgagtcata gaacgcatga ctattggatc gcacaccagg gcaccccact gcatggtgtc 60
ctgagtatcc ccggcgataa atcaatctcc catcgtgcag tcatgtttgc tgcgcttgcg 120
gatggcacgt cacgtattga tggctttctt gaggcggagg atacgtgctc tacagcagag 180
atcttggccc gattgggtgt gcgtatcgaa actcccttat ccacgcagcg catcgtccat 240
ggtgttggtg tggatggact tcaggcatcg catattcccc tggattgtgg caatgcaggc 300
actggcatgc gcctgctcgc tggtttgctg gtagcgcagc cttttgacag cgtcttagtc 360
ggagatgcat cactgtccaa gcgaccgatg cgacgtgtga cggatccgct gtcacagatg 420
ggcgcacgta tcgataccag tgacgatggc actccaccgc tgcgtattta cggtggtcaa 480
ttactccacg gtatcgattt tatctcccca gtggccagtg ctcagatcaa gtcagcggtg 540
ttgctggctg gattgtatgc acgtaacgaa acggtagtgc gtgaaccgca cccgacgcgt 600
gattacaccg agcgtatgct cactgcgttt ggtgtggaca ttgatgtttc cacagggtgc 660
gcgcgcttgc gtggtgggca acggttatgt gctaccgata ttacaatccc ggctgatttt 720
tcctcagctg cgttttatct ggttgcagcc agcgtgattc ctggctctga tatcaccctg 780
cgtgctgttg gactcaatcc gcgtcgtatt ggtttgttaa ccgtgttgcg gctgatgggg 840
gcaaatattg ttgaatccaa tcgccatgaa cagggtggtg agccggttgt tgacctacgt 900
gtgcgttatg cgccactcca gggcacccgt gttcctgaag atttggtggc ggatatgatt 960
gacgaattcc cggccttgtt tgtcgctgca gcggcagccg aaggtcaaac ggtagtgagt 1020
ggtgcggctg aactacgcgt taaagaatcg gaccggttgg ctgcgatggt gacaggcttg 1080
cgcgtgcttg gcgttcaggt ggatgagacc gccgacgggg caacgattca tggagggccc 1140
atcggtcatg gcaccatcaa cagccatggc gatcaccgca tcgccatggc gttttcaatt 1200
gcaggtcagc tttctgtcag tacagtacgt attgaagatg tcgccaatgt tgcgacttct 1260
tttccagact atgagacgtt agcgcgcagc gctggtttcg gtcttgaggt gtactgcgat 1320
ccagcatga 1329
<210>20
<211>1317
<212>DNA
<213>Xanthomonas campestris
<400>20
atgagcaaca gctcgcaaca ctggatcgca cagcgcggca ccgcgctgca gggcagcctg 60
accattcccg gcgacaagtc ggtttcgcac cgcgcggtga tgttcgccgc actggcggat 120
ggcacctcaa agatcgacgg ctttctggaa ggcgaagaca cgcgttccac cgcggcgatc 180
tttgcccagc tgggcgtgcg cattgaaacg ccgtcggcgt cgcagcgcat cgtgcatggc 240
gtcggtgtgg acggcctaca gccgccgcag gggccgctgg attgtggcaa cgccggcacc 300
ggcatgcgct tgctggccgg cgtgctcgcg gcgcagcggt tcgatagcgt actggtgggc 360
gatgcgtcgt tgtccaagcg gcccatgcgc cgcgtcaccg gcccgctggc gcagatgggt 420
gcacgcatcg aaaccgaatc ggatggcacg ccgccgctgc gtgtccacgg cggccagccg 480
ctgcaaggca ttacgtttgc ctcgccggtg gctagtgcgc aggtcaaatc ggccgtgctg 540
ctggccgggt tgtacgcagc gggtgagacc tcggtgagtg agccgcatcc tacgcgcgac 600
tacaccgaac gcatgctctc cgcattcggc gtggacatcg cgttttctcc tggccaggcg 660
cgtctgcgtg gcggccagcg tttgcgtgcg accgatatcg cggtgccggc agatttttca 720
tcggcggcgt tcttcatcgt ggccgccagc atcattcccg gctcggacgt gactttgcgt 780
gcggtaggtc tgaatccgcg gcgcaccggc cttttggccg ccctgcggct gatgggcgcc 840
gatatcgtgg aagacaatca cgccgaacac ggcggtgagc cggtggcgga cctgcgcgtg 900
cgctacgcac cgctgcaggg cgcgcagatt cccgaagcgc tggtgccgga catgatcgat 960
gagttcccgg cgctattcgt cgccgcagct gcggcgcgcg gcgacacggt cgtcagtggt 1020
gcggcggaat tgcgcgtcaa ggaatccgat cgtctcgccg cgatggccac cggcctgcgg 1080
gcgctcggca ttgtggtgga cgaaacgccg gacggtgcca ccattcacgg cggcacgctg 1140
ggcagcggcg tcatcgaaag ccacggcgat caccgcattg caatggcgtt tgccatcgca 1200
ggccagctgt cgaccgggac ggtacaggtc aacgacgtgg cgaacgtggc cacctcgttc 1260
ccaggcttcg acagcctggc gcagggcgcc gggttcgggc tcagcgcgcg tccgtga 1317
<210>21
<211>1404
<212>DNA
<213>Rhodopseudomonas palustris
<400>21
atgccgaagg ccgcgaggcg ccgcgacgcc aggccgaatc acccgcagcc ccgagggacc 60
accatcttga ctgattcgaa ccagccgatg ccgctgcagg cgcgcaagag cggcgcattg 120
catggcaccg cgcgcgtccc aggcgacaag tcgatttcgc accgggcgct gattctcggc 180
gcgctggcgg tcggcgagac ccgaatctcc ggcttgctcg agggcgaaga cgtcatcaac 240
accgccaaag cgatgcgcgc gctcggtgcc aaggtcgagc gcaccggcga ctgcgaatgg 300
cgcgtgcatg gcgtcggcgt tgcaggcttt gcgacgccgg aggccccgct ggatttcggc 360
aattcgggca ccggctgccg tttggcgatg ggcgcggtgg ccggatcgcc tattgtggcg 420
accttcgacg gcgatgcatc gctgcgcagc cggccgatgc ggcgaatcgt cgatcccttg 480
gagctgatgg gtgccaaggt ggtgtcgagc agcgagggcg gccgattgcc gctggcccta 540
cagggcgccc gcgatccgct gccgattctg taccgcaccc cggtgccgtc ggcgcagatc 600
aaatccgccg tgctgctcgc cggcctgtcg gcgcccggca tcactaccgt gatcgaggcc 660
gaggccagcc gcgaccatac cgagctgatg ctgcagcatt tcggcgccac gatcgtcacc 720
gaagccgaag gtgcccatgg ccgtaagatt tcattaaccg gccagcccga attgcgcggc 780
gccccggtgg tggtgccggc cgatccgtct tcggcggcct ttccgatggt cgcggcgctg 840
gtggtgcccg gctccgatat cgaattgacc gacgtgatga ccaacccgct gcgcaccggg 900
ttgatcacga cgctgcgcga aatgggcgcc tcgatcgagg acagcgacgt ccggggcgat 960
gccggcgagc cgatggcccg gttccgggtg cgcggttcga agctgaaggg cgtcgaggtg 1020
ccgccggaac gcgcgccgtc gatgatcgac gagtatctgg tgctggcggt cgccgctgcg 1080
ttcgccgaag gcaccaccgt gatgcgcggc ctccacgaac tgcgggtcaa ggaaagcgac 1l40
cggctggaag cgacggcggc gatgctgcgg gtcaacggcg tcgcggtcga gatcgcaggc 1200
gacgatctga tcgtcgaggg taagggccat gtgccgggcg gcggtgtggt cgccacccac 1260
atggatcatc gcatcgcgat gtcggctctc gccatgggcc tcgcctcgga caagccggtg 1320
acggtcgacg acaccgcctt catcgccacc agcttcccgg acttcgttcc gatgatgcag 1380
cggctcggcg cggaattcgg ctg 1404
<210>22
<211>1466
<212>DNA
<213>Magnetospirillum magnetotacticum
<400>22
atgttcccca ccctgtgtca aaacgaaaaa gcgtgggcgg tgcagcatgg aacgcaggtc 60
tatgacgcga agggcgcctg tgatagagct tcggcgggca gctttctgcc ttgccgctgg 120
ttatcaggag tgatcatggc caagccgctt tcttcccgta aggccgcacc gttggccggt 180
tcggcgcgag ttccgggcga caaatccatc tcgcaccgcg ccttgatgct gggcgcgctg 240
gcggtgggcg aaagcgtggt gaccggcctt ttggaaggcg acgatgtttt acgcacggct 300
gcctgcatgc gagccttggg ggccgaggtg gagcgtcagg ccgacgggtc gtggcggctg 360
ttcggcaggg gcgtcggtgg gctgatggag ccagccgaca ttctcgacat gggcaattcc 420
gggacgggag cgcgcctgct gatggggctg gtggcgaccc atcccttcac atgtttcttt 480
accggcgatg gctcgctgcg gtcacggccc atgcgccggg tgatcgagcc cctgtcgcgc 540
atgggagcgc gcttcgtcag ccgcgacggc gggcgcctgc ccctggcggt gaccggcacc 600
tcccagccca cccccatcac ttacgagctt cccgtggcct cggcccaggt gaagtcggcc 660
atcatgctgg ctggcctcaa taccgctggc gagaccacgg tgatcgagcg cgaggccacc 720
cgtgaccaca ccgaactgat gctcaggaat ttcggcgcta ccgtgcgggt cgaggatgcc 780
gaaggcggcg gccgggccgt caccgtggtg ggctttcccg aactgaccgg ccgcccggtg 840
gtggtgcccg ccgacccgtc ctcggccgcc ttcccggtgg tggccgccct gctggtggag 900
ggctcggaaa tccgcctgcc cggcgtgggc accaatccct tgcgcaccgg cctgtaccag 960
accctgctgg aaatgggcgc cgatatccgc ttcgacaatc cccgcgatca ggcgggcgag 1020
ccggtggccg atctggtggt gcgtgcttca aggctgaaag gcgtcgacgt ccctgccgag 1080
cgggcgccct ccatgatcga cgaatacccc atcctggccg tggccgccgc cttcgccgag 1140
ggcaccaccc gcatgcgggg gctggccgag cttcgggtca aggaaagcga ccgcctggcc 1200
gccatggcgc gcggactggc cgcctgcggc gtggcggtgg aggaggagaa ggattccctc 1260
atcgttcacg gcacgggacg cattcccgac ggcgacgcca cggtgaccac ccatttcgac 1320
catcgcatcg ccatgtcctt cctggtcatg ggcatggcct cggcccggcc cgtggcggtg 1380
gacgacgccg aagccatcga gaccagcttc cccatcttcg tcgaactgat gaatgggttg 1440
ggggcgaaga tcgaggcgat ggggtg 1466
<210>23
<211>1332
<212>DNA
<213>Caulobacter crescentus
<400>23
atgtcgctgg ctggattgaa gagcgctccc ggaggcgctc tgcgagggat cgtgcgcgct 60
ccgggagaca agtccatttc tcaccgttcg atgatcctgg gcgcgctggc gaccgggacg 120
acgacggtcg aaggtctcct ggaaggggac gacgtcctgg ccaccgcccg ggccatgcag 180
gcctttggcg cgcggatcga acgcgagggc gtcgggcgct ggcggatcga gggcaagggc 240
ggctttgaag agcccgtcga cgtcatcgac tgcggcaacg ccggcaccgg cgtgcgcctg 300
atcatgggcg cggcggcggg ctttgcgatg tgcgccacct tcacgggcga ccagtcgctg 360
cgcggacgcc cgatgggccg ggtgctggat ccgctggccc gcatgggcgc gacctggctg 420
ggtcgcgaca agggccgcct gcccttgacc ctgaagggcg gaaacctgcg cggcctcaac 480
tacaccctgc ccatggcctc ggcccaggtg aagtcggccg tgctgctggc gggcctgcac 540
gccgagggcg gcgtcgaggt catcgagcct gaagccacgc gcgaccacac cgagcggatg 600
ctgcgcgcct tcggggctga ggtgatcgtc gaggaccgca aggccggcga caagaccttc 660
cgccatgtgc gcctgcctga ggggcagaaa ctgaccggaa cccacgtggc cgtgccgggc 720
gacccctcgt cggccgcgtt cccgctggtg gcggccctga tcgttcccgg ctcggaagtg 780
acggtcgagg gcgtgatgct caacgaactg cgcacgggtc tcttcaccac cctgcaggag 840
atgggcgcgg atctcgtgat ctcgaacgtg cgcgtcgcca gcggcgagga ggtcggcgac 900
atcaccgcgc gctactccca gctcaagggc gtcgtcgtgc cgcccgagcg cgcgccgtcg 960
atgatcgacg agtatccgat cctggccgtg gccgcggctt ttgcgtccgg cgagacggtg 1020
atgcgcggcg tcggcgagat gcgcgtcaag gaaagcgacc gcatcagcct gaccgccaat 1080
ggcctgaagg cgtgcggggt ccaggtggtc gaggagcctg aaggcttcat cgtcaccggg 1140
accggccagc cgccgaaggg cggggcgacc gtcgtcaccc acggcgacca ccgcatcgcc 1200
atgagccacc tgatcctggg catggccgcc caggcggagg tcgccgtcga cgagccgggc 1260
atgatcgcca ccagcttccc aggcttcgcc gacctgatgc gcggcctggg cgcgacgctg 1320
gcggaggcct ga 1332
<210>24
<211>1338
<212>DNA
<213>Magnetococcus sp.MC-1
<400>24
atgtccagca cccatcccgg acgcaccatc cgtagcggcg ccacgcaaaa cctctccggc 60
accatccgcc ccgccgccga taaatccatc tcccaccgct ccgtgatctt tggcgccctg 120
gccgaaggcg aaacccacgt taaaggcatg ctggaaggcg aagatgtgct gcgtaccatc 180
accgcctttc gtaccatggg tatctctatc gaacgctgca acgaaggtga ataccgcatc 240
caaggccaag gactcgacgg cctaaaagaa cccgatgacg tgctggatat gggtaactcc 300
ggtaccgcca tgcgcctgct gtgcggcctg ctggccagcc aaccctttca ctctatcctc 360
accggcgatc actccctacg cagccgcccc atgggccgcg tagtgcaacc cctaaccaaa 420
atgggcgctc gcatccgtgg ccgcgacggt ggccgcctgg cccccctcgc catcgaaggc 480
actgaactgg tacccattac ctacaatagc cccatcgcct cggcccaagt gaagtccgcc 540
attatcctgg ccggactcaa taccgccggc gaaaccacca tcattgaacc cgccgtcagc 600
cgcgaccaca ccgaacgtat gctcatcgcc ttcggtgccg aagtgacccg cgatggcaac 660
caagtgacca tcgaaggctg gcccaacctg caaggccaag agatcgaagt gcccgccgat 720
atctccgccg ccgccttccc catggtggcc gcccttatca ccccaggatc tgatattatc 780
ctggaaaatg tgggtatgaa cccaacccgt accggtattc tcgacctgct cctggctatg 840
ggcggcaata tccaacgcct caacgaacgg gaagttggcg gcgaacccgt ggccgaccta 900
caggtgcgct actcccaact ccaaggcatc gagatagacc ccaccgtggt gccccgtgcc 960
attgatgagt tccccgtgtt ttttgtagcc gccgccctcg cccaaggcca aaccctggtg 1020
caaggcgccg aagagctgcg cgttaaagag agcgaccgca tcaccgccat ggccaacggt 1080
cttaaagccc taggtgccat catagaagaa cgccccgatg gcgcacttat taccggaaat 1140
cccgacggtc tggccggtgg ggccagcgta gactccttta ccgaccaccg tatcgccatg 1200
agcctgctgg tggccggcct gcgctgtaaa gagtccgtat tggtgcaacg ctgcgataat 1260
atcaatacct cctttcccag cttttcccaa ttaatgaaca gtcttggttt tcaattggag 1320
gatgtcagcc atggctga 1338
<210>25
<211>1287
<212>DNA
<213>Enterococcus faecalis
<400>25
atgagggtgc aactacgtac aaatgtgaag catttacaag ggactctgat ggttcctagc 60
gacaaatcga tttcccatag aagtattatg tttggagcga tttcttctgg aaaaacgacg 120
attacaaatt ttctaagagg cgaagattgt ttaagtacct tagcggcgtt tcgttcttta 180
ggtgtgaaca ttgaagatga cgggacgaca atcaccgttg aggggcgagg atttgcaggc 240
ttaaaaaagg cgaagaatac aattgatgtt ggaaattcag ggacaacaat tcgtctgatg 300
ctgggcattt tagctggctg tccctttgaa acgcgcctag ctggtgatgc gtctattgcc 360
aaacgaccaa tgaatcgtgt aatgcttcct ttaaaccaaa tgggagcgga atgtcaaggg 420
gttcagcaaa cggagtttcc gccaatttct attcgcggga ctcaaaattt gcaaccgatt 480
gactacacaa tgcctgttgc aagtgctcaa gttaaatcgg ctattttatt cgccgctttg 540
caagccgagg gcacttctgt agtggttgag aaagaaaaga cacgtgatca tacagaagag 600
atgattcgac aatttggtgg gacacttgaa gtagacggta aaaaaattat gttaactgga 660
ccgcaacaat taacaggtca aaatgtggta gttcctggtg atatctcttc tgcagctttc 720
tttttagttg cgggtttagt agtcccagat agcgagatac ttctgaaaaa tgttggctta 780
aatcaaacgc ggacaggtat tttagatgtg attaaaaaca tgggcggttc cgtcactatt 840
ttaaatgaag atgaggccaa tcattctggc gatttacttg taaaaacgag tcaattaaca 900
gctacagaga ttggtggcgc tattatccca cgtttaattg atgagttacc gattattgct 960
ttgttagcta ctcaggctac tggcacgaca atcattcgag atgcagaaga attgaaagtc 1020
aaagaaacca atcggattga tgcagtagcg aaagaattaa caattttagg cgccgacatc 1080
acgcctactg atgatggctt aattatacat ggaccaactt ctttacatgg tggaagagtt 1140
accagttatg gggatcatcg tatcgggatg atgttacaaa ttgctgcatt acttgtaaaa 1200
gaaggcactg ttgaattaga taaggctgaa gcagtttcag tttcttatcc agcatttttt 1260
gacgacttag aacgtttaag ttgttaa 1287
<210>26
<211>1287
<212>DNA
<213>Enterococcus faecalis
<400>26
atgagggtgc aactacgtac aaatgtgaaa catttacaag ggactctgat ggttcctagc 60
gacaaatcga tttcccatag aagtattatg tttggagcaa tttcttctgg aaaaacgacg 120
attacaaatt ttctaagagg cgaagattgt ttaagtacct tagcggcgtt tcgttctttg 180
ggtgtgaaca ttgaagatgt cgggacgaca atcaccgttg aggggcaagg atttgcaggt 240
ttaaaaaagg cgaagaatac aattgatgtt ggaaattcag ggacaacaat tcgcctaatg 300
ctgggcattt tagctggctg tccctttgaa acgcgcctag ctggtgatgc gtctatttct 360
aaacgaccga tgaatcgtgt gatgcttcct ttaaaccaaa tgggagcgga atgtcaaggg 420
gttcagcaaa cggagtttcc gccaatttct attcgcggga ctcaaaattt gcaaccgatt 480
gactacacaa tgcctgttgc gagtgctcaa gtgaaatcgg ctattttatt cgccgctttg 540
caagccgagg gcacttctgt agtggttgag aaagaaaaga cacgtgatca tacagaagag 600
atgattcgac aatttggtgg gacacttgaa gtagacggta aaaaaattat gttaactgga 660
ccgcaacaat taacaggtca aaatgtggta gttcctggtg atatctcttc tgcagctttc 720
tttttagttg cgggtttagt agtcccagat agcgagatac ttctgaaaaa tgttggctta 780
aatcaaacgc ggacaggtat tttagatgtg attaaaaaca tgggtggttc cgtcactatt 840
ttaaatgaag atgaggccaa tcactctggc gatttacttg taaaaacgag tcaattgaca 900
gctacagaga ttggtggcgc tattatccca cgtttaattg atgagttacc gattattgct 960
ttgttagcta ctcaggctac tggcacgaca atcattcgag atgcagaaga attgaaagtc 1020
aaagaaacca atcggattga tgcagtagcg aaagaattaa caattttagg cgccgacatc 1080
acgcctactg atgatggctt aattatacat gggccaactt ctttacatgg tggaagagtt 1140
accagttatg gggatcatcg tatcgggatg atgttacaaa ttgctgcatt acttgtaaaa 1200
gaaggcactg ttgaattaga taaggctgaa gcagtttcag tttcttatcc agcatttttt 1260
gacgacttag aacgtttaag ttgttaa 1287
<210>27
<211>870
<212>DNA
<213>Enterococcus faecium
<400>27
atgcgattat tacaacaaat acatggatta agagggactg ttaggatacc agcagataaa 60
tcgatttctc atcgcagcat catgtttgga gcaattgctg agggaacgac gactatacaa 120
aattttttgc gcgcagaaga ttgtctgagt actttacatg ccttccaaca attaggcgtc 180
gagatcgaag aagaggaaga ggtgatcaag attcatggtc gcggtagcca ctcctttgtc 240
caaccaactg cacccatcga catgggaaac tccggtacga cgagtcgttt attgatgggt 300
attttggctg gacagccttt tacaacgact ctggtcggtg atgcttcgtt gtctaaacgt 360
ccaatggggc gagtgatgga gcctttacgc gagatgggtg ctgacttgca aggaaatgaa 420
agtgatcagt atctaccaat cactgtgaca ggaacccgct ctttatcaac tatccgatac 480
aatatgcctg tagctagtgc acaggtcaaa tctgctttgc tgtttgcggc actacaagca 540
gaaggcacat ccgtaatcgt tgagaaagaa cgttcccgta accatacgga agaaatgatt 600
cgtcaatttg gtggaaggat cacagtggaa gataaaacaa tcatggtgac aggaccgcaa 660
aaattaaccg gtcagcagat aactgttcca ggtgatattt catcagctgc attctttcta 720
gcagcaggac ttcttgttcc ggaaagccag ctgttgttaa aaaatgtcgg ggtcaatcca 780
acaaggaccg gtatcttaga tgtgctagag gagatgggcg cacgattacc cagacgaatc 840
acaatgaaca taaccaatcg gctgatttaa 870
<210>28
<211>1065
<212>DNA
<213>Thermotoga maritima
<400>28
atgaaggtct ttccgaagcc cttcgctgag ccaatagaac ctctcttctg tggaaactcc 60
ggaacaacca cgaggttgat gagtggagtt cttgcttcat acgagatgtt cacagtgctt 120
tatggggatc cttctctctc cagaaggccg atgagaagag tgatcgaacc tctggagatg 180
atgggagcgc gtttcatggc gaggcagaac aactaccttc ccatggccat caaaggaaat 240
cacctttccg gtatcagtta caaaacaccg gtggcgagcg ctcaagtgaa gagcgctgtt 300
cttctggcgg ggctcagagc cagcggacga acaatcgtta tcgaaccagc aaaaagcaga 360
gatcacacgg aaaggatgct caaaaacctc ggtgttcccg tcgaggtgga gggaacacgt 420
gtggttctgg agcctgctac cttcaggggt ttcacgatga aagtccctgg tgatatctcg 480
tcggctgctt tcttcgtggt tctcggcgcc attcatccca acgctcgaat cacagtaacg 540
gacgttggcc tgaatcccac ccgaacggga ctcctcgaag ttatgaaact catgggagcc 600
aacctggagt gggagatcac ggaagaaaat cttgaaccga taggaactgt gagggttgag 660
acatctccaa acctgaaagg tgtggttgtt cccgaacacc tcgtacctct catgatagat 720
gaactgcctc ttgtggcgct tctcggtgtt tttgcggaag gagaaacggt tgtgagaaac 780
gcggaggagt tgagaaagaa ggaatccgac aggataaggg ttctggtgga aaacttcaaa 840
cggctcggtg tcgaaataga agagttcaaa gatggtttca agatcgttgg aaagcagagc 900
ataaaaggtg gatcggtgga tccagaaggc gaccacagaa tggctatgct cttttccata 960
gcagggctcg tgagtgaaga gggggttgat gtgaaagatc acgaatgcgt ggcggtgtct 1020
ttcccgaact tttacgaact gctggagaga gtggtgatat catga 1065
<210>29
<211>1296
<212>DNA
<213>Aquifex aeolicus
<400>29
atgaaaaaaa tcgagaaaat aaagagagtt aaaggagaac tcagagttcc ctccgacaag 60
tccataaccc acagggcttt tatactgggg gcactcgcaa gcggtgaaac tctagtaagg 120
aaacctctaa tctctggaga cacactggcc actttagaaa tcctgaaagc catcagaaca 180
aaagtaaggg aaggaaaaga agaagtctta attgagggaa ggaattacac ctttttagaa 240
cctcatgacg tactcgacgc taaaaactct gggactacgg cgaggattat gagcggtgta 300
ctttctacac agcccttctt cagcgtcctt acgggggacg aaagcctgaa aaacagaccg 360
atgctgagag tggtggagcc cttgagagag atgggggcta agatagatgg aagggaggag 420
gggaataaat taccgatagc cataagggga ggaaacttaa agggaatttc ctacttcaat 480
aaaaagtcct cagctcaagt aaagagtgcc ctcctgcttg cggggctgag agccgaaggt 540
atgaccgaag ttgtagaacc ttacctttct cgtgatcaca cagagagaat gttaaagctc 600
ttcggagcag aagtgataac tattcctgaa gaaaggggac acatagtaaa aataaaagga 660
ggacaggaac ttcagggaac ggaagtttac tgtcctgcgg atccctcctc tgcggcgtac 720
tttgcggcac tcgctacgct cgctcctgaa ggggagataa gactaaaaga agttctcctg 780
aatcctaccc gtgacggatt ttacagaaaa ctcatagaaa tgggagggga tatttccttt 840
gaaaactaca gggaactttc caacgaacct atggctgatc ttgtagtaag acccgttgat 900
aacttaaaac ccgtaaaggt ttctcctgaa gaagtaccta ctttaataga cgagattccc 960
atccttgcgg ttcttatggc ttttgcagac ggagtatcgg aggtaaaggg agcgaaggaa 1020
ctcaggtaca aggaaagtga caggataaag gctatagtca caaacctaag gaagctcgga 1080
gtacaggttg aggaatttga ggacggcttt gcaattcacg ggactaaaga gataaaggga 1140
ggagtgatag aaaccttcaa agatcacagg atagcgatgg cttttgcagt gctcggattg 1200
gtcgttgaag aggaagttat aatagaccac cccgaatgcg ttaccgtgtc ttaccccgag 1260
ttctgggagg atatcttaaa agtagtggag ttctaa 1296
<210>30
<211>1188
<212>DNA
<213>Helicobacter pylori
<400>30
atgggagaag attgtttaag ctctttagaa atcgctcaaa atttaggggc taaagtggaa 60
aataccgcca aaaattcttt taaaatcaca cccccaacaa ctataaaaga gcctaataag 120
attttaaatt gcaacaattc tggcactagc atgcgtttat acagcgggct tttaagcgct 180
caaaaaggcc tttttgtttt aagcggggac aattccctaa acgcacgccc catgaaaaga 240
atcattgagc ctttaaaggc gtttggggca aagattttag ggagagagga taaccatttt 300
gcccccttag cgattgtagg gggtccttta aaagcttgcg attatgaaag ccctatcgct 360
tcagctcaag tcaaaagcgc ttttatttta agcgccttac aagctcaagg cataagcgcc 420
tataaagaaa gcgagcttag ccgtaaccac acagaaatca tgcttaaaag tttgggggct 480
aacattcaaa atcaagacgg cgttttaaaa atttcacccc tagaaaaacc cctagaatcc 540
tttgacttta ccatagccaa tgatccgtct agcgcgtttt ttttagctct cgcttgcgcg 600
attacgccaa aaagccgcct tcttttaaaa aatgtcttgc tcaaccccac tcgcatagaa 660
gcttttgagg ttttgaaaaa aatgggcgct catatagaat atgttatcca atccaaagat 720
ttagaagtta ttggcgatat ttacatagag catgcccctt taaaagcgat cagtattgat 780
cagaatatcg ccagccttat tgatgaaatc cccgctttaa gcatcgctat gctttttgca 840
aaaggcaaaa gcatggtgag aaacgctaaa gatttacgag ccaaagaaag cgataggatt 900
aaagcggttg tttctaattt caaagcttta gggattgagt gcgaagaatt tgaagacggg 960
ttttatatag agggattagg agatgcgagt caattaaagc agcatttttc taagattaaa 1020
ccccctatta tcaagagttt caatgatcac aggattgcga tgagtttcgc tgttttaact 1080
ttagcgttgc ctttagaaat tgataattta gaatgcgcga acatttcttt cccaaccttt 1140
cagctttggc tcaatctatt caaaaaaagg agtctcaatg gaaattaa 1188
<210>31
<211>1188
<212>DNA
<213>Helicobacter pylori
<400>31
atgggagaag attgtttaag ctctttagaa atcgctcaaa atttaggggc taaagtggaa 60
aataccgcca aaaattcttt taaaatcaca cccccaacaa ctataaagga gcctaacaag 120
attttaaatt gcaacaattc tggcacaacc atgcgtttat acagcgggct tttaagcgct 180
caaaaagggc tttttgtttt aagcggggac aattccttaa acgcacgccc catgaaaaga 240
atcattgagc ctttgaaggc ttttggggca aaaattttag ggagagagga taaccatttc 300
gcccccttag tgatcttagg gagtccgtta aaagcttgcc attatgaaag ccctatcgct 360
tcagctcaag tcaaaagcgc ttttatttta agcgccttac aagctcaagg cgcaagcact 420
tataaagaaa gcgagcttag ccgtaaccac acagaaatca tgcttaaaag tttgggagct 480
gatattcaca atcaagacgg cgttttaaaa atttcacccc tagaaaaacc cctagaagcc 540
tttgatttta cgatagctaa tgatccgtct agcgcgtttt ttttcgccct cgcttgcgcg 600
attacgccaa aaagccgcct tcttttaaaa aatgtcttgc tcaaccccac tcgcatagaa 660
gcttttgaag ttttgaaaaa aatgggtgct tccatagagt atgcgattca gtccaaagat 720
ttagaaatga ttggcgatat ttatgtagag catgcccctt taaaagcgat caatattgat 780
caaaatatcg ccagtcttat tgatgaaatc cccgctttaa gtatcgctat gctttttgca 840
aaaggcaaaa gcatggttaa aaacgctaaa gatttacgag ctaaagaaag cgacaggatt 900
aaagcggttg tttctaattt caaagcttta gggattgagt gcgaagagtt tgaagatggg 960
ttttatgtag agggattaga agatataagc ccattaaaac agcgcttttc taggattaag 1020
ccccccctta tcaaaagctt caatgaccac aggattgcga tgagttttgc tgttttaact 1080
ttagcgttgc ctttagaaat tgataattta gaatgcgcaa acatttcttt cccgcaattc 1140
aaacacctac tcaatcaatt caaaaaaggg agtcttaatg gaaattaa 1188
<210>32
<211>1287
<212>DNA
<213>Campylobacter jejuni
<400>32
atgaaaattt acaaattgca aacccctgta aatgctatac ttgaaaatat agcagcagat 60
aaaagcatat ctcatcgttt tgctatattt tcgcttttaa cacaagaaga aaataaggct 120
caaaattatc tcttagctca agatacttta aacactcttg aaattataaa aaatcttgga 180
gctaaaattg aacaaaaaga ttcttgcgtc aaaattatac cccctaaaga aattttatct 240
ccaaattgta ttttagactg tggaaattca ggaactgcta tgcgtttgat gataggattt 300
ttagcaggaa tttctggttt ttttgtttta agtggagata agtatttaaa caatcgtcct 360
atgagaagga taagcaaacc acttactcaa ataggcgcta gaatttatgg aagaaatgag 420
gcaaatttag ctccactttg tatagaaggt caaaaattaa aagcttttaa ttttaaaagc 480
gaaatttctt cggctcaagt taaaacagct atgattttat ctgcttttag ggctgataat 540
gtatgcactt ttagtgaaat ttctcttagt cgaaatcata gtgaaaacat gctaaaggct 600
atgaaagctc caataagggt tagtaatgat ggcttaagtc ttgaaataaa tcctttaaaa 660
aaacctttaa aagctcaaaa tataatcatt cctaatgatc cttcttcggc tttttatttt 720
gttttagcag ctattatttt acctaaatct caaattattt taaaaaatat tttgcttaat 780
cctactcgta tagaggcgta taaaattttg caaaaaatgg gtgccaaact tgaaatgaca 840
ataactcaaa atgattttga aactattggt gagatcaggg tggagtctag caagcttaat 900
ggcatagaag ttaaagataa tatcgcttgg ttaatagatg aagcgcctgc tttggctata 960
gcttttgctt tggctaaggg taaatctagt ttaataaatg ctaaagaatt acgcgttaaa 1020
gaaagcgata ggattgctgt gatggttgaa aatctaaagc tttgtggtgt tgaagctaga 1080
gaacttgatg atggttttga aatagaaggt ggatgcgaac taaaatcttc aaaaattaaa 1140
agctatggag atcaccgtat tgctatgagt tttgctattt taggtttgct ttgtggaatc 1200
gagattgatg atagtgattg tataaaaact tcttttccaa attttataga gattttatca 1260
aatttaggag ctaggattga ttattga 1287
<210>33
<211>1233
<212>DNA
<213>人工序列
<220>
<223>利用大豆密码子设计的Thermatoga EPSPS编码序列
<400>33
atgttgtccg taccacctga caagagcata actcacagag cacttatctt gtcagctctg 60
gcagagactg aatctactct ctacaacctg ttacgttgtc tggacaccga gcgcacgcac 120
gatattctgg agaaactcgg tacgaggttc gaaggagatt gggaaaagat gaaggtgttt 180
ccgaagccct ttgccgagcc tatcgaacca ctgttctgtg gaaactcagg gactactact 240
aggttaatgt ccggcgttct tgcgtcatac gaaatgttta cagtgcttta cggtgatccg 300
agtctatcaa gacgacctat gaggagagtt attgagccct tggagatgat gggcgctcgg 360
ttcatggctc gccagaacaa ctacctacct atggctatca aaggaaacca tctatctgga 420
atttcctata agacgccagt tgcgtctgct caagtcaagt cggcagttct acttgccggt 480
cttcgagcaa gcgggagaac tatcgtaatc gaaccagcga aatcgcgtga ccatacggag 540
aggatgctca agaacctcgg tgtgccagta gaggttgaag gaactcgtgt ggttctcgaa 600
ccagctactt tcagaggctt cacgatgaag gtgcctggtg atatatctag tgctgccttc 660
ttcgtggttc tgggtgcaat ccaccccaat gcgagaatca ccgtcacaga cgttgggtta 720
aaccctacta ggaccggact cctggaagtt atgaagctaa tgggtgccaa tttggagtgg 780
gaaatcaccg aggaaaacct tgagcctatc ggaacagtta gagtggaaac atcgcctaac 840
ctgaaaggag tggtcgttcc tgagcacctt gttccactta tgattgatga gttgccgctc 900
gtcgctctcc tgggtgtctt cgcggaagga gagacagttg tcagaaacgc agaagagcta 960
aggaagaagg aatcagatcg gatcagagtg ctcgttgaga atttcaagcg attgggtgtg 1020
gaaattgaag agttcaaaga cggcttcaag atcgtcggca aacagtcgat caaaggaggt 1080
tcagttgatc cggaaggaga ccacagaatg gctatgctgt ttagtatagc cggacttgtg 1140
tccgaggaag gtgtggacgt aaaagatcac gaatgtgtcg ctgtgagctt tccaaacttc 1200
tacgagttgc tagaaagagt cgttatctct taa 1233
<210>34
<211>1332
<212>DNA
<213>人工序列
<220>
<223>利用拟南芥密码子设计的Caulobacter EPSPS编码序列
<400>34
atgtccctag cgggtctgaa gtctgctccc ggtggagcac taagagggat cgtgcgcgct 60
ccaggcgata agtcaattag tcaccggtcc atgattctag gtgctctggc aaccggtaca 120
actaccgttg aagggctatt ggaaggcgat gacgtacttg cgactgccag agctatgcaa 180
gccttcggtg cacggataga gcgagagggt gtcggacgct ggcgtatcga aggcaaaggt 240
ggctttgagg aaccggttga cgtgattgat tgtgggaacg ctggcaccgg tgtacgactc 300
attatgggtg cagccgcagg gttcgcaatg tgtgccacct tcactggaga tcaatctcta 360
agaggacgac caatgggcag agtgttagat cctctcgcca ggatgggtgc gacatggcta 420
ggacgggata aaggacggct cccacttaca ctcaagggtg gaaatcttcg tggactgaac 480
tacacacttc cgatggcctc ggctcaagtt aagtcagcag tattgcttgc cggactccac 540
gcggaaggtg gagttgaagt catcgagcct gaagctacga gagaccacac agaacggatg 600
cttagggctt tcggagcaga agtaatcgtt gaggaccgta aggctggtga taagacattc 660
cgccatgtga ggctgcctga gggacagaaa ctcacgggca cgcacgttgc ggtcccaggc 720
gatccgtcat ctgccgcgtt cccactggtt gctgcgctga tagtgcctgg ttcggaagta 780
actgtggaag gtgtcatgct caacgaactt cgaacagggt tgttcactac gttacaggag 840
atgggagctg atctggtcat ctccaacgtt cgtgtagcct caggcgagga agtaggagac 900
atcactgcgc gatattcgca gctaaaaggt gttgtagtgc cacctgagcg tgctccgtct 960
atgatcgacg aatacccgat actcgccgtc gcagccgcgt tcgcttctgg cgaaaccgtg 1020
atgagaggtg taggagagat gcgggtcaaa gagagcgacc gtatcagctt gacggccaac 1080
ggtcttaagg cttgcggagt tcaagtagtg gaggaacctg agggctttat tgttacgggt 1140
actgggcaac caccgaaagg aggtgccacc gtggtcacgc atggagatca ccgcattgct 1200
atgagtcacc taatcttggg gatggcagct caagcagagg tcgcggtgga tgaacccggt 1260
atgatagcca ctagcttccc aggattcgcg gatctgatga gagggttagg agcaacgttg 1320
gcagaggctt ga 1332
<210>35
<211>1341
<212>DNA
<213>人工序列
<220>
<223>利用拟南芥密码子设计的Xanthomonas EPSPS编码序列
<400>35
atgagttccg ttagtaccgc ttgcatgagt aactccactc agcactggat cgcgcagcgc 60
gggactgccc ttcaaggctc acttactatc cctggtgata agtccgttag tcatagagct 120
gttatgtttg ctgcacttgc tgacgggatt agcaagatcg acggattcct agaaggtgag 180
gataccagga gtaccgctgc catcttcgca caacttggcg tgcgtattga aacaccttct 240
gcgtcgcaac ggatcgtcca cggagtcgga gttgacggcc ttcaaccacc tcagggtcct 300
cttgactgcg gaaacgccgg cactggaatg agactgctgg ctggtgtact tgcagcccag 360
cggttcgact cagtcctcgt tggagacgct tcgctctcga aacgtcccat gagacgagtg 420
accggcccgc ttgctcagat gggtgctaga atcgagacgg agtccgacgg tacacctcca 480
ctcagggtcc acggtgggca agcacttcaa ggcatcactt tcgcgtctcc agtcgcttcc 540
gctcaagtca aatctgcagt cctgcttgct ggactctacg ctactggaga gacatctgtg 600
tccgaaccgc atcccactag agattacacc gagagaatgc tatcagcctt cggagtagag 660
atcgcgttta gtccaggaca agcgagattg cgtggaggcc agcgcttgcg tgctacagat 720
attgctgtgc ctgctgactt ctcctcagca gcattcttca tcgtcgctgc ctctatcatt 780
cctggttctg gagttaccct cagggctgtt ggactcaatc ctagacgcac cggtctcttg 840
gcagcgctca ggctaatggg cgccgatatt gttgaggaca atcacgccga gcacggaggt 900
gagccagtgg ccgatctgcg tgttcgatac gcacccttgc gtggtgctca gattccagaa 960
gccctggttc cggatatgat cgacgagttt ccggccttgt tcgtcgctgc cgctgcggca 1020
cgaggtgata cggttgtgtc tggtgctgca gaactaaggg tcaaggaatc tgacaggctt 1080
gcagcgatgg ctactgggct ccgagcatta gggattgttg tcgatgagac acctgatgga 1140
gcaacaattc acggcggtac actcggttcc ggtgtaatcg aatctcatgg agatcatagg 1200
atagctatgg cattcgctat cgctggtcag ctatcaaccg gtacggttca agtcaacgat 1260
gtggctaacg tagccacctc cttcccagga ttcgactcgt tagctcaggg tgcgggattc 1320
gggcttagtg cacgtccctg a 1341
<210>36
<211>1331
<212>DNA
<213>人工序列
<220>
<223>利用单子叶植物密码子设计的Caulobacter EPSPS编码序列
<400>36
atgagcctag ccggtcttaa gtccgctcct ggcggtgccc ttcgcgggat cgtgagggct 60
cccggtgaca agagcatctc acataggtcg atgattctag gcgcgttagc aaccgggact 120
acaactgttg agggcctcct tgagggtgac gacgtcctcg ccaccgctag ggcgatgcaa 180
gccttcggtg cccggatcga acgcgaggga gtgggcagat ggcggattga gggcaagggt 240
ggctttgagg aacccgtaga cgtgattgat tgcggaaacg cgggcactgg tgtgcgtttg 300
attatgggcg ctgccgctgg cttcgcgatg tgtgccacct ttaccggtga ccagtcactg 360
cgcggtaggc cgatgggacg ggttctcgac cctctcgcca gaatgggcgc tacctggctg 420
ggaagggata agggtaggtt gccactcacg ctgaaaggtg gcaatctgcg cggactcaac 480
tacacgctgc cgatggcgtc cgctcaagtt aagtctgccg ttctccttgc tggcctgcac 540
gctgaaggtg gcgtggaagt catcgagcct gaggcgacgc gcgatcacac cgagcgcatg 600
ttgcgtgcat tcggtgccga ggtcatcgtg gaggatagga aggctggcga caagacgttc 660
aggcacgtcc gtctgccaga gggccagaag ctcaccggca ctcacgttgc tgtacccggt 720
gacccgtcct ctgccgcgtt cccgctcgtg gctgcactga tcgtcccagg ctctgaggtc 780
accgtggagg gcgtgatgct caacgaactt agaacaggac tgtttaccac gctccaagaa 840
atgggagcgg accttgtgat ctccaacgtt cgtgtcgcct ctggagagga agtgggcgat 900
attaccgctc ggtactcgca gctcaagggc gtcgtggtcc cacctgagag agcaccaagt 960
atgatcgacg aatatccgat cctggcggtc gcggcagcgt tcgccagcgg tgagaccgtt 1020
atgcgcggcg tcggtgagat gcgcgtgaag gagtcggatc gaatcagtct cactgcaaac 1080
gggctgaaag cctgcggcgt tcaagtggtt gaggaacccg agggattcat cgttaccggg 1140
acagggcagc ctcccaaggg aggagccact gtcgttaccc acggagatca ccggattgct 1200
atgtcacatc ttattcttgg gatggccgct caggctgagg tcgcagtcga tgagcctggg 1260
atgatagcca ctagcttccc tgggttcgca gacctgatgc gcgggttagg cgcgacactc 1320
gccgaggctt g 1331
<210>37
<211>1316
<212>DNA
<213>人工序列
<220>
<223>利用单子叶植物密码子设计的Xanthomonas EPSPS编码序列
<400>37
atgagcaact ccacccagca ctggatcgcc cagcgcggca ccgccctcca gggtagcctg 60
acgatccctg gtgacaagtc agtgagccat agggccgtga tgttcgctgc cctagccgac 120
gggattagca agattgacgg cttcctagag ggcgaggata cgcgctcgac tgctgcgatc 180
ttcgcacagc ttggcgttag gatcgagaca cccagcgcgt cgcagaggat cgtccacggc 240
gttggagtgg acggcttgca acctcctcag ggacccttgg attgcggcaa cgcaggcact 300
gggatgaggc tgctcgcagg cgtcctggca gctcagcgtt tcgactctgt cctggtgggt 360
gacgcctctt tgtccaagcg tccgatgagg agagtcaccg gtccgcttgc ccaaatgggt 420
gcgaggatcg agaccgagtc cgacggtacg cctccactcc gggtgcacgg aggccaggcg 480
ctgcaaggga tcacctttgc ctctcccgtc gcttccgccc aagtcaagag tgctgtcctg 540
ctcgctggcc tttacgccac aggcgaaacc tcggttagcg agcctcaccc gacccgcgac 600
tacactgagc gaatgctgtc ggcgttcggc gtggagattg cgtttagccc agggcaagcg 660
agacttcgcg gtggtcagcg gcttcgcgca actgacatcg ccgttccagc cgacttcagt 720
tctgctgcat tctttatcgt cgctgctagc atcattcccg gatctggcgt cacgctccgt 780
gctgtcggac tgaacccacg gaggactggc ctccttgctg ccctccgatt gatgggtgcg 840
gacatcgtgg aggacaatca cgctgagcac ggcggtgagc cggttgccga cctgcgcgtt 900
cgctatgcac cgctgcgagg tgcgcagatt ccggaagcgc tggttcccga catgatcgac 960
gagttccctg ccctctttgt cgcagccgct gcggcacgcg gcgatactgt ggtatccgga 1020
gctgcggagc tgagggtgaa agaatccgat agactcgcgg ctatggcaac tgggctccgc 1080
gctctaggga tagtggttga cgagactccc gatggtgcca cgatccacgg cggaacatta 1140
gggagtggtg tgatagaatc acatggcgat caccgcattg ctatggcttt cgctatcgcc 1200
gggcagcttt caacagggac agtgcaagtc aacgatgtgg ccaatgtggc gacgtccttc 1260
ccagggttcg atagtcttgc ccagggagcc gggttcggat taagtgcccg tccttg 1316
<210>38
<211>210
<212>DNA
<213>人工序列
<220>
<223>编码小麦GBSS CTP的修饰的多核苷酸序列
<400>38
atggcggcac tggtgacctc ccagctcgcg acaagcggca ccgtcctgtc ggtgacggac 60
cgcttccggc gtcccggctt ccagggactg aggccacgga acccagccga tgccgctctc 120
gggatgagga cggtgggcgc gtccgcggct cccaagcaga gcaggaagcc acaccgtttc 180
gaccgccggt gcttgagcat ggtcgtctgc 210
<2t0>39
<211>1578
<212>DNA
<213>人工序列
<220>
<223>与CP4 EPSPS编码序列融合的编码小麦GBSS CTP的多核苷酸
<400>39
atggcggcac tggtgacctc ccagctcgcg acaagcggca ccgtcctgtc ggtgacggac 60
cgcttccggc gtcccggctt ccagggactg aggccacgga acccagccga tgccgctctc 120
gggatgagga cggtgggcgc gtccgcggct cccaagcaga gcaggaagcc acaccgtttc 180
gaccgccggt gcttgagcat ggtcgtctgc atgctacacg gtgcaagcag ccggccggca 240
accgctcgca aatcttccgg cctttcggga acggtcagga ttccgggcga taagtccata 300
tcccaccggt cgttcatgtt cggcggtctt gccagcggtg agacgcgcat cacgggcctg 360
cttgaaggtg aggacgtgat caataccggg aaggccatgc aggctatggg agcgcgtatc 420
cgcaaggaag gtgacacatg gatcattgac ggcgttggga atggcggtct gctcgcccct 480
gaggcccctc tcgacttcgg caatgcggcg acgggctgca ggctcactat gggactggtc 540
ggggtgtacg acttcgatag cacgttcatc ggagacgcct cgctcacaaa gcgcccaatg 600
ggccgcgttc tgaacccgtt gcgcgagatg ggcgtacagg tcaaatccga ggatggtgac 660
cgtttgcccg ttacgctgcg cgggccgaag acgcctaccc cgattaccta ccgcgtgcca 720
atggcatccg cccaggtcaa gtcagccgtg ctcctcgccg gactgaacac tccgggcatc 780
accacggtga tcgagcccat catgaccagg gatcataccg aaaagatgct tcaggggttt 840
ggcgccaacc tgacggtcga gacggacgct gacggcgtca ggaccatccg ccttgagggc 900
aggggtaaac tgactggcca agtcatcgat gttccgggag acccgtcgtc cacggccttc 960
ccgttggttg cggcgctgct cgtgccgggg agtgacgtga ccatcctgaa cgtcctcatg 1020
aacccgacca ggaccggcct gatcctcacg cttcaggaga tgggagccga catcgaggtg 1080
atcaacccgc gcctggcagg cggtgaagac gttgcggatc tgcgcgtgcg ctcctctacc 1140
ctgaagggcg tgacggtccc ggaagatcgc gcgccgtcca tgatagacga gtatcctatt 1200
ctggccgtcg ccgctgcgtt cgccgaaggg gccacggtca tgaacggtct tgaggaactc 1260
cgcgtgaagg aatcggatcg cctgtcggcg gtggccaatg gcctgaagct caacggtgtt 1320
gactgcgacg agggtgagac ctcactcgtg gtccgtggcc ggcctgatgg caagggcctc 1380
ggcaacgcca gtggagcggc cgtcgccacg cacctcgatc atcgcatcgc gatgtccttc 1440
ttggtgatgg gtctcgtctc agagaacccg gtgaccgtcg atgacgccac gatgatagcg 1500
acgagcttcc cagagttcat ggatctgatg gcgggcctcg gggccaagat cgaactgtct 1560
gacacgaagg ccgcttga 1578
<210>40
<211>1527
<212>DNA
<213>人工序列
<220>
<223>与编码Xanthomonas EPSPS的人工序列融合的编码小麦GBSS CTP的多核苷酸
<400>40
atggcagcgc tggtgactag ccagctcgcc acaagcggca ccgtcctgtc ggtgacggac 60
cgcttccggc gtcccggctt ccagggactg aggccacgga acccagcgga cgctgccctc 120
gggatgagga cggtgggcgc gtccgctgcg cccaagcaga gtaggaagcc acatcgcttc 180
gaccgtcggt gcttgagtat ggtcgtctgc atgagcaact ccacccagca ctggatcgcc 240
cagcgcggca ccgccctcca gggtagcctg acgatccctg gtgacaagtc agtgagccat 300
agggccgtga tgttcgctgc cctagccgac gggattagca agattgacgg cttcctagag 360
ggcgaggata cgcgctcgac tgctgcgatc ttcgcacagc ttggcgttag gatcgagaca 420
cccagcgcgt cgcagaggat cgtccacggc gttggagtgg acggcttgca acctcctcag 480
ggacccttgg attgcggcaa cgcaggcact gggatgaggc tgctcgcagg cgtcctggca 540
gctcagcgtt tcgactctgt cctggtgggt gacgcctctt tgtccaagcg tccgatgagg 600
agagtcaccg gtccgcttgc ccaaatgggt gcgaggatcg agaccgagtc cgacggtacg 660
cctccactcc gggtgcacgg aggccaggcg ctgcaaggga tcacctttgc ctctcccgtc 720
gcttccgccc aagtcaagag tgctgtcctg ctcgctggcc tttacgccac aggcgaaacc 780
tcggttagcg agcctcaccc gacccgcgac tacactgagc gaatgctgtc ggcgttcggc 840
gtggagattg cgtttagccc agggcaagcg agacttcgcg gtggtcagcg gcttcgcgca 900
actgacatcg ccgttccagc cgacttcagt tctgctgcat tctttatcgt cgctgctagc 960
atcattcccg gatctggcgt cacgctccgt gctgtcggac tgaacccacg gaggactggc 1020
ctccttgctg ccctccgatt gatgggtgcg gacatcgtgg aggacaatca cgctgagcac 1080
ggcggtgagc cggttgccga cctgcgcgtt cgctatgcac cgctgcgagg tgcgcagatt 1140
ccggaagcgc tggttcccga catgatcgac gagttccctg ccctctttgt cgcagccgct 1200
gcggcacgcg gcgatactgt ggtatccgga gctgcggagc tgagggtgaa agaatccgat 1260
agactcgcgg ctatggcaac tgggctccgc gctctaggga tagtggttga cgagactccc 1320
gatggtgcca cgatccacgg cggaacatta gggagtggtg tgatagaatc acatggcgat 1380
caccgcattg ctatggcttt cgctatcgcc gggcagcttt caacagggac agtgcaagtc 1440
aacgatgtgg ccaatgtggc gacgtccttc ccagggttcg atagtcttgc ccagggagcc 1500
gggttcggat taagtgcccg tccttga 1527
<210>41
<211>1542
<212>DNA
<213>人工序列
<220>
<223>与Caulobacter EPSPS编码序列融合的编码小麦GBSS CTP的多核苷酸
<400>41
atggcagcgc tggtgactag ccagctcgcc acaagcggca ccgtcctgtc ggtgacggac 60
cgcttccggc gtcccggctt ccagggactg aggccacgga acccagcgga cgctgccctc 120
gggatgagga cggtgggcgc gtccgctgcg cccaagcaga gtaggaagcc acatcgcttc 180
gaccgtcggt gcttgagtat ggtcgtctgc atgagcctag ccggtcttaa gtccgctcct 240
ggcggtgccc ttcgcgggat cgtgagggct cccggtgaca agagcatctc acataggtcg 300
atgattctag gcgcgttagc aaccgggact acaactgttg agggcctcct tgagggtgac 360
gacgtcctcg ccaccgctag ggcgatgcaa gccttcggtg cccggatcga acgcgaggga 420
gtgggcagat ggcggattga gggcaagggt ggctttgagg aacccgtaga cgtgattgat 480
tgcggaaacg cgggcactgg tgtgcgtttg attatgggcg ctgccgctgg cttcgcgatg 540
tgtgccacct ttaccggtga ccagtcactg cgcggtaggc cgatgggacg ggttctcgac 600
cctctcgcca gaatgggcgc tacctggctg ggaagggata agggtaggtt gccactcacg 660
ctgaaaggtg gcaatctgcg cggactcaac tacacgctgc cgatggcgtc cgctcaagtt 720
aagtctgccg ttctccttgc tggcctgcac gctgaaggtg gcgtggaagt catcgagcct 780
gaggcgacgc gcgatcacac cgagcgcatg ttgcgtgcat tcggtgccga ggtcatcgtg 840
gaggatagga aggctggcga caagacgttc aggcacgtcc gtctgccaga gggccagaag 900
ctcaccggca ctcacgttgc tgtacccggt gacccgtcct ctgccgcgtt cccgctcgtg 960
gctgcactga tcgtcccagg ctctgaggtc accgtggagg gcgtgatgct caacgaactt 1020
agaacaggac tgtttaccac gctccaagaa atgggagcgg accttgtgat ctccaacgtt 1080
cgtgtcgcct ctggagagga agtgggcgat attaccgctc ggtactcgca gctcaagggc 1140
gtcgtggtcc cacctgagag agcaccaagt atgatcgacg aatatccgat cctggcggtc 1200
gcggcagcgt tcgccagcgg tgagaccgtt atgcgcggcg tcggtgagat gcgcgtgaag 1260
gagtcggatc gaatcagtct cactgcaaac gggctgaaag cctgcggcgt tcaagtggtt 1320
gaggaacccg agggattcat cgttaccggg acagggcagc ctcccaaggg aggagccact 1380
gtcgttaccc acggagatca ccggattgct atgtcacatc ttattcttgg gatggccgct 1440
caggctgagg tcgcagtcga tgagcctggg atgatagcca ctagcttccc tgggttcgca 1500
gacctgatgc gcgggttagg cgcgacactc gccgaggctt ga 1542
<210>42
<211>36
<212>DNA
<213>Thermotoga maritima
<400>42
ctagtccata tgctgagcgt tcctccggac aaatcc 36
<210>43
<211>37
<212>DNA
<213>Thermotoga maritima
<400>43
ctgatctgat catcatgata tcaccactct ctccagc 37
<210>44
<211>34
<212>DNA
<213>Caulobacter sp.
<400>44
caagcatatg tcgctggctg gattgaagag cgct 34
<210>45
<211>40
<212>DNA
<213>Caulobacter sp.
<400>45
ggggagatct ctcgagttat caggcctccg ccagcgtcgc 40
<210>46
<211>29
<212>DNA
<213>Xanthomonas campestris
<400>46
ccacatatga gcaacagcac gcaacactg 29
<210>47
<211>29
<212>DNA
<213>Xanthomonas campestris
<400>47
caactcgagt cacggacgcg cgctgagcc 29
<210>48
<211>28
<212>DNA
<213>Campylobacter jejuni
<400>48
ctagtccata tgaaaattta caaattgc 28
<210>49
<211>30
<212>DNA
<213>Campylobacter jejuni
<400>49
ctgatcggat cctcaataat caatcctagc 30
<210>50
<211>33
<212>DNA
<213>Helicobacter pylori
<400>50
ctagtccata tgatagagct tgacattaac gcc 33
<210>51
<211>40
<212>DNA
<213>Helicobacter pylori
<400>51
ctgatcggat ccttaatttc cattgagact cctttttttg 40