一种TEL基因在调控玉米农艺性状中的应用(一)技术领域
本发明涉及一种可以调控玉米生长的基因及其在转基因玉米改良中的应用。这种
基因可以用来在玉米中表达而调控玉米的株高、生物量、生长势、粒重和灌浆等产量相关性
状,进而提高玉米产量。
(二)背景技术
通过转基因可以改良农作物的性状,如获得抗虫能力、抗除草剂能力,提高产量、
增强抗干旱、抗病能力等。在农作物生产中,改良农作物的性状仍然是农作物新品种培育中
的重要内容,具有重要的价值。而通过基因工程方法改良农作物是目前农作物改良的一种
重要手段。
除了抗虫、抗除草剂转基因农作物以外,高产也是转基因农作物改良的重要内容。
例如,利用转基因表达一种植物的转录因子(Transcription factor)可以提高农作物的产
量(美国专利7,598,529,4)。但是利用其他基因和途径提高农作物产量仍然十分需要。
Mei2蛋白质是酵母(Schizoacccharomyces pombe)从有丝分裂到减数分裂转变的
必要基因(Watanabe and Yamamoto1994,Cell,78:487-498)。Mei2的主要特征是包含三个
RNA的识别区域,并且能够和RNA结合。在植物中普遍发现Mei2的相似基因,它们保留了这些
RNA识别区域,但是它们的功能可能和酵母可能有所不同。通过基因的进化分析,Jeffares
等将植物中的Mei2类基因可以分成2种类型(Jeffares et.al,Dev Genes Evol,2004,214:
149-158)。一种是AML型(AML1-like),类似拟南芥(Arabidopsis thaliana)的AML基因
(Hirayama et al.1997,FEBS Lett 413:16–20);另外一种是TEL型(TEL-like),类似玉米
(Zea mays)的“terminal ear1”基因(Veit et al.,Nature 393:166–168)。
玉米的Mei2的同源基因“terminal ear1”(TEL-1)在植物的芽和根的分生组织中
表达,失去TE1”基因功能的特变体玉米的叶片形态和叶片生长的位置不正常,说明其可能
参与决定植株空间结构形态的形成(Veit et al.,Nature 393:166–168)。水稻中的Mei2的
同源基因“PLASTOCHRON2”的功能和玉米TEL-1相似。Taiji等发现失去“PLASTOCHRON2”基因
功能的水稻特变体的叶片生长位置不正常,同时植株矮小,说明其功能是调控叶片的生长
位置和叶片的成熟(Taiji等,The Plant Cell,18:612–625)。
Yves Hatzfeld等发现利用组成型启动子GOS2启动PLA2基因(即玉米TE1基因在水
稻中的同源基因)在水稻中过表达能显著增加种子数量、提高收获指数和粒重。但是PLA2及
其同源基因在玉米中过表达的效果,以及利用组织特异性启动子调控PLA2及其同源基因在
玉米中过表达的效果还未见任何报道。
(三)发明内容
本发明目的是提供一种利用TEL基因调控玉米产量相关性状的方法,该方法包括
将包含在植物中驱动表达的启动子与TEL序列功能性连接DNA载体转化玉米,其中所述的启
动子为组织特异性启动子。
本发明采用的技术方案是:
本发明提供一种TEL基因在调控玉米农艺性状中的应用。
进一步,本发明所述TEL基因编码的氨基酸序列与SEQ ID NO:1至少有58%,70%,
80%,90%同源性。氨基酸序列的相同性可以通过现有的方法获得,例如Karlin和
Altschul,1990,Porc.Natl.Acad.Sci.USA 87:3364;Karlin和Altschul(1993)
Proc.Natl.Acad.Sci.USA 90:5873-5877.)。本发明提供的TEL基因序列为完整的TEL基因
或者是部分TEL基因片段。更优选所述TEL基因的核苷酸序列为SEQ ID NO:2所示,其编码蛋
白的氨基酸序列为SEQ ID NO:3所示。
编码本发明功能蛋白质的基因的多核苷酸序列可以有多种不同的变异。多核苷酸
序列的变异包括但不限于:1)由于同一个氨基酸的不同密码子而获得的不同的多核苷酸序
列,这些序列编码具有相同活性的蛋白质多肽;2)来源于生物的遗传多态性(genetic
polymorphism),即同一种植物的不同个体或者群体之间的多样性;3)通过人工操作导入多
核苷酸序列的变异。人工导入的这种变异可以是随机的变异,也可以是针对性的定向变异。
本领域的一般技术人员就能够通过分子生物学的方法产生点突变、插入或者缺失变异等。
通过人工操作导入多核苷酸序列的变异也包括通过GeneShuffling等方法获得仍然具有正
常功能的杂合基因。例如US专利2002/0058249;Stemmer(1994)Proc.Natl.Acad.Sci.USA
91:10747-10751;Stemmer(1994)Nature 370:389-391;Crameri et al.(1997)Nature
Biotech.15:436-438;Moore et al.(1997)J.Mol.Biol.272:336-347;Zhang et al.
(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509;Crameri et al.(1998)Nature 391:288-
291;and U.S.Pat.NOs.5,605,793 and 5,837,458。
进一步,所述的应用是将TEL基因与在植物中驱动表达的组织特异性启动子及DNA
载体连接构建T-DNA载体,并转化玉米,获得农艺性状改良的玉米。
进一步,组成型启动子为在多数或全部组织中保持持续的活性的启动子,如花椰
菜花叶病毒CaMV 35S启动子、GOS2启动子;组织特异性启动子为主要在少部分组织中有活
性的启动子,如水稻谷蛋白启动子Gt1、GluB-4,绿色组织特异性启动子等。本发明所述组织
特异性启动子为在生殖组织特异性表达的启动子。
进一步,本发明提供的组织特异性启动子包括但不限于玉米TE1基因的天然启动
子(命名为pZmTE1)的核苷酸序列为SEQ ID NO:4中第1bp-1389bp的碱基序列所示;玉米和
水稻GA20-氧化酶基因GA20ox-1的启动子(分别命名为pZmGA20ox1和pOsGA20ox1),其序列
分别为SEQ ID:5和SEQ ID:6;玉米(Zea mays)auxin import carrier1(AUX1)基因启动子
(命名为pAUX1),序列为SEQ ID NO:7。植物基因天然启动子的区域可以通过试验获得确定。
一般启动子可以是编码蛋白质的阅读框5'端外面至少0.25kb,或0.5kb,或1.0kb,或2.0kb,
或3.0kb的DNA片段。
本发明提供的组织特异性启动子包括上述启动子及其同源基因中具有类似表达
模式的基因的启动子。来自不同物种中的同源基因往往具有相似的表达模式,这些同源基
因的启动子的转录活性往往也具有类似的模式。本发明提供的组织特异性启动子还包括具
有上述启动子类似强度和分布的转录活性,根据上述启动子修饰或人工合成的启动子。启
动子的转录活性的强弱和分布是通过其序列中一个或多个元件来实现的,而并不是其序列
中每一个碱基都和其功能相关。因此,对一个启动子进行某些序列的增减、变换、甚至只需
要通过截取或人工合成其中一个或多个元件就能实现该启动子启动基因组织特异性表达
的功能。
进一步,所述T-DNA载体还包括CaMV35S增强子。
进一步,所述DNA载体为含耐草甘膦基因EPSPS的双元载体pCambia1300-G10。
进一步,所述T-DNA载体结构为:组织特异性启动子-TEL基因-终止子p35S-
pZmUbi-EPSPS-终止子。
本发明同时也提供了获得能够调控植物产量相关性状,提高植物产量的基因工程
植物的方法。本发明提供的方法包括:1)构建包含表达本发明提供的多核苷酸序列的表达
框。表达框可以通过一个或者几个控制表达的多核苷酸序列与TE1基因或者其同源基因功
能性连接而获得。本发明特别提供了组织特异性启动子用来定量定点的控制目标基因的表
达。2)将表达框导入到植物中,并且获得表达。通过利用组织特异性启动子,使导入的基因
获得最佳的表达量和最好的表达位置,从而达到有效改良植物产量相关性状,提高植物产
量,并且避免由于目标基因的过度和越位表达带来的负面影响。控制基因表达的终止子可
以是提供基因的天然终止子,也可以是从同种植物的其他基因或者其他植物基因的终止
子。常用的终止子包括来源于农杆菌的Octopine合成酶终止子和nopaline合成酶终止子
等。参考文献包括:Guerineau et al.(1991)Mol.Gen.Genet.262:141-144;Proudfoot
(1991)Cell 64:671-674;Sanfacon et al.(1991)Genes Dev.5:141-149;Mogen et al.
(1990)Plant Cell 2:1261-1272;Munroe et al.(1990)Gene 91:151-158;Ballas et al.
(1989)Nucleic Acids Res.17:7891-7903;and Joshi et al.(1987)Nucleic Acids
Res.15:9627-9639。
为了提高基因在目标植物中的表达水平,基因的多核苷酸序列可以进一步修饰和
改变。这些改变包括删除内含子、清除一些可能影响基因正常表达的序列,如隐藏的非成熟
的PolyA信号序列等。根据目标植物的密码子使用情况,编码相同蛋白质多肽的多核苷酸序
列可以优化,以提高其在目标植物中的表达量。
可选的,在DNA表达框中加入一个或多个增强子可以增加TEL编码序列的表达水
平。增强子无论是在基因的上游还是下游,都会对基因的表达起到增强作用。因此,可以通
过增强子来调控本发明中的组织特异性启动子和目标基因构成的表达框,获得具有理想的
目标基因表达强度和表达区域的植物品系。
本发明提供的基因表达框的载体也可以同时包含一个选择标记基因表达框。这个
选择标记基因可以用来选择转化了的细胞,常用的基因包括抗生素抗性基因,如neomycin
phosphotransferase II(NEO)和hygromycin phosphotransferase(HPT)、抗除草剂基因,
如抗草甘膦基因EPSPS等。其他选择标记基因同样可以用作本发明转化的选择标记基因。
目前本领域的一般技术人员能够利用已有的技术将本发明提供的多核苷酸导入
到植物中表达。比较常用的方法是基因枪方法(Klein et al,1987,Nature(London)327:
70-73;U.S.Pat.No.4,945,050))或农杆菌介导方法((De Blaere et al,1987,
Meth.Enzymol.143:277)。但是本发明不限于以上这些方法。
不同植物的转化方法和步骤有所不同。但是,通常通过农杆菌或基因枪将外源基
因导入到植物的未成熟胚、成熟胚、未分化的愈伤组织或原生质体。然后用相应的筛选培养
基进行筛选培养。再进行分化而获得转化芽,经过生根培养基培养就可以获得可以种植的
转基因苗。进一步,抗除草剂转基因植物可以通过喷施除草剂筛选,例如喷施烟嘧磺隆可以
杀灭非转基因的玉米。
本发明还提供了通过在玉米基因组中导入调控元件,增加TE1基因表达的方法。本
发明提供的调控元件可以是增强子。本发明提供的增强子可以是CaMV 35S增强子。把调控
元件定点导入生物基因组中的方法有很多,例如锌指核酸内切酶(ZFN)、类转录激活因子效
应物核酸酶(TALEN)、CRISPR/Cas9技术。
发明同时还提供了利用调控元件获得能够调控植物产量相关性状,提高植物产量
的基因工程植物的方法。1)构建CRISPR/Cas9表达框。表达框可以把CaMV 35S增强子导入到
玉米基因组中的TE1基因表达框前面或者后面,使得TE1基因的表达增强。2)将表达框导入
到植物中,并且获得表达。
与现有技术相比,本发明有益效果主要体现在:本发明第一次发现在玉米中调控
TE1基因及其同源基因的表达可以调控玉米株高、生长势、种子产量等性状的功能;本发明
第一次发现利用调控元件增加TE1基因及其同源基因可以调控玉米株高、生长势、种子产量
等性状,进而提高玉米产量;本发明第一次发现利用组织特异性启动子调控TE1基因及其同
源基因在玉米中过表达可以改良玉米株高、生长势、种子产量等性状,进而提高玉米产量。
(四)附图说明
图1:包含组织特异性启动子和TEL基因连接构成的表达框的T-DNA结构示意图。
pZmUbi为玉米泛素启动子;EPSPS为本研究组克隆到的抗草甘膦基因1174(中国专利,
CN102146371A,SEQ IDNO:26-SEQ ID NO:30中任意一种)。
图2:包含有增强子调控组织特异性启动子和TEL基因连接构成的表达框的T-DNA
结构示意图。pZmUbi为玉米泛素启动子;EPSPS为本研究组克隆到的抗草甘膦基因(中国专
利,CN102146371A);p35S为花椰菜花叶病毒35S启动子,在此有增强子功能。
(五)具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于
此:
本发明的以下实施例所使用的分子生物学和生物化学方法均为已知的技术。在
Ausubel编写的John Wiley and Sons公司出版的Current Protocols in Molecular
Biology,和J.Sambrook等编写Cold Spring Harbor Laboratory Press(2001)出版的
Molecular Cloning:A Labortory Manual,3rd ED.等文献均有详细的说明。
实施例1、玉米中TE1基因表达框的克隆和转化载体的构建
根据基因库中TE1基因多核苷酸序列,设计了PCR引物,从玉米(Zea mays)基因组
中扩增TE1基因。由于TE1基因比较大,全长基因,包括启动子、蛋白质编码区和终止子,通过
2个PCR片段获得。第一个片段包括启动子和部分蛋白质编码区,利用如下PCR引物扩增获
得:ZMte3-13F(5’AAGCTTAGTGCCAATCACTGCGTGAGA)和ZMte-22R(5’
CCTCGGGCTCCTTGAACAGGAA)。第二个片段包括部分蛋白质编码区和终止子,利用如下PCR引
物扩增获得:ZMte-32F(5’TCGCAGGGGACTTGAAGGATGTGA)和ZMte-42R(5’
GGTACCCTATTTAAGATCTCACTTCAAGCTCTATGA)。这二个片段分别克隆到pMD19-T载体中。然后,
第一个片段用HindIII和AatII酶从pMD19-T中切出,第二个片段用AatII和KpnI酶从pMD19-
T中切出。这二个片段同时克隆到农杆菌转化双元载体pCambia1300-G10的HindIII和KpnI
位点之间,获得pCambia1300-p35S-G10-TE1。转化载体中玉米TE1基因表达框的多核苷酸序
列是SEQ ID NO:4。pCambia1300-p35S-G10载体(Internationl Pat.No.PCT/CN2012/
087069:SEQ ID NO.47)包含一个耐草甘膦基因(EPSPS)(作为转化的标记基因),p35S启动
子(作为目标基因的增强子)连入目标基因表达框的多克隆位点。
最后,通过电转的方法把上述T-DNA质粒转入农杆菌LBA4404中,通过含有15μg/ml
四环素和50μg/mL的卡那霉素的YEP固体培养基筛选出阳性克隆,并保菌,用于接下来的植
物转化。
实施例2、玉米TE1基因cDNA的克隆
玉米(Zea mays)TE1基因cDNA的克隆:设计PCR引物ZmTE1-F(5’
GAGGATCCAACAGAATTCATGGGTGGGTTC)和ZmTE1-R(5’GCGGTCTAGATTACTAGTCGTCGTAGCCAAGC),
以商业玉米品种郑单958的总cDNA为模板,通过PCR扩增获得大小约为2kb的TE1的cDNA片
段。PCR反应条件为:95℃3分钟;95℃15秒,58℃15秒,72℃2分钟,重复33个循环;72℃10分
钟。将获得的大约2kb的PCR产物克隆到T-载体pMD19中。然后,通过BamHI和XbaI双酶切得到
ZmTE1,并且DNA序列测定表明其核苷酸序列正确(SEQ ID NO:2)。之后,把酶切获得的cDNA
以及合成的终止子ter1(核苷酸序列为SEQ ID NO:8)通过XbaI连接,获得结构为ZmTE1-
ter1结构的核苷酸序列,用于和本发明中的组织特异性启动子连接。
实施例3、组织特异性启动子的克隆
玉米(Zea mays)赤霉素合成酶基因ZmGA20ox1启动子(pZmGA20ox1)的获得:设计
PCR引物pZmGA20ox1-F(5’TAAGCTTCTGCCATGACGTGATTGTCCCTGGC)和pZmGA20ox 1-R(5’
GGGATCCAGGAGGGAGGAAGCAGAGGAGGAG),以商业玉米品种郑单958基因组为模板,通过PCR扩
增获得pZmGA20ox1。PCR反应条件为:95℃3分钟;95℃15秒,58℃15秒,72℃2分钟,重复30个
循环;然后72℃10分钟。将获得的大约2kb的PCR产物克隆到T-载体pMD19中。然后,通过
HindIII和BamHI双酶切得到相应的启动子pZmGA20ox1,并且DNA序列测定表明启动子的核
苷酸序列正确(SEQ ID NO:6)。
玉米(Zea mays)auxin import carrier1(AUX1)基因启动子(pAUX1)的克隆:人工
合成的AUX1基因启动子,序列为SEQ ID NO:7,通过HindIII和BamHI双酶切得到相应的启动
子pAUX1。
实施例4、玉米种TE1基因cDNA转化载体的构建
双元载体pCambia1300-G10载体(Internationl Pat.No.PCT/CN2012/087069:SEQ
ID NO.49)包含一个耐草甘膦基因(EPSPS)(作为转化的标记基因)和连入目标基因表达框
的多克隆位点。
可以把实施例3中克隆到的组织特异性启动子pZmGA20ox1和pAUX1与实施例2中克
隆到的TEL基因通过BamHI位点连接,形成“组织特异性启动子-TEL基因-终止子-pZmUbi-
EPSPS-终止子”(图1)的T-DNA结构,获得的T-DNA载体分别命名为1300-G10-pZmGA20ox1-
TE1和1300-G10-pAUX1-TE1。
把花椰菜花叶病毒CaMV 35S启动子(命名为p35S)与实施例2中克隆到的TEL基因
通过BamHI位点连接,形成“组成型表达启动子-TEL基因-终止子-pZmUbi-EPSPS-终止子”
(图1)的T-DNA结构,获得的T-DNA载体命名为1300-G10-p35S-TE1。
最后,通过电转的方法把上述3个T-DNA质粒转入农杆菌LBA4404中,通过含有15μ
g/ml四环素和50μg/mL的卡那霉素的YEP固体培养基筛选出阳性克隆,并保菌,用于接下来
的植物转化。
实施例5.具有增强子的组织特异性启动子调控的TEL基因的表达载体的构建
双元载体pCambia1300-p35S-G10载体(Internationl Pat.No.PCT/CN2012/
087069:SEQ ID NO.47)包含一个耐草甘膦基因(EPSPS)(作为转化的标记基因),p35S启动
子(作为目标基因的增强子)与连入目标基因表达框的多克隆位点。
可以把实施例3中克隆到的组织特异性启动子和实施例2中克隆的TEL基因通过
BamHI位点连接,形成“组织特异性启动子-TEL基因-终止子p35S-pZmUbi-EPSPS-终止子”
(图2)的T-DNA结构。获得的T-DNA载体分别命名为1300-p35S-G10-pZmGA20ox1-TE1和1300-
p35S-G10-pAUX1-TE1。
最后,通过电转的方法把上述两个T-DNA质粒转入农杆菌LBA4404中,通过含有15μ
g/ml四环素和50μg/mL的卡那霉素的YEP固体培养基筛选出阳性克隆,并保菌,用于接下来
的植物转化。
实施例6、玉米的转化
玉米的转化方法已经比较成熟,例如Frame等描述了利用农杆菌转化玉米的方法
(Plant Physiol,2002,129:13-22)。分别取实施例1、实施例4和实施例5中获得的农杆菌划
板,挑单菌落接种准备转化用农杆菌。取授粉后8-10天的Hi-II玉米穗。收集所有的未成熟
胚(大小为1.0-1.5mm)。将含有T-DNA载体的农杆菌与未成熟胚共培养2-3天(22℃)。转移
未成熟胚到愈伤诱导培养基上(200mg/L的Timentin杀农杆菌),28℃暗培养10-14天。将所
有的愈伤转到带有2mM草甘膦的筛选培养基上,28℃暗培养2-3周。
转移所有的组织到新鲜草甘膦(浓度为2mM)的筛选培养基上,28℃暗培养2-3周。
然后,转移所有筛选后成活的胚性组织到再生培养基上,28℃暗培养10-14天,每皿一个株
系。转移胚性组织到新鲜的再生培养基上,26℃光照培养10-14天。转移所有发育完全的植
株到生根培养基上,26℃光照培养直到根发育完全,然后移植到温室中单株培养,检测转基
因玉米的抗除草剂能力。
实施例7、TEL基因过表达玉米植株的鉴定
我们使用的转基因受体植株为容易转化,但是农艺性状很差的品种Hi-II。为了准
确的研究转化载体对玉米品系的影响,我们把获得的对照品系和目标载体转基因品系分别
与以商业玉米品种郑单958的母本进行1次杂交和连续回交8次再挑选近等位基因系自交2
次,获得稳定的近等位基因自交系。然后,把对照品系和目标载体转基因品系分别与郑单
958的父本杂交,获得的杂交种子用于比较和分析。
将实施例6获得的转基因玉米植株和空载体对照植株的产量相关性状进行比较分
析。
我们获得的92个转1300-G10-pAUX1-TE1载体的转基因品系(命名为AU)中有17个
品系和对照相比生长势增强、株高显著增加、棒子变大、粒重增加、生物量增加且产量增加。
其中两个典型品系的产量相性状的表型如下如表1。
表1:两个典型品系与对照品系的比较
AU-18
AU-46
|
株高
10.5%
9.5%
千粒重
25.4%
16.4%
生物量
13.1%
11.2%
产量
12.1%
10.8%
*表格中的参数都经过F-Test检验(P≤0.05)且都是和对照相比大于5%的。CK为
只含有筛选标记基因EPSPS的空载体的转基因玉米植株;AU为载体1300-p35S-G10-pAUX1-
TE1的T-DNA转化植株,其中AU后面的编号(18,46)是对不同品系随机编号,用于区分不同的
转化事件。
1300-G10-pZmGA20ox1-TE1载体转基因玉米植株的表型变化和AU类似,15%以上
的转基因植株和空载体对照植株相比产量相关性状都有显著改良且产量增加。另外的品系
和对照相比表型变化都比较小。
我们获得的94个转1300-p35S-G10-pAUX1-TE1载体的转基因品系(命名为SAU)中
有65个品系和对照相比生长势增强、株高显著增加、棒子变大、粒重增加、生物量增加且产
量增加。其中两个典型品系的产量相性状的表型如下如表2。
表2:两个典型品系与对照品系的比较
SAU-3
SAU-85
|
株高
16.5%
25.3%
千粒重
25.9%
30.2%
生物量
14.1%
18.5%
产量
13.2%
14.6%
*表格中的参数都经过F-Test检验(P≤0.05)且都是和对照相比大于5%的。其中
CK为只含有筛选标记基因EPSPS的空载体的转基因玉米植株;SAU为载体1300-p35S-G10-
pAUX1-TE1的T-DNA转化植株,其中SAU后面的编号(3,85)是对不同品系随机编号,用于区分
不同的转化事件。
pCambia1300-p35S-G10-TE1和1300-p35S-G10-pZmGA20ox1-TE1载体转基因玉米
植株的表型变化和SAU类似,65%以上的转基因植株和空载体对照植株相比产量相关性状
都有显著改良且产量增加。另外的品系和对照相比表型变化都比较小,还有个别品系的表
型出现了畸形。
作为对照,我们获得了组成型表达启动子花椰菜花叶病毒35S启动子(p35S)调控
ZmTE1的表达载体1300-G10-p35S-TE1,获得的82个转基因品系中65个品系跟空白载体对照
相比没有表型变化的,17个品系跟空白载体对照相比出现了如严重不育、开花严重延迟、株
型不协调等畸形表型。
SEQUENCE LISTING
<110> 浙江大学
<120> 一种TEL基因在调控玉米农艺性状中的应用
<130>
<160> 8
<170> PatentIn version 3.5
<210> 1
<211> 95
<212> PRT
<213> unknown
<220>
<223> 人工序列
<400> 1
Pro Phe Ser Ser Tyr Asp Phe Leu Tyr Leu Pro Ile Asp Phe Asn Asn
1 5 10 15
Lys Cys Asn Val Gly Tyr Gly Phe Val Asn Leu Thr Ser Pro Glu Ala
20 25 30
Ala Val Arg Leu Tyr Lys Ala Phe His Lys Gln Pro Trp Glu Val Phe
35 40 45
Asn Ser Arg Lys Ile Cys Gln Val Thr Tyr Ala Arg Val Gln Gly Leu
50 55 60
Asp Ala Leu Lys Glu His Phe Lys Asn Ser Lys Phe Pro Cys Asp Ser
65 70 75 80
Asp Glu Tyr Leu Pro Val Val Phe Ser Pro Pro Arg Asp Gly Lys
85 90 95
<210> 2
<211> 1974
<212> DNA
<213> unknown
<220>
<223> 人工序列
<400> 2
atgggtgggt tcccggaagc cacgggtaac cttctcgatg ccgcagctca ggagttccac 60
cctacggtct gtgcccccta tcctctacag ccgcttccgc aacagctata ctgcccccac 120
ccatatccag ccatgccggt gcctccgccg ccgcaaatag ccatgttaca gccagtgcct 180
ccgatggcga tggccatggc gccgcagccg gggtacacct tgccaacgac gacgccggtg 240
gtcaatggcc cgtcgagccg cgtcgtggtg ctgggccttg tcccgccgca cgcgcaggag 300
gccgacgtgg cgcaggcgat ggcgccattc ggcgcgatcc gctcggtcga cgcgtgcgcg 360
gtggcgtccg agggcgtggc caccgtccat ttcttcgaca tccgcgccgc cgagctcgcc 420
ttgacctgtg tccgcgagca gcacatgcgc cagcagagcc gcctcgggca gctctacgcg 480
gcggccgccg tagccccggc gtgggctcct gcaccgacgc cccaggcctg ggactggccc 540
caccccaacg acgacggccg cggcctcgtc ctcgggcacg ccgtgtgggc ccacttcgcc 600
accggcgccg acgacggcga caaccgcggc tccctggtgg tcctgagccc cctgcccggc 660
gtctcggtcg ctgacctccg ccaagtcttc caggccttcg gggacttgaa ggatgtgagg 720
gagtcggcgc agcggcccag ccacaagttc gtggacttct tcgacacgcg cgacgccgcg 780
cgcgcgctcg ccgagctcaa cggccaggag cttttcggcc gccgcctcgt cgtcgagttc 840
acgcgccctt ccggccccgg gccccgcagg cgcgggtacg caccccacca gcaccggccc 900
accgcgccga ctccgccgag gcttcaagcg acgtggcgac cgtcccaacc gacgtcgtct 960
cagccgccgg catcctcgtc gtcgtccggt tccgtaaggg cgagggaagg agtggtgctt 1020
ctgaggagga gctcctgtaa gtctagcgcg ggcagcgacc agtcgtccaa gggaggcaat 1080
gccggaacga gccatgagcg caagaccaag ggcggcaaga tcgtggtggc ggcggcggcg 1140
gcatcctcgt cgaccccgac agcgtccggg aagcaaaccc agaaaggcgt cgggagcagc 1200
ggcggcggga gctggaaagg acgaaagagc gggtgggagg cgcgcttcct gttcaaggag 1260
cccgaggccg gcggcggcgc cgacacgcaa gcaacgccgg cttcggagat ggatacgagg 1320
accaccgtca tgatcaggaa cataccgaac aagtacagcc agaagctgct gctcaacatg 1380
ctggacaacc actgcatcca atccaacgag tggatcgtgg cgagcggcga ggagcagccc 1440
ttctccgcct acgatttcgt ctacctcccc atagatttca acaacaagtg taatgtgggc 1500
tacggcttcg tcaacctgac atcgccggag gctcgcgtgc ggctgtacaa ggcgttccac 1560
aagcagccat gggaggtgta caactcgcgc aagatctgcc aagtgacata cgcgcgcgta 1620
caaggcctgg aagcgctgaa ggagcacttc aagaactcca agttcccgtg cgacagcgac 1680
gagtacctgc ccgtggcgtt ctcgccggcg cgcgacggca aggagcttac ggatccagtg 1740
cccatcgtgg gccgctcgcc cgcggcgtcg tccgcgtcgt cgcctcccaa gagccgggcg 1800
gctagcgtgg accggcttgg gcaggagctg atgccggcgc cgtcgtcatc cgcggacggc 1860
gcgtcgtcga ccactacgtc cacccacgcg ccgtccgaac acgacgagga ggaggaggag 1920
ggagacatca ggctcgcagg cgagctgcgg cggcttggct acgacgacta gtaa 1974
<210> 3
<211> 656
<212> PRT
<213> unknown
<220>
<223> 人工序列
<400> 3
Met Gly Gly Phe Pro Glu Ala Thr Gly Asn Leu Leu Asp Ala Ala Ala
1 5 10 15
Gln Glu Phe His Pro Thr Val Cys Ala Pro Tyr Pro Leu Gln Pro Leu
20 25 30
Pro Gln Gln Leu Tyr Cys Pro His Pro Tyr Pro Ala Met Pro Val Pro
35 40 45
Pro Pro Pro Gln Ile Ala Met Leu Gln Pro Val Pro Pro Met Ala Met
50 55 60
Ala Met Ala Pro Gln Pro Gly Tyr Thr Leu Pro Thr Thr Thr Pro Val
65 70 75 80
Val Asn Gly Pro Ser Ser Arg Val Val Val Leu Gly Leu Val Pro Pro
85 90 95
His Ala Gln Glu Ala Asp Val Ala Gln Ala Met Ala Pro Phe Gly Ala
100 105 110
Ile Arg Ser Val Asp Ala Cys Ala Val Ala Ser Glu Gly Val Ala Thr
115 120 125
Val His Phe Phe Asp Ile Arg Ala Ala Glu Leu Ala Leu Thr Cys Val
130 135 140
Arg Glu Gln His Met Arg Gln Gln Ser Arg Leu Gly Gln Leu Tyr Ala
145 150 155 160
Ala Ala Ala Val Ala Pro Ala Trp Ala Pro Ala Pro Thr Pro Gln Ala
165 170 175
Trp Asp Trp Pro His Pro Asn Asp Asp Gly Arg Gly Leu Val Leu Gly
180 185 190
His Ala Val Trp Ala His Phe Ala Thr Gly Ala Asp Asp Gly Asp Asn
195 200 205
Arg Gly Ser Leu Val Val Leu Ser Pro Leu Pro Gly Val Ser Val Ala
210 215 220
Asp Leu Arg Gln Val Phe Gln Ala Phe Gly Asp Leu Lys Asp Val Arg
225 230 235 240
Glu Ser Ala Gln Arg Pro Ser His Lys Phe Val Asp Phe Phe Asp Thr
245 250 255
Arg Asp Ala Ala Arg Ala Leu Ala Glu Leu Asn Gly Gln Glu Leu Phe
260 265 270
Gly Arg Arg Leu Val Val Glu Phe Thr Arg Pro Ser Gly Pro Gly Pro
275 280 285
Arg Arg Arg Gly Tyr Ala Pro His Gln His Arg Pro Thr Ala Pro Thr
290 295 300
Pro Pro Arg Leu Gln Ala Thr Trp Arg Pro Ser Gln Pro Thr Ser Ser
305 310 315 320
Gln Pro Pro Ala Ser Ser Ser Ser Ser Gly Ser Val Arg Ala Arg Glu
325 330 335
Gly Val Val Leu Leu Arg Arg Ser Ser Cys Lys Ser Ser Ala Gly Ser
340 345 350
Asp Gln Ser Ser Lys Gly Gly Asn Ala Gly Thr Ser His Glu Arg Lys
355 360 365
Thr Lys Gly Gly Lys Ile Val Val Ala Ala Ala Ala Ala Ser Ser Ser
370 375 380
Thr Pro Thr Ala Ser Gly Lys Gln Thr Gln Lys Gly Val Gly Ser Ser
385 390 395 400
Gly Gly Gly Ser Trp Lys Gly Arg Lys Ser Gly Trp Glu Ala Arg Phe
405 410 415
Leu Phe Lys Glu Pro Glu Ala Gly Gly Gly Ala Asp Thr Gln Ala Thr
420 425 430
Pro Ala Ser Glu Met Asp Thr Arg Thr Thr Val Met Ile Arg Asn Ile
435 440 445
Pro Asn Lys Tyr Ser Gln Lys Leu Leu Leu Asn Met Leu Asp Asn His
450 455 460
Cys Ile Gln Ser Asn Glu Trp Ile Val Ala Ser Gly Glu Glu Gln Pro
465 470 475 480
Phe Ser Ala Tyr Asp Phe Val Tyr Leu Pro Ile Asp Phe Asn Asn Lys
485 490 495
Cys Asn Val Gly Tyr Gly Phe Val Asn Leu Thr Ser Pro Glu Ala Arg
500 505 510
Val Arg Leu Tyr Lys Ala Phe His Lys Gln Pro Trp Glu Val Tyr Asn
515 520 525
Ser Arg Lys Ile Cys Gln Val Thr Tyr Ala Arg Val Gln Gly Leu Glu
530 535 540
Ala Leu Lys Glu His Phe Lys Asn Ser Lys Phe Pro Cys Asp Ser Asp
545 550 555 560
Glu Tyr Leu Pro Val Ala Phe Ser Pro Ala Arg Asp Gly Lys Glu Leu
565 570 575
Thr Asp Pro Val Pro Ile Val Gly Arg Ser Pro Ala Ala Ser Ser Ala
580 585 590
Ser Ser Pro Pro Lys Ser Arg Ala Ala Ser Val Asp Arg Leu Gly Gln
595 600 605
Glu Leu Met Pro Ala Pro Ser Ser Ser Ala Asp Gly Ala Ser Ser Thr
610 615 620
Thr Thr Ser Thr His Ala Pro Ser Glu His Asp Glu Glu Glu Glu Glu
625 630 635 640
Gly Asp Ile Arg Leu Ala Gly Glu Leu Arg Arg Leu Gly Tyr Asp Asp
645 650 655
<210> 4
<211> 6072
<212> DNA
<213> unknown
<220>
<223> 人工序列
<220>
<221> misc_feature
<222> (821)..(821)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (5464)..(5464)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (5528)..(5528)
<223> n is a, c, g, or t
<400> 4
aagcttagtg ccaatcactg cgtgagaacc ggcggcggtg ctcactgcac aggcgcggac 60
ggtccgcggc caggggccgg acggtctgcg acctggcgca gggcttaggg tttcctgctt 120
gacggtcgga cgatccgcgc ctataggccg gacggtccgc acgtgtgcag ggcagcgaag 180
gtcgtcggtg gcgcctggat ctcgctcccg ggagggaccc cgtcggggag gagagatcct 240
aggtgttgtc taggcttggc aggccgacct agactcctat cgatatagag tcgaagagaa 300
gcggagaatt tggggattgg aaggctaaac tagaactact cctaaatata caagaaataa 360
atacgagata aactggtatt gattcgattg atggtgttta atcggtcggt attcctctgt 420
atttatagag gaggggggct ggacccgtta caaacatatt tttcgagcta attctgtgaa 480
tctagccaac aactatagca agaaactcag aattctaact ggttctgcgc gcgcaaaccg 540
tccgaccctt tatttgatgc tcaccagaac cctgtcttac caatgtattg aaattgattt 600
atggtgaaga tagaaatcta aagttgtaat tcttaaaata aagcactcct aaacagaaca 660
ttaatcttta taattgatat tcgaatattt tagtccggta accgaacgcc cagtaatttg 720
aagaatatgg tctttatttg tagccggcgg catctcgaaa agctagatct aactccgaaa 780
acaaacacgc aaaatctacc ggaaaaatct ccccagcaaa naagcagacg tggggcctgt 840
catgtacgca cggggcatga ctcgtgcaag agcaacaagt gctgtcgttg cagaggatcc 900
gagctaaaac aatccagcac acggccactc tcgtctctcc tcttcctcct cttccctccg 960
taccgcccgc ccttcacctc ctcgactctt ctccaccgcc ccctccctcc tcgcgtctct 1020
ctcccccttt gtccctgtag agctccaaat aaaaccccac cggttttctt ttcccgcggc 1080
aattaccata aaaagagctc ccaatctctc tcctctctcc ggcccctctc tctcgtttct 1140
ggcagcagtg gtgcggtact accaccgctc tcactccaca cacacacacc gagtatacgg 1200
ttaagcagga gagagaacgg gagagtgaga ctgagaccgg gtcccaagta caattctcgc 1260
ctggttcttg atcgaaggca tgatcaagaa tcaccagaaa gttctagatc tttagacggc 1320
agtcttcttt ggactcctcg gtttcttttg ttctgagctc tagccatgga gggtggggga 1380
gggagtggaa tgggtgggtt cccggaagcc acgggtaacc ttctcgatgc cgcagctcag 1440
gagttccacc ctacggtctg tgccccctat cctctacagc cgcttccgca acagctatac 1500
tgcccccacc catatccagc catgccggtg cctccgccgc cgcaaatagc catgttacag 1560
ccagtgcctc cgatggcgat ggccatggcg ccgcagccgg ggtacacctt gccaacgacg 1620
acgccggtgg tcaatggccc gtcgagccgc gtcgtggtgc tgggccttgt cccgccgcac 1680
gcgcaggagg ccgacgtggc gcaggcgatg gcgccattcg gcgcgatccg ctcggtcgac 1740
gcgtgcgcgg tggcgtccga gggcgtggcc accgtccatt tcttcgacat ccgcgccgcc 1800
gagctcgcct tgacctgtgt ccgcgagcag cacatgcgcc agcagagccg cctcgggcag 1860
ctctacgcgg cggccgccgt agccccggcg tgggctcctg caccgacgcc ccaggcctgg 1920
gactggcccc accccaacga cgacggccgc ggcctcgtcc tcgggcacgc cgtgtgggcc 1980
cacttcgcca ccggcgccga cgacggcgac aaccgcggct ccctggtggt cctgagcccc 2040
ctgcccggcg tctcggtcgc tgacctccgc caagtcttcc aggccttcgg tacgcgccac 2100
cgaccgagcc gaccaaccag gcatttcgtt ttcccacgct cgtttcttgt gtttcccgca 2160
gcaattgtat tggcccgtcc tcgtgttcgc aggggacttg aaggatgtga gggagtcggc 2220
gcagcggccc agccacaagt tcgtggactt cttcgacacg cgcgacgccg cgcgcgcgct 2280
cgccgagctc aacggccagg agcttttcgg ccgccgcctc gtcgtcgagt tcacgcgccc 2340
ttccggcccc gggccccgca ggtaaacaac aacgcaattt cagtcagcta gccttcccat 2400
caccctgtgg gcggctgaat ttttgccgtg tgcctgtcgg tcctaggcgc gggtacgcac 2460
cccaccagca ccggcccacc gcgccgactc cgccgaggct tcaagcgacg tggcgaccgt 2520
cccaaccgac gtcgtctcag ccgccggcat cctcgtcgtc gtccggttcc gtaagggcga 2580
gggaaggagt ggtgcttctg aggaggagct cctgtaagtc tagcgcgggc agcgaccagt 2640
cgtccaaggg aggcaatgcc ggaacgagcc atgagcgcaa gaccaagggc ggcaagatcg 2700
tggtggcggc ggcggcggca tcctcgtcga ccccgacagc gtccgggaag caaacccaga 2760
aaggcgtcgg gagcagcggc ggcgggagct ggaaaggacg aaagagcggg tgggaggcgc 2820
gcttcctgtt caaggagccc gaggccggcg gcggcgccga cacgcaagca acgccggctt 2880
cggagatgga tacgaggacc accgtcatga tcaggaacat accgaacaag tacagggtat 2940
ccctgccaat ctccacgttt gttgcaacaa tgctatattt catgggcgac gcacagaatt 3000
gcgattctgc tagctgatgc ccgaggcgtt tgggtcgcag ccagaagctg ctgctcaaca 3060
tgctggacaa ccactgcatc caatccaacg agtggatcgt ggcgagcggc gaggagcagc 3120
ccttctccgc ctacgatttc gtctacctcc ccatagattt caagtgagtt gcgcgctcgg 3180
cttccttctc acataattgc atttagctgt tcgcattgac ttatatttta tggtgcccaa 3240
tgcaagaaca cacacaagct tcccagcctg aattcgggtt gttttcctgg gaatttgttg 3300
ccttgaataa tggttggagt gggaaatgtg ggcggggggg tgggaggcga ggagctggct 3360
gtggaagcgt gagcttcagg atcgaggtat cttatctttg ggtgggtaga gtacagtgca 3420
gcaggcatag atgggctatg gcgttactag cccaaatgga aataaatttg gcagcggcaa 3480
gcaagaccat gccagatcct tctcgttttg atgccccccc atggattctt tggttgcatg 3540
cgcgcatctg ctggctgctg ctgccgctgc cgatggcgag ggagccggcc tgccttcctt 3600
tctcgcggct gctgccgccc ctgggatcgc ctccctgcct gcctttcttg ctttgcacag 3660
ccgtgcactt ccataacgag gccaacacat acaaaaggtg cggcaccgat ggggttgtag 3720
tgttgagact agacagtaga gatagacgct tagctatgga gatggagctg tgaaaaaaaa 3780
agagttgcat gagtatgaaa agggggaaaa agtcagcact ttcgttctaa agagaaaatt 3840
tgaacttcag atcaaagtag ttttctatat gcaaacaaaa tgtatgcttt caagtttgct 3900
tatttaaagc acttgctttt atatataccg ccggcagctt ttctcttgca cgaagcaagt 3960
ttgagaaaag acctatcaat gcccaatgac gagaggacat tagtggctgt caaaaggcat 4020
gcagcttcaa acatactcat gtgtaaagca gctgcagcat aatgccaaag tttttttttg 4080
attgcaagtc tttttagtta ttgttcctcc atgccattac cattctgaat ttcttgccct 4140
tgcatgaaat gagaattttt cttccttatg caaaaatgaa aaaaaacaaa aaaatgcagc 4200
aacaagtgta atgtgggcta cggcttcgtc aacctgacat cgccggaggc tcgcgtgcgg 4260
ctgtacaagg cgttccacaa gcagccatgg gaggtgtaca actcgcgcaa gatctgccaa 4320
gtgacatacg cgcgcgtaca agtacgtact ccactccygc agctgccctt ctcctacatc 4380
tacatccgtc gaagacattt taatgctacg tacgtactta ttgctcacat gtcaatgtta 4440
caattgtgcg gcggcgcagg gcctggaagc gctgaaggag cacttcaaga actccaagtt 4500
cccgtgcgac agcgacgagt acctgcccgt ggcgttctcg ccggcgcgcg acggcaagga 4560
gcttacggat ccagtgccca tcgtgggccg ctcgcccgcg gcgtcgtccg cgtcgtcgcc 4620
tcccaagagc cgggcggcta gcgtggaccg gcttgggcag gagctgatgc cggcgccgtc 4680
gtcatccgcg gacggcgcgt cgtcgaccac tacgtccacc cacgcgccgt ccgaacacga 4740
cgaggaggag gaggagggag acatcaggct cgcaggcgag ctgcggcggc ttggctacga 4800
cgactagctg gctccgatcc tagctgcagc taggcgggcg acgcctagct cagcaacgat 4860
cggcatggcg tggcgtcgct tcgagaagcg cggaggcagt agtgacttcg gccaagcttt 4920
tcacagatcc gtagcgctcg ctcctgcacg cgcaggcgaa gcaagtgaag tggactggga 4980
cttgactttg gagaagcaaa agtgagctga tgttcgttgg ttcgtagacg ctgcgcacag 5040
caggtgtgga gtcgtgttct tttggatttt ggtttgaagt ttcctactac ttgtttcttt 5100
gaaacttgga gctatagcta gcttaggctt agctaggact gctgggaggg gaaagggcat 5160
gcaggggact atcaattcgt ggttcgtcat gcgctcgttc tttacattaa aataagattg 5220
ttattagtac agctttacaa tacttctgca tattcggaga gagactctga tctcatatca 5280
tcacgagttg ctagatttcg gtcggatctc ttcsattgat gcgaaccaac agatctttct 5340
ctatcgctgc acggctccac cgcgctatct ttgcagactc acactgtcct ctcctttgta 5400
gactctagtc ttctcatcct tctatttttc tcaatttaca ttcgatttgt tcaatttaca 5460
tttngttatc ccatcgatct gtgctcactc gtgctaaaaa acaaagatgt aagcgttgcg 5520
taatattnat acagtacaag catatatcta gaaaattcaa attatcttgt gatttgaaat 5580
ggaaaactgt ctcactaata aaaagatatt tgtatcaaat atatatttta tatttttttk 5640
katttatttc ctaacataat agatataata ggwwctatat agtttatatc tatttatcaa 5700
aacttattgt cgtttattta aaahcaatat atatttatcc atatatatat tttttccatg 5760
catggcatct ctatatattt aaatatgtaa ttattttgaa atcttaccct taatcatggt 5820
gcctcttctt gcatcatgtg tcctcagtca tgaatgaatc tattttctct ctcctcaagt 5880
taagttgaga ctcctgagtt tattgtatct ttcattaact ctagtttttt gtattttctt 5940
ataaataaat attttaggtt atagaataag ttcttaagta ctacaatatc ataaaaccat 6000
tgttttaaaa acatgtatca tattattcaa aataagtcat agagcttgaa gtgagatctt 6060
aaatagggta cc 6072
<210> 5
<211> 2071
<212> DNA
<213> unknown
<220>
<223> 人工序列
<400> 5
taagcttctg ccatgacgtg attgtccctg gccggagaga agagtaccat gtctgggcca 60
cacttcggac tgccatgacg aaggacttcg ccataactgc ggtattgccc ccgtataaag 120
atatagttgc ttcgtagctg atcaggaact gctttggatc tgagtgctca tcatacatgg 180
ggagctgagg tggcttgtat gatgggggcc atggagtagc ctttagttct gctgatagag 240
gagaagcatc attaaaagcc aaatttccat gatggaaatc gtcataccaa tcatcatcat 300
tgtaggaatt gtcttgacga agctatcttt gtggaggtct ttggtcctgg tcatcttgag 360
taagatgacg tatttcttaa gcagcttcat cgatcttctt ttgtagatcg gaaagtcgaa 420
gcatcttctc tctcttcctt tcgacctgct aatggatagc ttcgagatcc cttatctcct 480
ggtctagctg ctcctcttgg ggtgttggac ttgtggcctt cctcttttga gtttgagctt 540
cgcgtagtgt gtcctggttg acgtccagtg gctgcagtgc agcccctagc cctgaagaag 600
ttttcttcgg cggcatgacg aaggtcactg cttgccgaag gtggtcgatt gagttcaccg 660
gaggtaggcg ccaatgttgg ggacttgttc tcaaatgcta tgaattaaga acaaggcaac 720
acaaaaatat taatggttaa ggcccttcgt ccttcgaagc attatctccc ttaggatata 780
atgatcttca gacgaaggtc atgaaggacg taccttcatc atcgcagata attattttta 840
ttaatttaat attacctatt tttatgatac tagaacataa taatgtcttc tctactcata 900
taaagcatca gtttcatatg ttgtgcgaca tacgcgaagc acgtaggttt gtttctcgct 960
taccggtggg ccgttaactt acagatgagc cgtgagaaac caccaaaccc aacatgatag 1020
gaagctgcac acaacgcaac gctcttatgt agtaccacac tgctagctga aaaaagtaca 1080
agcgaccgga tgagctataa aaaaagaaat cagatttctt ttcaactcat atctttctta 1140
ccctgttggc taagataaaa tctaatattt attcgtacca gtttaatatc tgatatgttt 1200
ttgtatgaaa ttatttttat aggtattttt ttgtgaagat caaccacatt gatttactag 1260
gccctcgcat atcgcttagt cacattgcat tgctggtagg gtcttttcca ccccaaccgg 1320
tagcatcaaa taagattaaa tggttatggg tcttttccac cccaaccggt agcatcaaat 1380
aagatcaacc gttttttttg gcatgaattc gagctagagc catggcaaag agacctaact 1440
aactcatgta tgttttcttc gatcgaaagt cgaaagttag gttacttgtt gttgttgtga 1500
gtataatata aaaaaaatat aattgacacg cgcgtacagt ataaataagc atgcagtcta 1560
gctggggcac gatggccgac acgaatgaaa cacgtttgtt tgtccggtcg actggaagca 1620
cgacaaggcc gtgctgctga agcagccctg tggcgttcgg cggcctacta agagcccacc 1680
acgcggccct tggcagcttc cgtcccctcc tgatgaagga gaaggagatg aaagggaaag 1740
gagctggatt ggattggatt ggatagatat cgtgtttatt tgtttgagac ggtagttttc 1800
atctaaagtt tattcttcgt cacatgggat ggccgtttgc ttgtttgttg cttccgggag 1860
gcggtggtga attgaagcag atcgacaagc atggctgccc actggtctcg atcgatcggc 1920
ctgccatgcc atgccatgcc actagagtcc gtcctgactg gccgcccgtt cccccgtata 1980
aaaaggcagg caggcaggca gagcggggac gagcaagcaa gcagttgcag ttgcagcggc 2040
ctcctcctct gcttcctccc tcctggatcc c 2071
<210> 6
<211> 1927
<212> DNA
<213> unknown
<220>
<223> 人工序列
<400> 6
aagcttctct cttctatgcc accagttcaa gtttgttatc ccttttatgc cattgccgtc 60
actccaccgt cagttgaccg ttaacttcat agtaaaaaga cgcatttgcc cttgagagtt 120
ggtatacaac caatgatagg tattttaata ctaatatagc tactggatac aacatatgaa 180
aattgattct tttttgcatt atatgcaatt ttagccatca ccatcacaaa taaattttca 240
atataagcat gaaacataca gtttccaaca atatttttaa tacaaagagc attattcatt 300
ggtttggaca aaattttgtt cactcaaaac ggatttaaaa taaaatagtt atgatttttt 360
gaagtttaca cattttttta gttgagaggg catattggtc atttacgaaa aaaactaaca 420
tgcgactaac agtcaactaa tgctgcagtg ctgaggatgg cataaaaggg tagaaaaact 480
taaccagtga tatataaggg agaagccaat tttaattggc gtgtaaggga actggtcaat 540
ttctagtagc atataagaga ttctctctta ttaatatgac agttctcagc ttgtgtatgg 600
cctctcaaag gccatgcttt tatatatttt caccctatca aaactctttt catattagac 660
tacctcagtt tatggtcaat tatatagatc ctattcgaag ccaaccctca atccattttt 720
ttcgcaaatt tgtgtgaagc tggatttaaa atatataatt cttgaattaa atataaacaa 780
ctctcttatt tctattagcc tgttataatt tatatacaac tatatctatt aatttataat 840
ctagaccaac cacaatctag gaatgtaaat ctttctgttt ttcttattaa tgtagtaata 900
atttctaggt ttttgtgaac gcgcaataat ttctaggtct ctctagagta acatgacctt 960
attgcggagt tgtttgtcca gtcatcaatc tggtggtggc acaggcgctg gggtgttttg 1020
tagtttctac ttgagtaaat tgcataaacg tgaatttcac gttttaaaaa tcaaacatgt 1080
gaagtggttg tctaaatctc gacatagcgt catgtcgcag tacaacaaca cttctgcaac 1140
gccagccaaa gaaaaaaaaa cttgcattta gataaccctt gcatgtccaa gataaaattg 1200
gcccaagtga aaaactcaga actacataaa taattttcgc aaatggccaa aactcatttt 1260
tggatgtggt attttgacgt gtgggcatca caggtgcacg tgaaaaccca ttttcacata 1320
tggatctgtt gaggaggctg cttgcaaaac tgatttttgc aggcaggcaa gtaaggactt 1380
tcgactagaa cgattttttt ttttaaaaaa aagaataaac actacagatc caagacccta 1440
tagctagggt aagccgcatg tggccgcggc cgtgtggtcc gttggctggg tacaaagagc 1500
agagtgggct aagcaaatac cgggttgtgg caccatccct ttcacattca ctcgctcttg 1560
atatctttct ctctcatgga aaagaagaga taagtaattt taattgatgc cgggatagag 1620
agagagagag agttaagaag gtagctaggg gagagagcga ggttgatgcc gtgatcgatc 1680
gatcgatctg ttggcgcagc gtgtatataa gggcgggaag gggagtgaga gagagcagca 1740
gctagctagc cgcggtcggt cgatccagct gctggggatg agtacttagt tagctcggag 1800
ctagctacta atggatgata tacttatgct agttagttaa atacagttat tagttagttg 1860
taggttgcat ctatcatatc tccatcggtt aattaattga ttgatagcta gattatcaac 1920
aggatcc 1927
<210> 7
<211> 1933
<212> DNA
<213> unknown
<220>
<223> 人工序列
<400> 7
aagcttacga tgggtagggc aatggtgacg gttagggttt tttcccctaa ttaaaaacag 60
ttttgttgtt ttttggattt ttttggttct taatttaccg agtgcttttt tttgtcgagt 120
gcgcgaaaaa agtactcgac aaagaaccat ttgccgataa ataccgagtg taatactcag 180
caaaggattt gtcgagtgca aaaaggtctc tgccgagtat ttgacacact cgacacagaa 240
ggccggtcca gtagtgtata tgtggagtgt ttacagaatg tcgtccgcag acagtggctt 300
ataagaggag taaataatga tgacgacaaa ttctaactat ggtcactaat atataccacg 360
agggctctgt cccccacacc ccctgcgtgc agggctacat gtgcttacgc tcctgcccaa 420
gcctccctgc gatgggcctc cgctccgctc gccaacacga cctccatatg caaaatttag 480
atcacaaact caacaatctc taccttgaga caaattccat cttgtagcca taacatataa 540
tcaactttct gaataataga agaaacaaac tgctggtgcc aacatagcca ctagggctaa 600
gcaattatac caattaagtt cgagcaaagc tcaaacttaa ccccagaaac atgtttagtc 660
atcatggaag ctagattgaa gtgtgtattg atcatgtata cccttaattt accttccgta 720
actattttcc ggatataatg atacttaata tcaatgtgtt ttgtcctcgt ttgaaacatt 780
tgatcctttg taagataaat aacactctga ctgtcagacc aatgtaaata atgatgacgg 840
cctaagcctc ccgtcgatgg gcctccactt ctctcgacaa cgtgagttcc atatgcagaa 900
tttagattac aaactcaaca attgatatcc aattaagtca cactaggata ctaacatata 960
taaataaatc tgggagccga ggtcagcaat agtgagttgc taaagacaag aggggatggg 1020
agacggcgat gagaatatgg gttgcgttgg aggtgagcag aattttaggc tggcgccggc 1080
tacatttgat aacaaaagaa aaaaaagaat ggaagctagc ttgatctagc ttgtgtagaa 1140
taatgcaata atgcaaggat tatttgcacg tgccccacaa cataattata tatacagaga 1200
aaagaaacat ttttcaatat aacatatatt cttgtttcaa gttgtgttct tccatccaaa 1260
atatgtaaat ggtatatgtg ataaaaacat gcaagggacg atgtgaggag aagatccaag 1320
ccatggaaca cgcatccaac ggacaaacac gttcagttgg atcttttaga gacatcactc 1380
gagtgatgca catactttcc cggccccaaa agaaaaaaaa aggtgatgtg catgcataca 1440
tgcattgccc ccggcccact tagggcttgt tcggttattt ccaatccata cggattagag 1500
gggattgata cggattggag gggattttga cttactggag attgaaaccc cctcaatccc 1560
cctcaatcca tatggattgg ggtagaaccg aacaagccct tataatgtgt ccaggcagaa 1620
cactttcttc gtatgctcta gcaatgcacg ctgctccgtc cttgctttcc acgggatttt 1680
tcaccacgtc ttttgatcac ccgctccttt cgtttgcttt cttgaaccca aataggatcg 1740
agtaatacta tatattaatg ataaaataaa gagaggcggg tagcagccac gtacagtaca 1800
gccccagccc cagaggcccc gcggcccggc atgaaaagaa aggacgctgg gtttctttat 1860
gccccagctg ctggagtgct gtctcccccc cgggacatcg cctctccata tatacgacac 1920
ccccgctgga tcc 1933
<210> 8
<211> 203
<212> DNA
<213> unknown
<220>
<223> 人工序列
<400> 8
tctagatttc tccataataa tgtgtgagta gttcccagat aagggaatta gggttcctat 60
agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg tatttgtaaa 120
atacttctat caataaaatt tctaattcct aaaaccaaaa tccagtacta aaatccagat 180
cccccgaatt aatttgaggt acc 203