技术领域
本发明属于基因工程技术领域,具体地说,涉及一种蒺藜苜蓿多花瓣控制蛋白及其编码的基因与应用。
背景技术
花是被子植物特有的生殖器官,花器官的正常发育直接关系到物种的繁衍,同时还会影响到开花作物的产量、品质、使用价值和经济效益。此外,花大小、形态结构、组成器官的数目等是系统与进化植物学研究中最常用的形态学性状,花器官发育的研究对物种起源和演化研究同样具有重要意义。
蒺藜苜蓿(Medicago truncatula)属于豆科蝶形花亚科,其花为典型的两侧对称蝶形花。近年来,随着蒺藜苜蓿基因组测序的完成及多种人工突变体库的建立,蒺藜苜蓿已经成为研究蝶形花花器官发育的理想模式材料。
目前,通过正、反向遗传学的研究手段,一些蒺藜苜蓿花器官发育ABC模型的相关基因相继被克隆。发现在蝶形花植物百脉根(Lotus japonicas)和豌豆(Pisum sativum)中的研究同样发现蝶形花亚科植物与双子叶模式植物拟南芥在花器官发育调控机制上具有一定的保守性。但由于蝶形花花器官在形态和发育上具有的特异性,以及蝶形花亚科植物存在的基因加倍,基因功能分化,基因表达模式改变以及蛋白功能结构域缺失或获得等问题,使得蝶形花花器官发育调控变得更为复杂。
因此,有必要提供一种植物多花瓣控制基因及其编码的蛋白。
发明内容
有鉴于此,本发明提供了一种蒺藜苜蓿多花瓣控制蛋白及其编码的基因与应用。
为了解决上述技术问题,本发明公开了一种蒺藜苜蓿多花瓣控制蛋白,是如下(a1)或(a2):
(a1)由SEQ ID NO.2所示的氨基酸序列组成的蛋白质;
(a2)将SEQ ID NO.2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与具有相同功能的由SEQ ID NO.2衍生的蛋白质。
本发明还公开了一种编码上述蛋白质的基因。
可选地,所述基因为如下(b1)-(b3)中任一所述的DNA分子:
(b1)编码区如SEQ ID NO.1所示的DNA分子;
(b2)SEQ ID NO.3所示的DNA分子;
(b3)在严格条件下与(b1)或(b2)限定的DNA序列杂交且编码权利要求1所述蛋白质的DNA分子;
(b4)来源于蒺藜苜蓿并且与(b1)或(b2)或(b3)限定的DNA序列具有90%以上同源性且编码权利要求1所述蛋白质的DNA分子。
本发明还公开了一种含有上述基因的重组表达载体、表达盒、转基因细胞系或重组菌。
本发明还公开了一种上述的蛋白质或基因在调控植物多花瓣表型中的应用。
可选地,所述植物为双子叶植物。
可选地,所述双子叶植物为豆科植物。
可选地,所述豆科植物为蒺藜苜蓿。
本发明还公开了一种增加植物花瓣的方法,包括如下步骤:抑制目的植物中上述蛋白质的活性和/或上述基因表达量,得到花瓣增多的转基因植物。
本发明还公开了一种上述的蛋白质、基因或方法在植物育种中的应用。
与现有技术相比,本发明可以获得包括以下技术效果:
1)本发明首次在蒺藜苜蓿中克隆了一个控制蒺藜苜蓿花瓣增多,植株变为有限生长,叶片形态突变,叶柄变短的的基因,该基因为植物中首次发现,为其他物种利用同源基因克隆相关基因提供了基因序列。
2)本发明中克隆的基因也可以为蒺藜苜蓿等豆科植物以及其他双子叶植物的花瓣增多,叶片形态突变,叶柄变短的的基因研究,提供证据。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明蒺藜苜蓿R108野生型花和蒺藜苜蓿pis多花瓣突变体花表型图;其中,A为小花苞时期野生型花苞的侧视图,B和C图分别为野生型幼花的侧视图和俯视图,D和E分别为野生型成熟花的侧视图和俯视图,F为pis突变体小花苞侧视图,G和H分别为pis突变体幼花的侧视图和俯视图,I和J分别为pis突变体成熟花的侧视图和俯视图(J图箭头指示在突变体成熟花内部,除了花瓣增多外,也有花萼着生),K为植株生长后期;L为野生型复叶叶柄,M为突变体复叶叶柄,N为野生型叶片,O为突变体叶片,P为野生型复叶顶部的叶片叶柄,Q为突变体复叶顶部的叶片叶柄;
图2是本发明PIS基因的结构图及突变体中PIS基因表达量检测;其中,A代表PIS基因结构图(包含四个外显子和三个内含子)及各pis各个突变体中Tnt1插入位置,B代表DNA水平鉴定pis突变体;C代表RT-PCR检测各个突变体中PIS全长基因表达量检测。
具体实施方式
以下将配合实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
蒺藜苜蓿R108(野生型):The Nobel Foundation。
pis突变体:The Nobel Foundation。pis-1(NF10617)pis-2(NF21657);
pis-3(NF16829);
实施例1pis突变体的获得及表型分析
通过筛选蒺藜苜蓿Tnt1插入突变体库,获得了一个花瓣增多,雄蕊和雌蕊完全缺失的突变体NF10617,命名为Petals Increased Severely(pis)。
对pis突变体进行细致的表型观察如图1所示。图1中A为小花苞时期野生型花苞的侧视图;B和C图分别为野生型幼花的侧视图和俯视图;D和E分别为野生型成熟花的侧视图和俯视图;F为pis突变体小花苞侧视图;G和H分别为pis突变体幼花的侧视图和俯视图;I和J分别为pis突变体成熟花的侧视图和俯视图(J图红色箭头指示在突变体成熟花内部,除了花瓣增多外,也有花萼着生)。突变体pis与野生型相比,整个花发育时期时期都表现出花苞增大的表型。K图显示,在花发育后期,pis突变体与野生型相比,失去了无限生长能力,突变为以花器官终止的terminal flower有限生长。
另外,突变体的叶片也发生了变化,与野生型相比,复叶叶柄明显变短(图1L,M),叶片边缘凹陷(图1L-Q),复叶顶部的叶片叶柄几乎缺失(图1P,Q)。
实施例2PIS基因的克隆
根据Tnt1网站(https://medicago-mutant.noble.org/mutant/)公布的NF10617的侧翼序列,设计对应的引物,
NF10617-F:5’-CCTCCTCTAACCTGCTCCA-3’;
NF10617-R:5’-TCACCACCTCTTTCCCATTCA-3’;
检测突变体与基因的连锁性。最终我们发现了一个与突变体连锁的基因PIS,DNA水平检测,与野生型相比,突变体该插入位点比野生型扩增出一条长约5.5K的条带(图2B),经测序比对确定为Tnt1序列。NF10617突变体中Tnt1插入在该基因的第一个外显子上。为了证明PIS基因为突变体的控制基因,我们订购了该基因的另外两个突变体:NF21657(pis-2插入在第一个外显子上),NF16829(pis-3插入在第四个外显子上)并将之前的NF10617命名为pis-1(见图2A)。观察pis-2和pis-3两个材料纯合突变体的表型,发现与之前pis-1表型完全相同。在pis-1pis-2pis-3纯合突变体种,PIS基因全长表达完全缺失(图2C)。证明PIS基因为多花瓣表型的控制基因。
实施例3PIS基因及其编码蛋白PIS的获得
1、提取蒺藜苜蓿R108(野生型)盛花的RNA,并反转录为cDNA。
2、以步骤1得到的cDNA为模板,采用引物PIS-F和引物PIS-R组成的引物对进行扩增,得到PCR扩增产物。
PIS-F:5’-CACCATGGTTGGTGACAAAGGAGA-3’;
PIS-R:5’-TCACATCAAACCACCACCAC-3’。
3、将步骤2得到的PCR扩增产物进行测序,得到目标基因的编码区序列,如序列表中序列1所示,编码序列表的序列2所示的蛋白质。由1009个氨基酸残基组成。将基因的CDS在苜蓿网站(http://blast.jcvi.org/Medicago-Blast/)进行比对,得到PIS基因的基因组序列,如序列3所示。将序列表的序列2所示的蛋白质命名为PIS,将PIS的编码基因命名为PIS基因。
本发明的从蒺藜苜蓿Tnt1插入突变体库中找到一个花瓣增多的Tnt1插入突变体,经过侧翼序列分析克隆出该花瓣增多表型的控制基因PIS。为了证明PIS为多花瓣的控制基因,我们在突变体库中反筛了PIS基因的另外两个插入突变体,发现这两个突变体出现与之前突变体完全相同的表型。本发明公开的内容可为研究PIS基因在植物中调控花瓣增多打下理论基础。
上述说明示出并描述了发明的若干优选实施例,但如前所述,应当理解发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离发明的精神和范围,则都应在发明所附权利要求的保护范围内。
序列表
<110> 中国农业科学院生物技术研究所
<120> 一种蒺藜苜蓿多花瓣控制蛋白及其编码的基因与应用
<130> 2018
<141> 2018-03-16
<160> 7
<170> SIPOSequenceListing 1.0
<210> 1
<211> 3030
<212> DNA
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 1
atggttggtg acaaaggaga cacatccaag aaacaacctc aacaacaaca acaattttca 60
tcatcatcat caccaaaacc acaacatgaa gaatccataa cagaaacaac aagaccaatt 120
catcatcatc accaacatca acaatcatca tcatcacaac aaattgttgt aagtggaagt 180
ggaacaaacc cttttatttc aactccatta tatgtttcaa gtggtggtgc aagttcttca 240
ccttttgaaa cccaatttga aacatcctta accacaaaaa gaccaagata tagtggacaa 300
tggaagcttc taccttcacc aacacaacaa caaaaacaac ctcaaatcac aaacattcta 360
aatccaaaca cagaatcaaa atcaacaaca ccttcacctt caaatctacc tcaacaacaa 420
cctcaaacaa cacctttagc tgcttcttca tcagagacaa cttcatcaca atctcatgat 480
cattcaccaa tgccttgtca agaaggaaat aggttacaag agttagacca acaagttcat 540
caacaactaa gaaaagggaa atatgtaagt cctgtttgga aacctaatga aatgctatgg 600
ttagcaagag catggaaaga acaataccaa acaagctcag aaacatcttc aagaactgaa 660
caagagatgg gaatgagtag aggaaaaaca agagctgata aagacaaaga agtagctgaa 720
tttctaaaca aacatggtgt taatagagat gcaaaaacag caggtacaaa atgggataac 780
atgttaggtg agtttaggaa agtttatgaa tgggaaagag gtggtgaaag agaacaagtt 840
ggtaaaagct attttagact gtcaccttat gaaagaaagt tgcataggtt accagcttct 900
tttgatgaag aagtttttga agaactttca cagtttatgg gatcaagaat gagatcttct 960
catggtggtg gtggtggtgg tggtagagtt ggttcttctt ttgtttcttg tgatgaagct 1020
agaacaagat ctcttcctcc tcctagacct ttcaaagatg atgatcttcc tctttcagct 1080
aggacaaaac aattggcaat gacaagtggt ggaggtgaac cattttttca tggtcataga 1140
ggaaacatat tagggttaga ttcactaatg gaaatttcaa caccttcttc tagctctaaa 1200
gaactaagaa gaattggtaa gataagaatg gtatgggaag aatcagtgag tttatggggt 1260
gaagaaggtg aagttcatag agggagaata agggttcaaa attcaagctt tttacatgct 1320
gatgaactca cttgttttga tgatgcaatg gtgatttgtc ctttagaatc ttttgaagat 1380
ggtcctttca aaggtttttc agttgataga tttgtttctg gacaacaagt taaagttttt 1440
ggtagaagaa aatcttcttc aacttctagt ggttttgctg aaagagttca acctatcaac 1500
aaaccaattc ccataagatc aattgttcca ttggatttta gagacccaac tgaatactac 1560
atggattgtc tcctacgtat ttcatcacca caatcacttc caacattatt cgaattaaag 1620
catcatttac aagagccacc accacaaaat ttacgttttc cacttaggaa agaagtgttt 1680
gatgatttac cacaaggtaa agaattcttc ttcacaacaa cttctgaacc attggattgt 1740
agatcaataa tctatgacat tgtgggcccc attataagaa ccaataacaa cattaacaac 1800
cctagtactc tcccattttc tagtagagac tctttcattg gtctatggga tgattgcatc 1860
aatagggtcg tttcaagatt ctgccacgat gaaatggtaa ttactagaaa gcccttttca 1920
tcatttttat cacaatcaca agatacattg ttgttgcaag atgaatggcc taatgtgagt 1980
ggttttgtga acaatttttg tttatggaga ggtgaagaat gtgaagaatt taaagagaat 2040
attcaaaacc catcatcaac tatcatgcaa aaattactat ggagctattt ggatttacct 2100
tatatccttg gctactatgc aataggaaat aaggtaacat tttgtgcact tagtaaatca 2160
caagaagatg ggaaaatcat tagaaccgat ttacatcaag tgaatctaac aacaccaagt 2220
gaaagattca aagccttagg accatgtttt agaattggta ttttattatc aatgttaagc 2280
aaagcttgtt ccaacatgca aaagggtagt tttgtttata gtgatttcga aaggtatagt 2340
ttcggtcacg gtgttataat tgaaatgaca ccaaacacat gcaaaagggt atttttggaa 2400
aagagaaaat tctcatcagt gaaagaagtt tacgagatat tagatcatag aataccacat 2460
agtgagtatt tagtcaaagt tcttgaaaac aacatgagtt tggtatttaa acctagagga 2520
ataagagcaa aacccttgaa cattgaacaa cttgtagaag ccctaaagta tgtaacaaaa 2580
gctttggttg cattacatga cttatcattc atgcatagag atctatgttg ggaaaaggtt 2640
acaatgagaa atgatagaga aggaggagaa tggtttgtga gtggtttcga cgaagcggcc 2700
ggtgcgccgg agttagggaa atatgtaaag gagaatcatg aaggtggtat ggtggagcgt 2760
ggaagacacg cgccagaaat ggagcgtgga ttacatggtg tgaaagtaga tgtatggagt 2820
gttgggtatt tgataatgac atgtgggttg gtgaatgtgc caaagatgtt aagagagtta 2880
cagaattggt gtatggaaca gaatccagaa caaagaccaa ctgcagcgga ttgttatcat 2940
cacttgttac aacttcagtc gactttgttg gtgtcaggtg gtgttgttgc tggttcttgt 3000
ggtgtttctg gtggtggtgg tttgatgtga 3030
<210> 2
<211> 1009
<212> PRT
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 2
Met Val Gly Asp Lys Gly Asp Thr Ser Lys Lys Gln Pro Gln Gln Gln
1 5 10 15
Gln Gln Phe Ser Ser Ser Ser Ser Pro Lys Pro Gln His Glu Glu Ser
20 25 30
Ile Thr Glu Thr Thr Arg Pro Ile His His His His Gln His Gln Gln
35 40 45
Ser Ser Ser Ser Gln Gln Ile Val Val Ser Gly Ser Gly Thr Asn Pro
50 55 60
Phe Ile Ser Thr Pro Leu Tyr Val Ser Ser Gly Gly Ala Ser Ser Ser
65 70 75 80
Pro Phe Glu Thr Gln Phe Glu Thr Ser Leu Thr Thr Lys Arg Pro Arg
85 90 95
Tyr Ser Gly Gln Trp Lys Leu Leu Pro Ser Pro Thr Gln Gln Gln Lys
100 105 110
Gln Pro Gln Ile Thr Asn Ile Leu Asn Pro Asn Thr Glu Ser Lys Ser
115 120 125
Thr Thr Pro Ser Pro Ser Asn Leu Pro Gln Gln Gln Pro Gln Thr Thr
130 135 140
Pro Leu Ala Ala Ser Ser Ser Glu Thr Thr Ser Ser Gln Ser His Asp
145 150 155 160
His Ser Pro Met Pro Cys Gln Glu Gly Asn Arg Leu Gln Glu Leu Asp
165 170 175
Gln Gln Val His Gln Gln Leu Arg Lys Gly Lys Tyr Val Ser Pro Val
180 185 190
Trp Lys Pro Asn Glu Met Leu Trp Leu Ala Arg Ala Trp Lys Glu Gln
195 200 205
Tyr Gln Thr Ser Ser Glu Thr Ser Ser Arg Thr Glu Gln Glu Met Gly
210 215 220
Met Ser Arg Gly Lys Thr Arg Ala Asp Lys Asp Lys Glu Val Ala Glu
225 230 235 240
Phe Leu Asn Lys His Gly Val Asn Arg Asp Ala Lys Thr Ala Gly Thr
245 250 255
Lys Trp Asp Asn Met Leu Gly Glu Phe Arg Lys Val Tyr Glu Trp Glu
260 265 270
Arg Gly Gly Glu Arg Glu Gln Val Gly Lys Ser Tyr Phe Arg Leu Ser
275 280 285
Pro Tyr Glu Arg Lys Leu His Arg Leu Pro Ala Ser Phe Asp Glu Glu
290 295 300
Val Phe Glu Glu Leu Ser Gln Phe Met Gly Ser Arg Met Arg Ser Ser
305 310 315 320
His Gly Gly Gly Gly Gly Gly Gly Arg Val Gly Ser Ser Phe Val Ser
325 330 335
Cys Asp Glu Ala Arg Thr Arg Ser Leu Pro Pro Pro Arg Pro Phe Lys
340 345 350
Asp Asp Asp Leu Pro Leu Ser Ala Arg Thr Lys Gln Leu Ala Met Thr
355 360 365
Ser Gly Gly Gly Glu Pro Phe Phe His Gly His Arg Gly Asn Ile Leu
370 375 380
Gly Leu Asp Ser Leu Met Glu Ile Ser Thr Pro Ser Ser Ser Ser Lys
385 390 395 400
Glu Leu Arg Arg Ile Gly Lys Ile Arg Met Val Trp Glu Glu Ser Val
405 410 415
Ser Leu Trp Gly Glu Glu Gly Glu Val His Arg Gly Arg Ile Arg Val
420 425 430
Gln Asn Ser Ser Phe Leu His Ala Asp Glu Leu Thr Cys Phe Asp Asp
435 440 445
Ala Met Val Ile Cys Pro Leu Glu Ser Phe Glu Asp Gly Pro Phe Lys
450 455 460
Gly Phe Ser Val Asp Arg Phe Val Ser Gly Gln Gln Val Lys Val Phe
465 470 475 480
Gly Arg Arg Lys Ser Ser Ser Thr Ser Ser Gly Phe Ala Glu Arg Val
485 490 495
Gln Pro Ile Asn Lys Pro Ile Pro Ile Arg Ser Ile Val Pro Leu Asp
500 505 510
Phe Arg Asp Pro Thr Glu Tyr Tyr Met Asp Cys Leu Leu Arg Ile Ser
515 520 525
Ser Pro Gln Ser Leu Pro Thr Leu Phe Glu Leu Lys His His Leu Gln
530 535 540
Glu Pro Pro Pro Gln Asn Leu Arg Phe Pro Leu Arg Lys Glu Val Phe
545 550 555 560
Asp Asp Leu Pro Gln Gly Lys Glu Phe Phe Phe Thr Thr Thr Ser Glu
565 570 575
Pro Leu Asp Cys Arg Ser Ile Ile Tyr Asp Ile Val Gly Pro Ile Ile
580 585 590
Arg Thr Asn Asn Asn Ile Asn Asn Pro Ser Thr Leu Pro Phe Ser Ser
595 600 605
Arg Asp Ser Phe Ile Gly Leu Trp Asp Asp Cys Ile Asn Arg Val Val
610 615 620
Ser Arg Phe Cys His Asp Glu Met Val Ile Thr Arg Lys Pro Phe Ser
625 630 635 640
Ser Phe Leu Ser Gln Ser Gln Asp Thr Leu Leu Leu Gln Asp Glu Trp
645 650 655
Pro Asn Val Ser Gly Phe Val Asn Asn Phe Cys Leu Trp Arg Gly Glu
660 665 670
Glu Cys Glu Glu Phe Lys Glu Asn Ile Gln Asn Pro Ser Ser Thr Ile
675 680 685
Met Gln Lys Leu Leu Trp Ser Tyr Leu Asp Leu Pro Tyr Ile Leu Gly
690 695 700
Tyr Tyr Ala Ile Gly Asn Lys Val Thr Phe Cys Ala Leu Ser Lys Ser
705 710 715 720
Gln Glu Asp Gly Lys Ile Ile Arg Thr Asp Leu His Gln Val Asn Leu
725 730 735
Thr Thr Pro Ser Glu Arg Phe Lys Ala Leu Gly Pro Cys Phe Arg Ile
740 745 750
Gly Ile Leu Leu Ser Met Leu Ser Lys Ala Cys Ser Asn Met Gln Lys
755 760 765
Gly Ser Phe Val Tyr Ser Asp Phe Glu Arg Tyr Ser Phe Gly His Gly
770 775 780
Val Ile Ile Glu Met Thr Pro Asn Thr Cys Lys Arg Val Phe Leu Glu
785 790 795 800
Lys Arg Lys Phe Ser Ser Val Lys Glu Val Tyr Glu Ile Leu Asp His
805 810 815
Arg Ile Pro His Ser Glu Tyr Leu Val Lys Val Leu Glu Asn Asn Met
820 825 830
Ser Leu Val Phe Lys Pro Arg Gly Ile Arg Ala Lys Pro Leu Asn Ile
835 840 845
Glu Gln Leu Val Glu Ala Leu Lys Tyr Val Thr Lys Ala Leu Val Ala
850 855 860
Leu His Asp Leu Ser Phe Met His Arg Asp Leu Cys Trp Glu Lys Val
865 870 875 880
Thr Met Arg Asn Asp Arg Glu Gly Gly Glu Trp Phe Val Ser Gly Phe
885 890 895
Asp Glu Ala Ala Gly Ala Pro Glu Leu Gly Lys Tyr Val Lys Glu Asn
900 905 910
His Glu Gly Gly Met Val Glu Arg Gly Arg His Ala Pro Glu Met Glu
915 920 925
Arg Gly Leu His Gly Val Lys Val Asp Val Trp Ser Val Gly Tyr Leu
930 935 940
Ile Met Thr Cys Gly Leu Val Asn Val Pro Lys Met Leu Arg Glu Leu
945 950 955 960
Gln Asn Trp Cys Met Glu Gln Asn Pro Glu Gln Arg Pro Thr Ala Ala
965 970 975
Asp Cys Tyr His His Leu Leu Gln Leu Gln Ser Thr Leu Leu Val Ser
980 985 990
Gly Gly Val Val Ala Gly Ser Cys Gly Val Ser Gly Gly Gly Gly Leu
995 1000 1005
Met
<210> 3
<211> 4535
<212> DNA
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 3
atggttggtg acaaaggaga cacatccaag aaacaacctc aacaacaaca acaattttca 60
tcatcatcat caccaaaacc acaacatgaa gaatccataa tagaaacaac aaggccaatt 120
catcatcatc accaacatca acaatcatca tcatcacaac aaattgttgt aagtggaagt 180
ggaacaaacc cttttatttc aactccatta tatgtttcaa gtggtggtgc aagttcttca 240
ccttttgaaa cccaatttga aacatcctta accacaaaaa gaccaagata tagtggacaa 300
tggaagcttc taccttcacc aacacaacaa caaaaacaac ctcaaatcac aaacattcta 360
aatccaacaa cagaatcaaa atcaacaaca ccttcacctt caaatctacc tcaacaacaa 420
cctcaaacaa cacctttagc tgcttcttca tcagagacaa cttcatcaca atctcatgat 480
cattcaccaa tgccttgtca agaaggaaat aggttacaag agttagaaca acaagttcat 540
caacaactaa gaaaagggaa atatgtaagt cctgtttgga aacctaatga aatgctatgg 600
ttagcaagag catggaaaga acaataccaa acaagctcag aaacatcttc aagaactgaa 660
caagagatgg gaatgagtag agggaaaaca agagctgata aagacaaaga agtagctgaa 720
tttctaaaca aacatggtgt taatagagat gcaaaaacag caggtacaaa atgggataac 780
atgttaggtg agtttaggaa agtttatgaa tgggaaagag gtggtgaaag agaacaagtt 840
ggtaaaagct attttagact ttcaccttat gaaagaaagt tgcataggtt accagcttct 900
tttgatgaag aagtttttga agaactttca cagtttatgg gatcaagaat gagatcttct 960
catggtggtg gtggtggtgg tagagttggt tcttcttttg tttcttgtga tgaagctaga 1020
acaagatctc ttcctcctcc tagacctttc aaagatgatg atcttcctct ttcaggttta 1080
ttttatatga aaaaaattta atttatgaac tttttttcct cacatttagt taaaaccctt 1140
tttttatttt tcaccaaatc ataatcttca atacactagc caaaatttga aacagtaaag 1200
ttttgtcttt tatatatatt tcttagattc ttagatatat tggacaagct attattatta 1260
ttactactac tattattatt attattatta ttattattat tattattatt attattatta 1320
ttattattat tactcttcac atttaattaa actccctttt tctattaaat taaaattcct 1380
catccattat aaatttgtaa cctactcata atctttaatg cacttgtgaa attaattgaa 1440
acagttaagt ttttatttta ttttaacttc ttatagaata aacagtagtt tgagacattc 1500
atgaaagttt tggaaggcaa gtatattatt tactgtttct gttattctct ctgactgttt 1560
caactaaaaa tactgtttga cattgtttca gggaaagaat gttttagaaa aggtggaaga 1620
aaaaaaaaga ttagtccaaa aatattaaaa ataaataaat aaataacaat taaccatttt 1680
ttttagtaac caaaaaaaaa ttaaccattt ttccaatcca aaataaatca attttttttt 1740
caactaatat tgtgtcatta ttacagctag gacaaaacaa ttggcaatga caagtggtgg 1800
aggtgaacca ttttttcatg gtcatagagg aaacatatta gggttagatt cactaatgga 1860
aatttcaaca ccttcttcta gctctaaaga gctaagaaga attggtaaga taagaatggt 1920
atgggaagaa tcagtgagtt tatggggtga agaaggtgaa gttcatagag ggagaataag 1980
ggttcaaaat tcaagctttt tacatgctga tgaactcact tgttttgatg atgcaatggt 2040
gatttgtcct ttggaatctt ttgaagatgg tcctttcaaa ggtttttcag ttgatagatt 2100
tgtttctgga caacaagtta aagtttttgg tagaagaaaa tcttcttcaa cttctagtgg 2160
tattaaacta aaactatcaa taatttttct ttggtttgtt tttacatgtt ttaggattta 2220
attttaatta aattttattc atccttatat ttttcaggtt ttgctgaaag agttcaacct 2280
atcaacaaac caattcccat aagatgtgag ttccttaatt tatgtagcta gcattattaa 2340
gactcattct ttaatcaata gagtttatga gtaacacata tattaaagtt tgcaatcata 2400
tcatttttaa ttgaataaca tattttttta atttcatttc attcaaacag aatatataag 2460
tattttttga acaatattgc aaacttgtag catttcattc attcattgcc aataatttgc 2520
tcaacaaata ggatgaagaa gttaaggaat agttgattca taatgatgtt ttgttaagag 2580
tttgaactcc actcctacat ttttcttttt aaaatttgtt caaaaatctt ggttctaaat 2640
taagggttac attaatttga aggctttaca cttgcaattt gcattcctat ttttgcaatt 2700
gcatatagca atcacaattt aaaaccatgt caaactaaaa ctaaaatcat gtacaattgc 2760
tttttactta taattgtata tagtttattt ttacataaag caactacaat tgcaactaca 2820
ttatcttcat ttctatgcat atttatctca atttagagtt atgataaatt atggattaaa 2880
aaaaaagaat tataataaat taaagacatg gatatgcttt ttactttaca ctgaagcatt 2940
aaattatcca gcaagtatta tagtgcttct aattaaattt ggcagaatca taattaattt 3000
atggttggtg tatttaattt gcagcaattg ttccattgga ttttagagac ccaactgaat 3060
actacatgga ttgtctcctc cgtatttcat caccacaatc acttccaaca ttatttgaat 3120
taaagcatca tttacaagag ccaccaccac aaaatttacg ttttccactt aggaaagaag 3180
tgtttgatga tttaccacaa ggtaaagaat tcttcttcac aacaacttct gaaccattgg 3240
attgtagatc aataatctat gacattgtgg gccccattat tagaaccaat aacaacatta 3300
acaaccctag tactctccca ttttctagta gagactcttt cattggtcta tgggatgatt 3360
gcatcaatag ggtcgtttca agattctgcc acgatgaaat ggtaattact agaaagccct 3420
ttttatcatt ttcatcacaa tcacaagata cattgttgtt gcaagatgaa tggcctaatg 3480
tgagtggttt tgtgaacaat ttttgtttat ggagaggtga agaatgtgaa gaatttaaag 3540
agaatattca aaacccatca tcaactatca ttcaaaaatt actatggagc tatttggatt 3600
taccttatat ccttggttac tatgcaattg gaaataaggt aacattttgt gcacttagta 3660
aatcacaaga agatgggaaa atcattagaa ctgatttaca tcaagtgaat ctaacaacac 3720
caagtgaaag attcaaagcc ttaggaccat gttttagaat cggcattttg ttatctatgt 3780
taagcaaagc ttgttccaac atgcaaaagg gtagttttgt ctatagtgat ttcgaaaggt 3840
atagttttgg tcaaggtgtt ttaatcgaaa tgacaccaaa cacatgcaaa agggtatttt 3900
tggaaaagag aaaattctca tcagtgaaag aagtttacga gatattagat catagaatac 3960
cacatagtga gtatttagtc aaagttcttg aaaacaacat gagtttggta tttaaaccta 4020
gaggaataag agcaaaaccc ttaaacattg aacaacttgt agaagcccta aaatatgtaa 4080
caaaagcttt agttgcatta catgacttat cattcatgca tagagatcta tgttgggaaa 4140
aggttacaat gagaaatgat agagaaggag gagaatggtt tgtgagtggt ttcgacgaag 4200
cggccggagc gccggagcta gggaaatatg taaaggataa tcatgaaggt ggtatggtgg 4260
agcgtggaag acacgcgcca gaaatggagc gtggattgca tggtgtgaaa gttgatgtgt 4320
ggagtgttgg gtatttgata atgacatgtg ggttggtgaa tgtgccaaag atgttaagag 4380
agttacagaa ttggtgtatg gaacagaatc cagaacaaag accaactgca gcggattgtt 4440
atcatcactt gttacaactt cagtcgactt tgttggtgtc aggtggtgtt gttgctggtt 4500
cttgtggtgt ttctggtggt ggtggtttga tgtga 4535
<210> 4
<211> 19
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 4
cctcctctaa cctgctcca 19
<210> 5
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 5
tcaccacctc tttcccattc a 21
<210> 6
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 6
caccatggtt ggtgacaaag gaga 24
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence )
<400> 7
tcacatcaaa ccaccaccac 20