技术领域
本发明属于基因工程技术领域,主要是涉及一种三孢布拉霉负菌调控因子crgA基因、克隆方法与应用。
背景技术
三孢布拉霉属于接合菌门接合菌纲毛霉目笄霉科,是一种异宗接合菌,有正菌和负菌之分,其中负菌是合成类胡萝卜素的主要宿主。三孢布拉霉生物量大,类胡萝卜素产量高,被认为是工业化生产天然β-胡萝卜素和番茄红素的理想微生物。而目前三孢布拉霉的遗传背景尚未弄清,成为进一步提高类胡萝卜素产量的瓶颈。本发明从三孢布拉霉类胡萝卜素合成的关键调控基因入手,为提高类胡萝卜素产量奠定技术基础。
crgA基因是在卷枝毛霉中发现的一个负调控因子[1],该基因缺失突变后能够引起类胡萝卜素合成关键酶基因(carRA和carB)表达水平和类胡萝卜素合成量的提高。在卷枝毛霉中,crgA基因与一光受体蛋白基因相互作用影响类胡萝卜素的表达,crgA基因的存在可能会促进某一光受体蛋白的泛素化,从而使得类胡萝卜素结构基因表达得到活化[2]。有研究者在三孢布拉霉正菌中发现了crgA的同源基因[3],并将该基因导入卷枝毛霉ΔcrgA突变株中能恢复其野生型表型,证实了该基因序列在丝状真菌中具有较高的保守性。如通过基因工程技术克隆出三孢布拉霉负菌中的crgA基因,将有助于利用三孢布拉霉负菌生产类胡萝卜素,具有很好的应用前景。
本发明除利用基因工程技术成功克隆出三孢布拉霉负菌的crgA基因外,还将对该基因进行敲除,在表型特征、关键酶基因转录水平、类胡萝卜素合成水平等方面将基因敲除株与野生株进行比较分析。
发明内容
本发明的第一目的在于提供一种三孢布拉霉负菌的crgA基因;第二目的在于提供一种所述三孢布拉霉负菌的crgA基因的克隆方法;第三目的在于构建一种crgA基因原核表达体系;第四目的在于对三孢布拉霉负菌crgA基因的分析;第五目的在于初步探索crgA基因调控三孢布拉霉合成类胡萝卜素的作用机制;第六目的在于为研究三孢布拉霉产类胡萝卜素的调控作用以及三孢布拉霉的光诱导机制奠定了重要基础。
本发明第一目的是这样实现的,所述三孢布拉霉负菌的crgA基因的碱基序列如SEQ ID NO.1所示。
本发明第二的是这样实现的,所述三孢布拉霉负菌的crgA基因的克隆方法包括如下步骤:
(1)从NCBI寻找三孢布拉霉正菌crgA基因序列,分四段进行克隆并分别设计引物:
F1(up):GGAAATTAAGCTATGCACCGCAGTATAGTC
F1(down):AGGAAGGTTTGAACAGAAAACTCTTGTAGC
F2(up):GGTAATGTATGTCGGTGTTGGTT
F2(down):ACTCGGTTGAAGTGCGATTGTAT
F3(up):AGTTAAAGCAATTCAAGCTTCGATTCTA
F3(down):CTTTAAGAAATGCAACAAGTAGCAGGTG
F4(up):ACAGACGACTGAAGAGATGATTGATGAACT
F4(down):TATTTTCATATGGAACAAGATTTGTCTATA
(2)三孢布拉霉负菌的基因组DNA为模板,使用上述引物进行PCR扩增。
(3)对所得的PCR产物进行回收和纯化;
(4)将所得PCR产物通过质粒的构建转化到大肠杆菌进行扩增,再进行抽提测序。
本发明中从NCBI中寻找的三孢布拉霉正菌的crgA基因的碱基序列如SEQ ID NO.2所示。
本发明第三目的是这样实现的,所述三孢布拉霉负菌的crgA基因的原核表达体系包括crgA基因,PMD-18T载体和大肠杆菌DH5ɑ。
本发明第四目的是这样实现的,将负菌crgA基因测序结果输入DNAMAN与三孢布拉霉正菌crgA基因序列进行比对。
本发明第五目的是这样实现的,将三孢布拉霉负菌crgA基因敲除,再测定菌内的类胡萝卜素结构基因的表达和类胡萝卜素的含量。
本发明提供的三孢布拉霉负菌的crgA基因具有重要的应用价值,而三孢布拉霉负菌是β-胡萝卜素和番茄红素的主要生产菌,因此在负菌中进行该基因的确定以及调控类胡萝卜素合成的研究具有重要的理论意义和潜在的经济价值。
附图说明
图1为验证crgA基因片段扩增电泳图,片段大小分别为:974bp、1243bp、1428bp、1019bp,图中M为DL2000DNA marker(大连宝生物)。
图2为将测序所得的三孢布拉霉负菌crgA基因与正菌crgA基因进行同源比对分析结果。
图3为crgA基因对三孢布拉霉产孢能力的影响。
图4为crgA对β-胡萝卜素合成关键酶基因表达以及类胡萝卜素产量的影响。
具体实施方式
下面进一步详细说明本发明,应理解,这些实施例只是为了举例说明本发明,而不以任何形式限制本发明的范围。
实施例1三孢布拉霉基因组DNA的提取。
取培养好的三孢布拉霉负菌种子液,离心去上清后反复洗涤两次获得菌丝体,然后加入适量液氮研磨至白色粉末状,取少量提取DNA,操作参照真菌DNA抽提试剂盒说明书进行。
实施例2三孢布拉霉负菌crgA基因的分离克隆。
根据三孢布拉霉正菌crgA基因序列,分四段进行克隆并分别设计引物:
F1(up):GGAAATTAAGCTATGCACCGCAGTATAGTC
F1(down):AGGAAGGTTTGAACAGAAAACTCTTGTAGC
F2(up):GGTAATGTATGTCGGTGTTGGTT
F2(down):ACTCGGTTGAAGTGCGATTGTAT
F3(up):AGTTAAAGCAATTCAAGCTTCGATTCTA
F3(down):CTTTAAGAAATGCAACAAGTAGCAGGTG
F4(up):ACAGACGACTGAAGAGATGATTGATGAACT
F4(down):TATTTTCATATGGAACAAGATTTGTCTATA
PCR反应体系为50ul,包括:Ex Taq酶0.25uL,Ex Taq Buffer 5uL,dNTP Mix 4uL,从负菌中提取的模板小于1ug,上/下游引物(10uM)各1uL,ddH2O up to 50ul;PCR反应在扩增仪上进行,反应程序为:扩增条件:94℃预变性5min;30个循环:94℃变性30s,55℃退火30s,72℃延伸1min;72℃后延伸10min。扩增反应完成后,进行电泳鉴定、回收和加A反应,结果如图1所示。
实施例3以PMD-18T质粒和大肠杆菌DH5ɑ为例说明原核表达体系的构建过程。
产物进行核酸电泳鉴定并割胶回收纯化,纯化回收后连接至pMD-18T载体构建重组克隆质粒,然后转化至大肠杆菌DH5α中扩增,挑取阳性转化子LB液体培养基(AMPr)37℃,220rpm培养10-12h,提取质粒后对质粒进行双酶切、验证,验证正确的进行序列测定。
实施例4为三孢布拉霉crgA基因的序列分析。
将三孢布拉霉负菌crgA基因测序结果输入至NCBI与三孢布拉霉正菌crgA基因序列进行比对。其比对结果如图2所示,由图可以确定三孢布拉霉负菌中同样含有crgA基因。
实施例5为三孢布拉霉crgA基因对其产孢能力影响分析。
根据上述得到的三孢布拉霉负菌crgA基因利用Split-marker法[4]对菌株进行crgA基因的敲除以及构建crgA基因回补菌株。首先制备三孢布拉霉的原生质体悬浮液,再加入split-marker敲除载体片段混合,涂布于麦汁培养基,待长出孢子后进行PCR验证。crgA基因的回补也采用Split-marker法,基因片段同时转化三孢布拉霉原生质体后涂布麦汁培养基,待长出孢子并传代4-5次,测序验证阳性即为crgA基因回补菌株C-ΔcrgA菌。三种菌株产孢子现象如图3所示。
实施例6为分析crgA基因对三孢布拉霉类胡萝卜素结构基因的表达和产类胡萝卜素的影响。
将培养不同时间的三孢布拉霉发酵液10000r/min离心3min收集菌丝体,取适量置于预冷的研钵中,加入液氮将菌丝体研磨至粉末状,之后按照总RNA提取试剂盒说明书进行提取。反转录按照AMV第一链cDNA合成试剂盒说明书进行,产物(cDNA)置于-20℃保存或直接用于下一步实验。将cDNA稀释至50ng/μL,按照说明书配制20μL反应体系:cDNA 2μL,Premix Ex-TaqⅡ10μL,引物(10μmol/L)0.8μL,ddH2O 6.4μL。反应程序:预变性95℃,30s;变性95℃,5s;退火55℃,20s;40个循环。tef1为真核生物的转录因子,其表达不受菌的状态和所处环境的影响,所以在该荧光定量PCR中,选用tef1为内参基因[5]。采用2-ΔΔCt法分析实验结果,计算基因表达差异倍数,所用引物见下表。结果如图4所示。
取培养不同时间的三孢布拉霉发酵液10000r/min离心5min,将获得的菌丝体置于真空干燥箱40℃干燥24h,取适量加入石油醚多次研磨至菌丝无色,收集提取液按20:1(石油醚:BHT,v/m)的比例加入BHT,然后置于-70℃或直接用于下一步实验。将提取液置于旋转蒸发仪,50℃蒸干并加入5mL乙腈重新溶解,取少量用0.22μm有机系滤膜过滤,HPLC法测定色素含量。其中,色谱柱为安捷伦TC-C18,流动相为80%乙腈、20%甲醇,检测波长450nm,流速0.1mL/min,进样量10μL,柱温为28℃。分析crgA基因对三孢布拉霉产类胡萝卜素的影响如图4所示。
参考文献:
[1]Navarro E,Ruiz-Pérez VL,Torres-Martínez S.Overexpression of the crgA gene abolishes light requirement for carotenoid biosynthesis in Mucor circinelloides.European Journal of Biochemistry 2000,267:800-807。
[2]Navarro E,A,Hansberg W,Torres-Martínez S,Garre V.A White Collar 1-like protein mediates opposite regulatory functions in Mucor circinelloides.Fungal Genetics and Biology 2013,52:42-52。
[3]Quiles-Rosillo MD,Ruiz-Vazquez RM,Torres-Martinez S,Garre V.Light induction of the carotenoid biosynthesis pathway in Blakeslea trispora.Fungal Genetics and Biology 2005,42:141-153。
[4]罗玮,巩尊洋,余晓斌.一种基因敲除载体及其构建方法和在三孢布拉霉中的应用.专利号20161026195.7。
[5]Schmidt AD,Thorsten H,Markus M,Liebmann B,Bollschweiler C,Brakhage AA.Analysis of mating-dependent transcription of Blakeslea trispora carotenoid biosynthesis genes carB and carRA by quantitative real-time PCR.Administration,2005,67(4):549-555。
SEQUENCE LISTING
SEQ ID NO.1
SEQ: 4293 bp;
Composition 1262 A; 935 C; 805 G; 1288 T; 3 OTHER
Percentage: 29.4% A; 21.8% C; 18.8% G; 30.0% T; 0.1%OTHER
Molecular Weight (kDa): ssDNA: 1322.54 dsDNA: 2646.23
COLOURS
sequence = 1
features = 0
ORIGIN
1 GGAAATTAAG CTATGCACCG CAGTATAGTC AAGATTATAC AGAAAAGAGG ATCTGCAGAG
61 AAAGCCAAGT TGCCGGAAGA CCTAAGAAGG CTTCTGAGCG AGTACATTCG TTCATTGTTG
121 CTATATGTAG CACAGAACCT TTTTGATAGC TTTGCCAAAA TTCAGACACA AGCCAAGGCC
181 TTTGGGTTTG ATACGTCCAA AGACACAATC ATCGGCTATC TAGCCCAGAA TGGCTTCCCA
241 TTCGATCTGG ACAGCTCATA GACCAAAGCT GACGGATAGA CCCAAGGCAA AACGACTGGA
301 TTGGGCACTT ACCCACACAA ACTGGACCAG TTACCAGTAG GAGGGTGTCA TCTGGTCGGA
361 TGAGTCTCGT TTCCGAGTGG AGAAACAACG ACTGTGACCT CCCCGGGTAA TCTGTAAGAA
421 GGGGGGACAC GCTAGAGGAG AGGAATATCC TCGAAACTAT CAAGTACGGT CATGTTATGG
481 GCATGTTTTT GGGCTAGCAG TTTTGGTCCC TTGGTGGCAG TTGGAGAGAA GATTGGCTGC
541 CGAAAAACAT ATCGTCCAAA ATGTGAAGGA ATTGGCAGCC CCTCATCCAT CAAGAATAGG
601 ACACTTTAGT CGAAAGTATG CCAAATAGAT GTGCAGCTGT CATAAAGGCC AAAGGCGGGC
661 GGGCATACAA GATACTAAAA AACCAATTTT CTTATTTTAT TTTAATAAAG AAGACACTTT
721 TTTTGATCTG TTTTGCATCA TGGACGTGTT TTGGCCATGC TTTCAAACTT TTGTTTTCAG
781 TTTGGATTTA ATTTAATTTC ACCGAAAGAC GCTTTGATAG GTAATGTATG TCGGTGTTGG
841 TTTTTGAATC GTGATAGGTG TAACTCGGAC ACTTCTCTTT TCTGATCGTG AAACTGTTGT
901 AAAGCCCAAG ACTATGAAAA TCAATTCCAA ACCAACTTTG TTTGGCTACA AGAGTTTTCT
961 GTTCAAACCT TCCTGATATA AAAGCGCTCT AAAAGTCCTT TCTGATCTCC CAAAAAAAAA
1021AGCCTACGTT TTGAGTAGCT CGATCCACTA ATAAAGAGCA AGAGAAGAGA CTCCTAAAAT
1081GACTGATTTA TCGCCAGGCT CAAATTTATA CACTTTTGGT AATTATCGAT CATGAAGAAA
1141GAGGATTTCC CTCAGAAGGG CGGGGTTGAT TTGTCGATCA CAAGATAAAT GATTAAGAAA
1201GAATGATAGC ATGACTACAA GGAAACCATT TTGACAATGA CGCAAAATTA ATTAAGCTTT
1261CTGATTCTCT CTCAAAAAAA AAAGGGGCTT TTTTAACGCT TGATCGATTC TTTTTTTTTT
1321TGGCCTTTTT TGTAAGATAA AGTTTTTTTT CTTTTGGGTT TTAAAATCAA AAAAACCAAA
1381AAGAACCCGG GTTTGTTATT TCAAAAATAT TAAATGCTAA AAATGGAGAA AATTGCTGAA
1441AAAGAAATTC AAGGTAAAAA TAAAAACCGA CGAAATTTTC AATTTTTTTT GGGCATAAAA
1501TAAATAAAAA TGAAGTCTTT TTTTTTTCCC TTTTTTTTAA ATAATTCCAT TTCCTTTTTT
1561TTTTCCCCTA ATTTTTTTTC CCTAAGGGGA ATTTTTTACC TTTTTTGGAA ATTTCCTTTT
1621TTTTTTTTTT TAAACCCAGG CCTTTTATTG ACTTTATTTT TTTTTTTTTT TTTTAGTTAA
1681AGCAATTCAA GGTTTGATTT TTTTGTTTCA ATTCCTTTTT TTCAAGGAAA AAAAATTTTT
1741GCTTCAATTT TTTTTTTTTT TTTTTTTTTT CTTTTGAGAA TTATCAACAG TGCAAAGCAT
1801ACAACAACAT AAACGATCCC GCGACCAGGT CGACACTTTA TCTGTAGGAC AATTCAATTA
1861GAAGCAAAAG CAGATCGATG TATTTTCACC CTCTGTAGTT GTAGAAGCAT TCACTCGATG
1921TCCTTCTTGT CATGGCAAAT TGAATAAACC AACCACTTTG CCTTGTGGCT TTACAGCTTG
1981TCATZXCVGC ACTGCGTGGC ATTCGATCAC AGACAGATGT ACATCACTTA TCTTATCGAT
2041CCCCGGCTTA AAATCCCCTT TCACCCGAGG GTCCTTTTTC GGGCTTTGCA AGCCATTGTA
2101GTCGGGGCAA AAGCTTCTCA AACCCTCAAC ATTTTACTTC CCACACTCAA TTCACCCCCC
2161AAAGGTCCCA TCTGTTGTTC CCGCTTCAAA AATCCAACAA CTACTCCTTG GGGACCCACC
2221TTTTGCAAAA ACGGCCGAAT TCCCTCACTT GACCATCAAC CCCCTGGCCC CTTTTGTCGC
2281GACATTCCCA ATTTGGGCCC CCCCCCACCC AAAATCTTGG GGGACATTCT CTCCCACTGG
2341AATGCTATGG ATGCAAAACC GGATAAAAAT GCATGGGCCA GGCTTGATCA AGAGGGCCGG
2401GTTCCCTGGT GAATGGGCAA CCGGGCCTTC CCTCTGGACA AATGTGCCTT TCATGGTGTT
2461TGAACCCGCG CTATCGCCTA ATGGTTCGTC GTATCAGGCA GCCCAACCCG CCGTCAATTT
2521GCCTGGTGTA TTGCTCGCCG AAAACAAACC AAAGGGCAAC TCTCCACTTA ACAAAATATG
2581GCCCTAATGC TTGTATTTGA CCCATGCTCC AACCTTTGGC GTGATGGCTC GTTCCTTTGG
2641GAAGAAGCCT ATTGGCTCCG ACAGCCCCTT CCAGGTCCTC GACATATGTA AATTGCACAG
2701ATGGTTCATC ATATGGCTTC CCATTGGAAA GAATTGATGA TATTGATTGG TGAGCAGAAA
2761ACTTCGCCTT GACGACCACG TACTCTGAAA GCCAGTGCCT CTTCGTGCAC GTCTACACAG
2821AGACCTTGCA TGTCCATATC ACTTGACCTG CACTGCCTTG TCGTTCGACA ATGGATCCAC
2881GTATCACGAT CTCCAATGAT TCTACCCGCT AGTATGATGG CCAGACCCGC TAGTATGATC
2941GCTAGACCCG CCAGCATGAT GGCCAGACCC GCCAGTATGA TCGCTAGACC CGCCAGTATG
3001GCATCCAGAT CTAACCCAGC CGTTCGCGCA CCCATGGGTC GCCCAATGCC CCATCAAGTT
3061AGACCTCAAG CTACAAATGC TAGCATGGAA CCCAACAATG CTCGTCAATC CTGGGCTCAA
3121CGTGCTCATC CTCAGACACA AGCACCTGTT AGTCGAGCTC CTTGGCTTCA AATGCATGTT
3181CAAGGTCTAT CTGCTCAACG ATCTAAGCCT CAATTACAAC AACAACAACA ACAGCAGCAG
3241CAACAACAGC AATCTCACAA CATCCCTATT GTACCCGAAA AAACAGTCAA GAATCGTCAA
3301GAACAGACGA CTGAAGAGAT GATTGATGAA CTAACAGCTT TTGTTGAAAA ATTATTATGT
3361CATAAGAATG CTAATCCTAA TGACAGCATG TCTACTTGGC TAAGTGCCTT GGGTGATCCT
3421CCTACATTAC GTGGTCCTCA ACGCGATCGA GTCATCTTGA CTTGGTGGGT CATTAACATG
3481ATGCCCTTGA GTGAAGATGA AAAGGTTTCT CTGATAGCCA TGCGTACTCT CCGTGAACGC
3541GTCTTGGTGA TCATTTCCCG TATTGATCGA TTCGAGAGTC AATGGTCTGT CTTTTTAAAC
3601AACTCATCGT CTACTCACTC TTCCTCTAAT CAAACACCTG CTACTTGTTG CATTTCTTAA
3661AGCCCATTCC TTTTACTTAA TTTATTATGC CCTCACTCTC ACTCTCTCTC TCTTTCTTTC
3721TTTGTAATCA TATCATTGTC TATAACTATC TATGCCATAA AAAAAAACAC CTTAATTTAT
3781TTCTAAAAAC GCAATCCTTA ATGAATAATA AAATATTACT AATCTATTGT GTAATTCAGT
3841TTAACATTGG TTTATCCATC TTTTGTCCAA TAAAAATAAA TCATGTAGTA AATAACCCAT
3901TTTACCTAGT GCTCTTGGAA GAGGAGTAGG GCAGTATCAC TCCTCAATTG CTGCAATATT
3961TTTGATAAGA ACATATGTCT TGGGAAATGT AAAGCCAAAG GAGGGGAAGA AACCATAAGA
4021GAGAAAGCTA ATACGAATAA AGATCTTGTA ATTCCACTAT TAAAAGGAGA TTGTTTCTTT
4081TTCTTTTTAT CTACATTTTG TCTTTTTATT TCCGAAAATG ACATGTTGAT TATTTATGTA
4141AAAAGGGTAA AGAGGGAAGA AAAAAAAAAG AGGGGGAAGG GAGGAGAAAG GAGGGGATGA
4201AAGGGTGCTT ATGCTTCAAG AGAAACATAC CAAGATCGAA CAATTGCTCA AACAATTCTC
4261CAGTATAGAC AAATCTTGTT CCATATGAAA ATA
SEQ ID NO.2
SEQ DNAMAN1: 4261 bp;
Composition 1269 A; 891 C; 788 G; 1313 T; 0 OTHER
Percentage: 29.8% A; 20.9% C; 18.5% G; 30.8% T; 0.0%OTHER
Molecular Weight (kDa): ssDNA: 1313.10 dsDNA: 2626.45
COLOURS
sequence = 1
features = 0
ORIGIN
1 GGAAATTAAG CTATGCACCG CAGTATAGTC AAGATTATAC AGAAAAGAGG ATCTGCAGAG
61 AAAGCCAAGT TGCCGGAAGA CCTAAGAAGG CTTCTGAGCG AGTACATTCG TTCATTGTTG
121 CTATATGTAG CACAGAACCT TTTTGATAGC TTTGCCAAAA TTCAGACACA AGCCAAGGCC
181 TTTGGGTTTG ATACGTCCAA AGACACAATC ATCGGCTATC TAGCCCAGAA TGGCTTCCCA
241 TTCGATCTGG ACAGCTCATA GACCAAAGCT GACGGATAGA CCCAAGGCAA AACGACTGGA
301 TTGGGCACTT ACCCACACAA ACTGGACCAG TTACCAGTAG GAGGGTGTCA TCTGGTCGGA
361 TGAGTCTCGT TTCCGAGTGG AGAAACAACG ACTGTGACCT CCCCGGGTAA TCTGTAAGAA
421 GGGGGGACAC GCTAGAGGAG AGGAATATCC TCGAAACTAT CAAGTACGGT CATGTTATGG
481 GCATGTTTTT GGGCTAGCAG TTTTGGTCCC TTGGTGGCAG TTGGAGAGAA GATTGGCTGC
541 CGAAAAACAT ATCGTCCAAA ATGTGAAGGA ATTGGCAGCC CCTCATCCAT CAAGAATAGG
601 ACACTTTAGT CGAAAGTATG CCAAATAGAT GTGCAGCTGT CATAAAGGCC AAAGGCGGGC
661 GGGCATACAA GATACTAAAA AACCAATTTT CTTATTTTAT TTTAATAAAG AAGACACTTT
721 TTTTGATCTG TTTTGCATCA TGGACGTGTT TTGGCCATGC TTTCAAACTT TTGTTTTCAG
781 TTTGGATTTA ATTTAATTTC ACCGAAAGAC GCTTTGATAG GTAATGTATG TCGGTGTTGG
841 TTTTTGAATC GTGATAGGTG TAACTCGGAC ACTTCTCTTT TCTGATCGTG AAACTGTTGT
901 AAAGCCCAAG ACTATGAAAA TCAATTCCAA ACCAACTTTG TTTGGCTACA AGAGTTTTCT
961 GTTCAAACCT TCCTGATATA AAAGCGCTCT AAAAGTCCTT TCTGATCTCC CAAAAAAAAA
1021AGCCTACGTT TTGAGTAGCT CGATCCACTA ATAAAGAGCA AGAGAAGAGA CTCCTAAAAT
1081GACTGATTTA TCGCCAGGCT CAAATTTATA CACTTTTGGT AATTATCGAT CATGAAGAAA
1141GAGGATTTCC CTCAGAAGGG CGGGGTTGAT TTGTCGATCA CAAGATAAAT GATTAAGAAA
1201GAATGATAGC ATGACTACAA GGAAACCATT TTGACAATGA CGCAAAATTA ATTAAGCTTT
1261CTGATTCTCT CTCAAAAAAA AAAGGGGCTT TTTTAACGCT TGATCGATTC TTTTTTTTTT
1321TGGCCTTTTT TGTAATGATA GAGTTTTTTT TCCTTATTGG CTTTAAGATC AGAAAGATCA
1381AAAAGCAACC ATGTTTGTTA TTTCAAAAAT AGTAAATGCT AAAAATGGAG TAAATTGCTG
1441AGAGAGAAAT TCAATGTAAA AAATAAGATC GATCGAAATT TCGATTTTTT TTTGGCATAA
1501AATATATAAA AATGAATTTT TTTTTTTTTC TTTTTTTTTT AATTATTTCT TTTTCTTTTT
1561TTTTTTTCCA TTAGTTATCT TCACATATGG TGAATTTATA ACATTTCTTG TAAATTTCCT
1621TCTTTTTTTT TTTTAATACA AGACATTTTA TTGACTCTAT TTTTTTATTT TATTTTTAGT
1681TAAAGCAATT CAAGCTTCGA TTCTATTGTT TCAATTCATT ATTTTCAAGG AAAAAAAATT
1741TTTGCTTCAA TTCTTTTTCT TTTTTTTTTT TTTCTTTTGA GAATTATCAA CAGTGCAAAG
1801CATACAACAA CATAAACGAT CCCGCGACCA GGTCGACACT TTACCTGTAG GACAATTCAA
1861TAAGAAGCAA AAGCAGATCG ATGTATTTTC ACCCTCTGTA GTTGTAGAAG CATTCACTCG
1921ATGTCCTTCT TGTCATGGCA AATTGAATAA ACCAACCACT TTGCCTTGTG GCTTTACAGC
1981TTGTCATGCC TGTGTGGCTT CATCACAACA ATGTATATCA CCTACTTGTG ATCGCCTGCA
2041TACAATCGCA CTTCAACCGA GTGTCACTAT TCAGGCATTG CAAGCCATTG TAGTCAGTGC
2101AGAAGCATCT CGAACACTCG ACACTTTACG TCTCACACTC GATTCATCCA CCGAATGTCC
2161CATCTGTTGT TCTCGCTTCA ACAATCCAAC AACTACTCCA TGTGGACACA CCTTTTGCAG
2221AAACTGTCTG ATTCGCTCAC TTGACCATCA ACGCTCTTGC CCCTTTTGTC GCGACAATCT
2281CGATTTCTGT CCTCCACCAG CCAAAATCTT GTGTGACATT CTCTCTCAAC TGTATGCTGA
2341TGATGCAGAA GCTGATGAAG ATGCACTGGC CATGCTTGAT CAAGATGTCC GTGTTCCCTT
2401GTTGATTGGC AACCTGGCCT TTCCTCATGT CAAATGTGCC ATTCATGTGT TTGAACCTCG
2461CTATCGTCTT ATGCTTCGTC GTATCATGCA GTCCAACCGT CGTCGATTTG CCATGTGTAT
2521TGCTCGTCGA AACAGATCAG AAGGGCAAGC TCCATTTTAC GAATATGGCA CTATGCTTGA
2581ATTGACCCAT GTTCAAACTT TGCCTGATGG TCGTTCTTTG GTAGAAGCCA TTGGCTCGCA
2641TCGCTTCAAG GTCCTCGACT ATGAATTGAC AGATGGTTAT CATATGGCTT CCATTGAAAG
2701AATTGATGAT ATTGATGGTG AGCAAGAAAA CATGCTTGAA CGACAACAGA TCTTGAGAGC
2761CAGTGCGTCT CGTGCACGTC AACAACAAAG ACCTGCCAAT TCATTATCTA CTGCACCTGC
2821ATCTCCTTCC GTTCGACCAA TGACCACTAC TACGAATACT ACAATGACTC AACCCGCTAG
2881TATGATGGCC AGACCCGCTA GTATGATCGC TAGACCCGCC AGCATGATGG CCAGACCCGC
2941CAGTATGATC GCTAGACCCG CCAGTATGGC ATCCAGATCT AACCCAGCCG TTCGCGCACC
3001CATGGGTCGC CCAATGCCCC ATCAAGTTAG ACCTCAAGCT ACAAATGCTA GCATGGAACC
3061CAACAATGCT CGTCAATCCT GGGCTCAACG TGCTCATCCT CAGACACAAG CACCTGTTAG
3121TCGAGCTCCT TGGCTTCAAA TGCATGTTCA AGGTCTATCT GCTCAACGAT CTAAGCCTCA
3181ATTACAACAA CAACAACAAC AGCAGCAGCA ACAACAGCAA TCTCACAACA TCCCTATTGT
3241ACCCGAAAAA ACAGTCAAGA ATCGTCAAGA ACAGACGACT GAAGAGATGA TTGATGAACT
3301AACAGCTTTT GTTGAAAAAT TATTATGTCA TAAGAATGCT AATCCTAATG ACAGCATGTC
3361TACTTGGCTA AGTGCCTTGG GTGATCCTCC TACATTACGT GGTCCTCAAC GCGATCGAGT
3421CATCTTGACT TGGTGGGTCA TTAACATGAT GCCCTTGAGT GAAGATGAAA AGGTTTCTCT
3481GATAGCCATG CGTACTCTCC GTGAACGCGT CTTGGTGATC ATTTCCCGTA TTGATCGATT
3541CGAGAGTCAA TGGTCTGTCT TTTTAAACAA CTCATCGTCT ACTCACTCTT CCTCTAATCA
3601AACACCTGCT ACTTGTTGCA TTTCTTAAAG CCCATTCCTT TTACTTAATT TATTATGCCC
3661TCACTCTCAC TCTCTCTCTC TTTCTTTCTT TGTAATCATA TCATTGTCTA TAACTATCTA
3721TGCCATAAAA AAAAACACCT TAATTTATTT CTAAAAACGC AATCCTTAAT GAATAATAAA
3781ATATTACTAA TCTATTGTGT AATTCAGTTT AACATTGGTT TATCCATCTT TTGTCCAATA
3841AAAATAAATC ATGTAGTAAA TAACCCATTT TACCTAGTGC TCTTGGAAGA GGAGTAGGGC
3901AGTATCACTC CTCAATTGCT GCAATATTTT TGATAAGAAC ATATGTCTTG GGAAATGTAA
3961AGCCAAAGGA GGGGAAGAAA CCATAAGAGA GAAAGCTAAT ACGAATAAAG ATCTTGTAAT
4021TCCACTATTA AAAGGAGATT GTTTCTTTTT CTTTTTATCT ACATTTTGTC TTTTTATTTC
4081CGAAAATGAC ATGTTGATTA TTTATGTAAA AAGGGTAAAG AGGGAAGAAA AAAAAAAGAG
4141GGGGAAGGGA GGAGAAAGGA GGGGATGAAA GGGTGCTTAT GCTTCAAGAG AAACATACCA
4201AGATCGAACA ATTGCTCAAA CAATTCTCCA GTATAGACAA ATCTTGTTCC ATATGAAAAT
4261A