黑龙江省野猪线粒体基因组全序列克隆及进化分析 【技术领域】
本发明涉及猪基因组序列的克隆,具体的说是克隆了黑龙江省野猪的线粒体基因组全序列,并根据已有猪科动物的线粒体基因组序列构建了猪科动物的分子进化树。
背景技术
线粒体是真核细胞的一种细胞器,有它自己的基因组,编码细胞器的一些蛋白质。除了少数低等真核生物的线粒体基因组是线状DNA分子外(如纤毛原生动物和绿藻等),一般都是一个环状DNA分子。不同物种的线粒体基因组的大小相差悬殊。已知的是哺乳动物的线粒体基因组最小,果蝇和蛙的稍大,酵母的更大,而植物的线粒体基因组最大。哺乳动物的线粒体基因DNA没有内含子,几乎每一对核苷酸都参与一个基因的组成,有许多基因的序列是重叠的,例如,Anderson等于1981年测定了人线粒体基因组全序列,共16569bp,除了同启动DNA有关的D环区(D-loop)外,只有87个bp不参与基因的组成。现已确定有13个为蛋白质编码的区域,即细胞色素b、细胞色素氧化酶的3个亚基、ATP酶的2个亚基以及NADH脱氢酶的7个亚基的编码序列。另外还有分别编码16SrRNA和12SrRNA以及22个tRNA的DNA序列。除个别基因外,这些基因都是按同一个方向进行转录,而且tRNA基因位于rRNA基因和编码蛋白质的基因之间。除了少数例外,线粒体基因组编码蛋白质的密码子都是生命世界通用的密码子。
线粒体DNA(mtDNA)可用于分子系统发生研究(molecular phylogenetic studies)。与细胞核DNA相比,mtDNA作为生物体种系发生的“分子钟”(molecular clock)有其自身的优点:①突变率高,是核DNA的10倍左右,因此即使是在近期内趋异的物种之间也会很快地积累大量的核苷酸置换,可以进行比较分析;②因为精子的细胞质极少,子代的mtDNA基本上都是来自卵细胞,所以mtDNA是母性遗传(maternalinheritance),且不发生DNA重组,因此,具有相同mtDNA序列的个体必定是来自一位共同的雌性祖先。但是,近年来PCR技术证实,精子也会对受精卵提供一些mtDNA,这是造成线粒体DNA异序性(heteroplasmy)的原因之一。在分子进化研究中,mtDNA同样也是十分有用的材料。由于线粒体基因在细胞减数分裂期间不发生重排,而且点突变率高,所以有利于检查出在较短时期内基因发生的变化,有利于比较不同物种的相同基因之间的差别,确定这些物种在进化上的亲缘关系。
猪的起源研究不仅具有其自身的意义,而且对于了解人类社会的发展历程也十分重要。因为随着大陆板块的迁移以及人口的迁徙,野猪与家猪也存在着不同程度流动,因此运用现代先进的分子克隆测序技术来研究猪科动物系统发育分析就显得尤为重要。目前,在美国的国立生物技术信息中心(NCBI)网站上,可查到全世界各地大约50余种野猪的线粒体基因组全序列,但是没有黑龙江省野猪线粒体基因组序列的记录。这对于研究黑龙江省乃至我国的家猪起源都具有一定的局限性。
【发明内容】
鉴于上述存在的问题,本发明的目的是通过常规的PCR及克隆测序技术,获得黑龙江省野猪的线粒体基因组全序列,为今后我国乃至世界的猪科动物系统发育研究提供素材。
为了实现上述目的,本发明的技术方案是:设计了13对猪科动物通用的引物,每对之间存在部分重叠序列,保证扩增地完整性,通过分子克隆技术,分别获得每段扩增产物,测序公司完成测序后,将序列结果使用SeqMan II软件进行拼装,结果表明黑龙江省野猪的线粒体基因组全长16581bp,包括2个rRNA、22个tRNA和13个蛋白质编码基因以及1个非编码控制区(D-loop区),GenBank登录号:EU333163。
【附图说明】
图1为PCR扩增回收产物的琼脂糖凝胶电泳图。
图2为黑龙江省野猪线粒体全基因组注释情况。
图3采用NJ法基于67个猪种线粒体全基因组的系统进化树。
图4采用ME法基于67个猪种线粒体全基因组的系统进化树。
【具体实施方式】
一、实验材料
1.实验动物
本实验中所用黑龙江省野猪1头,捕捉于小兴安岭,屠宰后取部分肝脏组织,液氮保存。
2.菌株
大肠杆菌(Escherichia coli)DH5α购自北京鼎国生物技术有限责任公司。
3.分子克隆主要相关试剂
(1)BamHI、EcoRI、HindIII等限制性内切酶、rTaq酶、dNTP、DL2000Marker、pMD-18T载体连接试剂盒,均购自大连宝生物工程有限公司。
(2)胶回收(小量)试剂盒、质粒(小量)抽提试剂盒购自上海华舜生物工程有限公司。
(3)细菌培养用胰蛋白胨和酵母提取物均购自Oxid公司。
(4)琼脂糖、溴化乙锭、Tris等购自Sigma公司。
(5)其他试剂均为分析纯的国产生化试剂。
(6)Eppendorf管和移液器枪尖等塑料耗材均购自哈尔滨伊事达生物技术有限公司。
二、实验方法
(一)线粒体DNA的提取
1.将组织样(约100mg)置于离心管中,剪碎;
2.加入1ml SE缓冲液混匀,用吸管上下吹打,静置10min,重复吹打三次,静置10min,沉降大块沉淀;
3.小心吸取上清于新离心管中,1000g离心10min,弃沉淀,转移上清于新离心管中;
4.12000g离心15min,弃上清,沉淀即为线粒体;
5.收集沉淀于新离心管中,用SE缓冲液清洗3次,加入1mlSDS提取缓冲液,加蛋白酶K(10mg/ml)至终浓度100μg/ml;
6.50℃温浴2h;5000g离心10min;
7.转移上清于新离心管中,用酚、氯仿、异戊醇(25∶24∶1)混合液抽提2次;
8.上清液加2倍体积的无水乙醇(-20℃预冷),沉淀DNA
9.5000g离心3min,无菌条件下风干,加500μlTE溶解;工作液4℃保存、储存液-20℃保存。
(二)引物的设计与合成
使用DNAStar软件包里的EditSeq软件进行13对引物的设计。引物序列及相应信息情况见表1
表1引物序列及信息
(三)PCR扩增体系及反应条件
1.PCR扩增体系:
10×PCR reaction buffer 2.5μl
dNTP Mixture(各10mmol/L) 2.0μl
上游引物(10mol/μl) 0.5μl
下游引物(10mol/μl) 0.5μl
Taq DNA polyerase(5U/μl) 0.25μl
去离子水 17.25μl
Template 2.0μl
总量 25μl
2.PCR反应条件
预变性:94℃ 7min
变性:94℃ 30sec
退火:温度见表 130sec
延伸:72℃ 1min30sec to 35循环
孵育:72℃ 10min
4℃
3.PCR扩增产物的电泳检测及鉴定
反应结束后,取PCR产物5μl上样于1%琼脂糖凝胶,同时在一点样孔中加3.0μl DNADL2000Maker作对照,电泳20~30min,在计算机凝胶成像系统上观察,如果PCR产物无其它杂带,且扩增片段大小与设计相符,就可以用于回收、测序。
(四)克隆测序
1.PCR扩增片段的纯化
(1)将含目的片段条带的琼脂糖块割下,放入1.5ml的离心管中。
(2)按每100mg琼脂糖加入300-600μl的比例加入S1液,置55℃水浴10min,使琼脂糖块完全溶化,每2min颠倒混匀一次。
(3)加入1/3S1体积的异丙醇,混匀,55℃温育1min。
(4)将溶化后的琼脂糖液移入吸附柱,离心1min。倒掉收集管中的液体,再将吸附柱放入同一个收集管中。
(5)在吸附柱中加入450μl W1液,静置1min后,离心15sec。倒掉收集管中的液体,将吸附柱放入同一个收集管中。
(6)在吸附柱中加入450μl W1液,离心15sec。倒掉收集管中的液体,将吸附柱放入同一个收集管。
(7)离心1min。
(8)将吸附柱放入一个干净的1.5ml的离心管中,在吸附柱的中央加30μlT1液,静置1min后,离心1min。将1.5离心管中的DNA贮存于-20℃中。
2.PCR回收产物与T载体连接反应
连接体系如下:
pMD 18-T Vector(50ng/ul) 0.5ul
DNA 20-40ng
Solution 1 5ul
加去离子水至 10ul
将上述反应液在16℃反应30min或14℃过夜。
3.感受态细胞的制备(CaCl2法)
(1)挑取DH5α大肠杆菌原种,在LB琼脂板上划线培养。
(2)挑取新鲜的单菌落,接种到3ml LB培养基中,37℃培养过夜。
(3)取1ml培养好的菌液,接种到100ml LB培养基中,37℃300rpm强烈振荡培养2h,使细胞浓度达到5×107个细胞/ml,此时,细菌的OD600一般在0.5~0.6之间,为对数生长期。
(4)将培养物在冰上放置10min,转移到2个50ml预冷的离心管中,4000rpm4℃离心5min。去上清,倒置离心管,使残液流尽,回收细菌沉淀。
(5)加入20ml冰预冷的0.1M CaCl2悬浮细菌沉淀,然后冰浴30min。
(6)4000rpm,4℃离心10min,去上清,倒置离心管,回收细菌沉淀。
(7)加入4ml 0.1mol/LCaCl2溶液重悬细菌沉淀,这时的细胞可直接用于转化实验。
(8)加甘油至终浓度为15%~20%,混匀,分装成200μl/份,冻存于-80℃。
4.转化入大肠杆菌感受态细胞内
(1)从-70℃冰箱中取出一管感受态细胞(200μl感受态细胞),在冰上放置10min助溶。
(2)将10μl连接产物加到感受态细胞中,轻轻旋转以混匀内容物,在冰上放置30min。
(3)将管放到预加温到42℃的水浴锅中,热激90sec。
(4)快速将离心管转移到冰浴中,冷却1~2min。
(5)加入400μlLB培养基,37℃温和振荡(100~150rpm)培养45min,使细菌复苏。
(6)取100μl菌液铺于含AMP(100μl/ml)培养基上,37℃倒置培养12~16h。
5.阳性菌落的鉴定与培养
(1)用记号笔标记转化培养的单菌落,用灭菌的牙签蘸取单菌落。
(2)以单菌落作为模板,加入PCR反应液(不含模板)中,用获得该片段的PCR条件进行扩增。
(3)琼脂糖凝胶电泳检测,鉴别T载体上是否含有目的片段。
(4)若得到目的片段,可用灭菌枪头挑取在平板上的与之对应的单菌落,放入40ml LB液体培养基中,培养基中预先加入0.1%(V/V)的Amp(100mg/ml),37℃过夜振荡培养,用于质粒回收。
6.质粒DNA的小规模提取
(1)接种一单菌落于3ml含50ug/mlAmp的LB液体培养基中,以37℃220rpm培养过夜。
(2)取1.5ml菌液于离心管中,4,000rpm离心5min,弃去上清液,收集菌体。
(3)在细菌沉淀中加入250μl P1液,震荡至彻底悬浮。
(4)加入250μl P2液,立即温和颠倒离心管5-10次以混匀管中液体,室温静止4min。
(5)加入350μl P3液,立即温和颠倒离心管5-10次以混匀管中液体。
(6)12,000rpm离心10min,将上清液小心移入吸附柱,离心15sec。倒掉收集管中的液体,将吸附柱放入同一个收集管中。
(7)向吸附柱中加入500μl B1液,离心15sec。倒掉收集管中的液体,将吸附柱放入同一个收集管中。
(8)向吸附柱中加入500μl W1液,离心15sec。倒掉收集管中的液体,将吸附柱放入同一个收集管中。
(9)向吸附柱中加入500μl W1液,静止1min后,离心15sec。倒掉收集管中的液体,将吸附柱放入同一个收集管中,再离心1min。
(10)将吸附柱放入一个干净的1.5ml离心管中,在吸附膜中央加入50μl T1液,室温静止1min,离心1min。将1.5ml离心管(DNA溶液)-20中℃保存。
7.双酶切鉴定质粒
(1)双酶切反应体系:
HindIII 0.80μl
BamHI 0.80μl
10xK Buffer 2.00μl
H2O 13.4μl
Plasmid 3.00μl
Total 20.0μl
(2)反应条件:37℃2~3h。
(3)酶切产物的电泳检测
制备1%的琼脂糖凝胶,把酶切产物20μl全部加到点样孔中,120V电泳30min,检测到大小相符的目的基因片段后,将重组质粒寄往测序公司测序,测序结果通过NCBI的blast进行同源性鉴定。
(五)序列结果拼装
使用SeqMan II软件对测序结果进行组装。
(六)线粒体DNA结构分析方法
利用DNAStar软件包中的EditSeq对东北野猪线粒体DNA碱基含量进行分析,通过序列比对对其全基因组进行注释。
(七)线粒体DNA限制性酶切图谱分析方法
利用pDRAW32预测东北野猪mtDNA的常见限制性酶的酶切图谱,并统计每种酶的酶切位置和酶切片段长度。
(八)线粒体DNA基因定位分析
通过序列比对和软件分析,对东北野猪线粒体DNA的D-loop区、2个rRNA、13个蛋白编码基因以及22个tRNA进行定位分析,
(九)系统发育分析
从NCBI下载猪的全长线粒体DNA序列,采用ClustalX对东北野猪及其他67个猪种的线粒体DNA序列进行多重比对,使用Mega4软件,采用邻接法和最小进化法构建系统进化树。
三、实验结果与分析
1.测序结果的拼接
测序共产生13条序列,使用SeqManII软件对13条序列进行组装,由于引物最初的设计是保证相连片段间存在超过100bp的重叠区,才能保证序列的正确的拼装,因此13条序列完全依据相连的重叠群连接在一起,由于线粒体是环状,因此,第13条序列和第1条序列相连。
2.黑龙江省野猪线粒体基因组总长和碱基组成
黑龙江省野猪线粒体全基因组序列已经递交到GenBank,登录号为EU333163.1,序列全长16581bp,包括长1145bp的线粒体调控区(D-loop区)和长15436bp的编码区。利用DNAStar软件包中的EditSeq对东北野猪线粒体全基因组碱基含量进行了统计,其中A 5765个、C 4343个、G 2190个、T 4283个,A34.77%>C 26.19%>T 25.83%>G 13.21%,A+T%(60.60%)与G+C%(39.40%),这特别高的A+T含量在其它哺乳动物中也有发现,如牛A+T%(60.62%)与G+C%(39.38%),羊A+T%(61.06%)与G+C%(38.94%),鼠A+T%(63.26%)与G+C%(36.74%)等。
3.黑龙江省野猪线粒体基因组结构
黑龙江省野猪线粒体全基因组包括37个基因:2个rRNA、22个tRNA和13个蛋白质编码基因以及1个非编码控制区(D-loop区),且基因排列顺序与大多数脊椎动物相似,相邻基因间有时稍有重叠。1个蛋白质编码基因(ND6)和8个tRNA基因(tRNA-Gln、tRNA-Ala、tRNA-Asn、tRNA-Cys、tRNA-Tyr、tRNA-Ser、tRNA-Pro、tRNA-Glu)位于L链上,其余的基因位于H链上。
4.黑龙江省野猪线粒体基因组限制性酶酶切图谱分析
利用pDRAW32软件预测了东北野猪线粒体基因组的12种常见的限制性酶酶切图谱,并统计了每种限制酶的酶切位置和酶切片段长度(见表2)。
表2黑龙江省野猪线粒体基因组酶切位置和片段长度
5.系统发育分析
选择非洲疣猪作为系统进化树的外类群。从NCBI下载所有猪种的全长线粒体基因组序列,共76个,其中有重复和不确定猪种,经筛选后保留了67个,见表3。
表3进化分析中所选用猪种的GenBank登录号及分布地区
在以非洲疣猪线粒体基因组作为外类群构建的NJ和ME树显示,整个猪科动物中,最为古老并靠近外类群的是马来西亚野猪,表中显示为myw4,因此可以当作次一级的外类群,可看作是当今猪种中的最古老的,是目前欧亚大陆猪种的先祖,进而从myw4之后的65个欧亚猪种分化成两个主要的分支,一个是较大的A(Asian)类群,是亚洲分支,另一个是较小的E(Europe)类群,是欧洲分支,A类群(亚洲分支)发生要晚于E类群(欧洲分支)。
黑龙江省野猪的线粒体基因组全序列如下:
1 caaccaaaac aagcattcca ttcgtatgca aaccaaaacg ccaagtactt aattactatc
61 tttaaaacaa aaaaacccat aaaaattgcg cacaaacata caaatatgtg accccaaaaa
121 ttttaccatt gaaaaccaaa aaatctaata tactataacc ctatgtacgt cgtgcattaa
181 ctgctagtcc ccatgcatat aagcatgtac atattattat taatattaca tagtacatat
241 tattattgat cgtacatagc acatatcatg tcaaataact ctagtcaaca tgcgtatcat
301 caccattaga tcacgagctt aattaccatg ccgcgtgaaa ccagcaaccc gcttggcagg
361 gatccctctt ctcgctccgg gcccataaat cgtgggggtt tctattgatg aactttaaca
421 ggcatctggt tcttacttca ggaccatctc atctaaaatc gcccactctt tccccttaaa
481 taagacatct cgatggacta atgactaatc agcccatgct cacacataac tgaggtttca
541 tacatttggt attttttaat ttttggggat gcttggactc agccatggcc gtcaaaggcc
601 ctaacacagt caaatcaatt gtagctggac ttcatggaac tcatgatccg gcacgacaat
661 ccaaacaagg tgctattcag tcaatggtta caggacataa cgtgcgtaca cgtgcgtaca
721 cgtgcgtaca cgtgcgtaca cgtgcgtaca cgtgcgtaca cgtgcgtaca cgtgcgtaca
781 cgtgcgtaca cgtgcgtaca cgtgcgtaca cgcgcatata agcaggtaaa ttattagctc
841 attcaaaccc cccttacccc ccattaactt atgctctaca caccctataa cgccttgcca
901 aaccccaaaa acaaagcaga gtgtacaaat acaataagcc taacttacac taaacaacat
961 ttaacaacac aaaccaccat atcttataaa acacttactt aaatacgtgc tacgaaagca
1021 ggcacctacc cccctagatt tttacgccaa tctaccataa ataaatttaa aattacaaca
1081 caataacctc ccaaaatata agcacctatt taagtatacg cccacaatct gaatatagct
1141 tatagttaat gtagcttaaa ttatcaaagc aaggcactga aaatgcctag atgagcctca
1201 cagctccata aacacacagg tttggtcctg gcctttctat taattcttaa taaaattaca
1261 catgcaagta tccgcgcccc ggtgagaatg ccctccagat cttaaagatc aaaaggagca
1321 ggtatcaagc acacctataa cggtagctca taacgccttg ctcaaccaca cccccacggg
1381 aaacagcagt gataaaaatt aagccatgaa cgaaagtttg actaagttat attaattaga
1441 gttggtaaat ctcgtgccag ccaccgcggt catacgatta acccaaatta atagatccac
1501 ggcgtaaaga gtgtttaaga aaaaaaaatc acaatagagt taaattataa ctaagctgta
1561 aaaagcccta gttaaaataa aataacccac gaaagtgact ctaataatcc tgacacacga
1621 tagctaggac ccaaactggg attagatacc ccactatgcc tagccctaaa cccaaatagt
1681 tacataacaa aactattcgc cagagtacta ctcgcaactg cctaaaactc aaaggacttg
1741 gcggtgcttc acatccacct agaggagcct gttctataat cgataaaccc cgatagacct
1801 taccaaccct tgccaattca gcctatatac cgccatcttc agcaaacccc taaaaaggaa
1861 caatagtaag cacaatcata gcacataaaa acgttaggtc aaggtgtagc ttatgggttg
1921 gaaagaaatg ggctacattt tctacataag aatatccacc acacgaaagt ttttatgaaa
1981 ctaaaaacca aaggaggatt tagcagtaaa tcaagaatag agtgcttgat tgaataaggc
2041 catgaagcac gcacacaccg cccgtcaccc tcctcaagca tgtagtaata aaaataacct
2101 atattcaatt acacaaccat gcaagaagag acaagtcgta acaaggtaag catactggaa
2161 agtgtgcttg gattaccaaa gcatagctta aactaaagca cctagtttac acctagaaga
2221 tcccacaatg tatgggtact ttgaaccaaa gctagctcaa catactaaac aaatacaaaa
2281 atacaccaaa ataaaataaa acattcacct aacattaaag tataggagat agaaattttt
2341 atcctgacgc tatagagata gtaccgtaag ggaaagatga aagaataaat aaaagtaaaa
2401 aaaagcaaag attacccctt ctaccttttg cataatggtt taaccagaaa aaatctaaca
2461 aagagaactt tagctagata tcccgaaacc agacgagcta cccatgagca gtttaaaaga
2521 accaactcat ctatgtggca aaatagtgag aagacttgta ggtagaggtg aaaagcctaa
2581 cgagcctggt gatagctggt tgtccgagaa agaattttag ttcaacctta aaaatacccc
2641 aaaaacccta aattccaatg tatttttaag agatagtcta aaaaggtaca gctttttaga
2701 aacggataca accttgacta gagagtaaaa tcttaatact accatagtag gcctaaaagc
2761 agccatcaat tgagaaagcg ttaaagctca acaaattcac caacataatc ccaaaaacta
2821 ataacaaact cctagcccaa taccggacta atctattgaa acatagaagc aataatgtta
2881 atatgagtaa caagaagcct ttctcctcgc acacgcttac atcagtaact aataatatac
2941 tgataattaa caatcaataa accaaaacaa cactaaagcg tttattaatt atattgttaa
3001 cccaacacag gagtgcacca aggaaagatt aaaagaagta aaaggaactc ggcaaacaca
3061 aaccccgcct gtttaccaaa aacatcacct ctagcattac tagtattaga ggcaatgcct
3121 gcccagtgac accagtttaa cggccgcggt attctgaccg tgcaaaggta gcataaccac
3181 ttgttctcca aataaggact tgtatgaatg gccacacgag ggttttactg tctcttactt
3241 ccaatcagtg aaattgacct tcccgtgaag aggcgggaat aaaaaaataa gacgagaaga
3301 ccctatggag ctttaattaa ctattcccaa aagttaaaca attcaaccac aaagggataa
3361 aacataactt aacatggact agcaatttcg gttggggtga cctcggagta caaaaaaccc
3421 tccgagtgat tttaatctag acaaaccagt caaaataacc ataacatcac ttattgatcc
3481 aaaattttga tcaacggaac aagttaccct agggataaca gcgcaatcct attctagagt
3541 tcctatcgac aatagggttt acgacctcga tgttggatca ggacacccaa atggtgcaac
3601 cgctattaaa ggttcgtttg ttcaacgatt aaagtcctac gtgatctgag ttcagaccgg
3661 agcaatccag gtcggtttct atctattata aatttctccc agtacgaaag gacaagagaa
3721 atgggaccaa cctcacaaac gcgtctcaga gataattaat gatataatct taacctaatt
3781 aactcataat aaatccagcc ctagaacagg gcacattagg gtggcagaga ccggtaattg
3841 cgtaaaactt aaacctttat taccagaggt tcaactcctc tccctaatag catgttcata
3901 attaacattc taagcctaat cattcctatc ctactggccg tagcattcct caccctagta
3961 gaacgaaaag tactaggtta tatgcaacta cgaaaaggac ccaacgttgt aggcccctac
4021 ggcctactcc aacccatcgc cgatgcccta aaactattca ccaaagaacc cctacgacca
4081 gccacatcct caatctccat gttcattatt gcaccaatcc tagccttatc cctagcacta
4141 acaatatgag ttccactacc aataccctac cctctaatca acataaatct aggagtacta
4201 ttcatgctag ccatgtcaag cctagcagtc tactctatcc tatgatcagg atgagcatcc
4261 aactcaaaat acgcactcat cggggcccta cgagcagtag cccaaacaat ctcatatgaa
4321 gtaacactag caatcatcct actatcagta ctcctaataa atggatcata tactctatca
4381 accctaatca caacacaaga gcacatttga ataatcttta catcctgacc cctagccata
4441 atatgattta tctcaaccct agcagaaacc aaccgagccc cgttcgacct tacagaagga
4501 gagtcagaac ttgtatcagg ctttaacgta gaatatgcag ccggaccttt cgccatattc
4561 ttcatagcag aatatgccaa catcatcata ataaatgcat ttacagcaat tctcttccta
4621 ggagcatccc acgacccaca cacaccagaa ctatatacaa tcaacttcgt actaaaaaca
4681 ctcgcattaa caatcacctt cctatgaatc cgagcatcat acccacgatt ccgatacgac
4741 caactaatac atttactatg aaaaagcttc ctgcccctaa cactagctct atgtatatga
4801 cacatctcac tccctattat aacagcaagc attcccccac aatcatagaa atatgtctga
4861 taaaagagtt actttgatag agtaaaaaat agaggttcaa accctcttat ttctagaaca
4921 ataggactcg aacctaaacc tgagaattca aaattctccg tgctaccaaa atacaccaca
4981 ttctacagta aggtcagcta agctaagcta tcgggcccat accccgaaaa tgttggttca
5041 tacccttccc atactaatta atcccattat ctacactacc cttatcataa cagtaatgtc
5101 cggaaccata ctagtaataa tcagctcaca ctgactactc atctgaatcg gattcgaaat
5161 aaacctatta gcaataatcc cagtattaat aaaaaatttt aacccacgag ccacagaagc
5221 agccacaaaa tatttcctaa cacaagccac agcctccata atactaataa tagccatcat
5281 catcaacctc ctatattctg gccaatggac cattacaaaa atatttaacc cagtagcaat
5341 aacaataata accatggccc tagctataaa actaggactc tcacctttcc acttctgagt
5401 cccagaagta acccaaggca tttcactaca agcaggccta ctgttactaa catgacaaaa
5461 actagcccca ttatcagtac tatgccaaat ctcacaatca atcaacccaa acctaatact
5521 aactatagcc atattatcaa ttttaatcgg agggtgagga gggctaaatc aaacccaact
5581 tcgaaaaatc atagcatact catcaatcgc acacatagga tgaatgacag cagtattacc
5641 atacaacaca accataacaa tcttaaacct actaatttac atcacaataa cactagcaat
5701 attcatacta ttaatccaca gctcagcaac cacaacttta tccctatccc atacatgaaa
5761 caaaataccc gtcatcacaa gcctaataat agtaacccta ctctcaatag gaggcctgcc
5821 tccactatca ggatttatgc caaaatgaat aattattcaa gaaataacaa aaaatgaaag
5881 catcatcatg ccaacactca tagcaataac agcactgcta aacctctatt tctacatacg
5941 actagcctac tcctcctcac tgactatgtt cccatccacc aacaacataa aaataaaatg
6001 acaattcgaa cacacaaaac aaataaaatt acttcccaca ataattgtat tatcaacact
6061 agtcctacct ataacaccag ccctctcgtc cctaaactag gaatttaggt taacacagac
6121 caagagcctt caaagctcta agtaagtaca aagtacttaa ctcctgaaaa cctaaggact
6181 gcaggactta tcctacatca attgaatgca aatcaaacac tttaattaag ctaagtcctc
6241 actagattgg tgggattaca tacccacgaa acttttagtt aacagctaaa caccctaatc
6301 aactggcttc aatctacttc tcccgccgca ggaaaaaaaa ggcgggagaa gtcccggcag
6361 aattgaagct gcttctttga atttgcaatt caacatgata ttcaccacgg aactggcaaa
6421 aagagggctt aacctctgtc tttagattta cagtctaatg cttactcagc cattttacct
6481 atgttcgtaa atcgttgact atactcaaca aaccacaaag acatcggcac cctgtaccta
6541 ctatttgggg cctgagcagg aatagtgggc actgccttga gcctactaat tcgcgctgaa
6601 ctaggtcagc ccggaaccct acttggcgat gatcaaatct ataatgtaat tgttacagct
6661 catgcctttg taataatctt ctttatagta atacccatta tgattggggg ttttggtaac
6721 tgactcgtac cgctaataat cggagctccc gatatggcct ttccacgtat aaacaacata
6781 agtttctgac tacttccacc atccttccta ttactactgg catcctcaat agtaaaagcc
6841 ggggcgggta ctggatgaac cgtataccca cctttagctg gaaacttagc ccatgcagga
6901 gcttcagttg atctaacaat tttctcccta caccttgcag gtgtatcatc aatcctaggg
6961 gctattaatt tcattaccac aattattaac ataaaacctc ccgcaatgtc tcaataccaa
7021 acacccctgt ttgtctgatc agtactaatc acagccgtac tacttctact atccctgcca
7081 gttctagcag ctggcattac tatactactg acagaccgca acctgaacac aacctttttt
7141 gatccagcag gtggtggaga ccctatcctt tatcaacact tgttctgatt tttcggacac
7201 ccaaaagtat atattctcat cttaccaggg ttcggaataa tctcccacat tgtaacctac
7261 tattcaggta aaaaagaacc attgggatat ataggcatag tatgagccat aatgtccatt
7321 ggattcttag gttttattgt atgggctcac cacatattca ccgtaggaat agacgtagat
7381 acccgagcat actttacatc tgccacaata atcattgcta ttcccactgg agtaaaagta
7441 tttagttgat tagctaccct gcacggcggc aatattaaat gatcacccgc aatactatga
7501 gctttgggct tcatttttct attcaccgta ggaggtctaa cgggcattgt actagctaac
7561 tcctccctag acattgtatt acatgataca tattatgtag tcgcacactt ccactatgtc
7621 ttatctatag gagcagtgtt cgccattata gggggctttg ttcactgatt ccccctattc
7681 tccgggtaca cactcaacca agcatgagca aaaattcact ttgtaatcat attcgtagga
7741 gtaaatataa cattctttcc acaacacttt ctaggactat ccggaatacc tcgacgatac
7801 tccgattatc ctgacgcata cacagcatga aatactattt cctcaatagg ctcattcatc
7861 tcactaacag cagtgatatt aataatcttc attatctgag gagcattcgc atcaaaacga
7921 gaagtatctg cagtagaact gacaagcaca aacctagaat gactacacgg atgtcctcct
7981 ccctatcaca catttgaaga accaacatat atcaacctaa aataagcata agaaaggaag
8041 gaatcgaacc ctctcccact ggtttcaagc caacgtcata accactatgt ctttctcgat
8101 aatcgaggta ttagtaaaat attacataac tttgtcgaag ttatattata ggtgaaagcc
8161 ctatatgcct ctatggctta ccctttccaa ctaggcttcc aagacgccac ttcacccatc
8221 atagaagaac tcctacactt tcacgatcac accttaataa tcgtattctt aatcagctct
8281 ttagtgttat atatcatttc actcatacta acaacaaaac tgacacacac tagcacaatg
8341 gatgcccaag aagtagaaac aatttgcaca atcctacccg ctattattct aattcttatt
8401 gcccttccat cattacgaat cctttatata atagacgaaa ttaataaccc agccttaacc
8461 gtaaaaacca taggacatca atgatactga agctacgagt atacagacta tgaagacctc
8521 acctttgact catatataat ccccacatca gatcttaaac ctggagaaat acgactacta
8581 gaagtagaca atcgagttgt tctaccaata gaaataacaa tccgaatatt agtatcctct
8641 gaagacgtac tgcactcatg agccgtccca tccctcggtt taaaaacaga tgctatccca
8701 ggacgactaa accaaacaac tctaatatcc acacgacctg gcctttatta cggacagtgc
8761 tcagaaatct gtggatcaaa ccacagcttc atgcccattg tacttgaact tgtcccatta
8821 aagtacttcg aaaaatggtc aacatcaata ttaacaggtt cattgagaag ctagtcagca
8881 ctaacctttt aagttagaga tcgggagcct aaatctcccc tcaatggtat gccacaacta
8941 gatacatcca catgattcat tacaattaca tcaataatta taacattatt tattttattc
9001 caactaaaaa tctcaaacta ctcataccca gcaagcccag aatcaattga actcaaaact
9061 caaaaacata gcaccccttg agaaataaaa tgaacgaaaa tctatttgcc tcttttattg
9121 cccccacgat aataggacta cctattgtca ccttaattat tatattccca agcttactat
9181 tcccaacacc caaacgactc attaataacc gcacaatctc gatccaacaa tgattaatcc
9241 aactaacatc caaacaaata atagctattc acaaccaaaa aggccaaacc tgatcactaa
9301 tacttatatc tctaattata ttcattggct caacaaacat cctaggccta ctaccacact
9361 cattcacacc caccacacaa ctatcaataa acctgggtat agcaatcccc ctatgatcag
9421 caaccgtatt cacaggattc cgccataaaa ccaaaacatc actagcccac tttctaccac
9481 aaggaacacc cgccccatta attcctatgc tcgtaattat tgaaactatt agcctattta
9541 ttcaaccagt agccctagcc gtacgactga cagccaacat tacagcaggg cacctattaa
9601 ttcatctaat tggaggggcc acattagcac tactcaacat cagcactata acagctttta
9661 tcacatttac tatcctcatc ctattaacta ttcttgaatt tgcagtagct ctgatccaag
9721 cttatgtgtt tacactgcta gtaagcttat acctacacga caatacataa tgacccacca
9781 aacacatgca taccacatag taaacccaag cccatgacca cttaccggag ccctatcagc
9841 ccttttaata acatcaggcc taattatatg attccacttt aactctatac tcttactatc
9901 tctaggacta ttaaccaata ctttgacaat ataccaatgg tgacgagaca ttattcgaga
9961 aagcactttc caaggccacc acacatcagt tgtccaaaaa ggcttacgat acggtataat
10021 tttatttatt atttccgagg ttctgttctt cactggattc ttttgagctt tctaccactc
10081 aagcctagca ccaacacccg aattaggagg ttgctgacca ccaacaggaa ttcacccact
10141 aaacccccta gaagtacccc tactaaacac ctcaatcctc ctcgcctcag gagtatccat
10201 tacctgagcc catcacagcc taatagaagg ggaccgaaaa cacacaatcc aagcactatc
10261 catcaccatt gcactaggcg tatacttcac cctcctccaa gcctcagaat attacgaagc
10321 accattcaca atctccgacg gagtgtatgg atccactttc tttgtggcta caggatttca
10381 cgggttgcac gtaatcatcg gatctacttt cctagcagtg tgcttactac gacaactaaa
10441 attccacttc acatccaacc accacttcgg ctttgaagcc gcagcctgat actgacactt
10501 cgtagatgta gtttgactat tcctttacgt atcaatctat tgatgaggat cctactcttt
10561 tagtattaag cagtacaatt gacttccaat caatcagttt cggtaaactc cgaaaaagag
10621 taataaatat tatactaaca ctactcacaa acgtaaccct agcctcccta ctcgtactaa
10681 tcgcattctg actaccccaa ctaaacgcat attcagaaaa aacaagccca tatgaatgtg
10741 gatttgaccc cataggatca gcacgcctcc cattctcaat aaaatttttc ctagtagcca
10801 ttacatttct cctttttgat ctagaaatcg cccttctcct tcccctacca tgagcatccc
10861 aaacaaacaa tctaaaaaca atacttacaa tagcactatt ccttcttatc ctactagcag
10921 caagcctagc atacgaatga acccaaaaag gcctagaatg agcagaatat gataattagt
10981 ttaaaacaaa acaaatgatt tcgactcatt agactatgat ttacttcata attatcaagt
11041 gccattagta tatataaaca tcattatagc attcgcgatc gcccttgcag ggttacttat
11101 atatcgatct cacttaatat cttcactact atgcctagaa ggaatgatac tatcactatt
11161 catcatatcg actctaatta tcctaaacac acacttcacc ctagctaaca taatacccat
11221 tattttacta gtgtttgcag cctgcgaagc tgcactaggc ctgtcactac tagtaatagt
11281 atccaacaca tacggtaccg attacgtcca aaacttaaac cttttacaat gctaaaaatt
11341 attatcccaa caacaatact actacccata acatgaatat ctaaacacaa cataatctga
11401 atcaatgcaa cagtacatag tctcctcatt agcctgatca gtctatccct actaaaccaa
11461 ctaggcgaaa acagccttaa tttttcctta acattcttct ccgactcact atcagcaccc
11521 ctactagttc taaccacatg actcctcccc cttatactaa tagctagcca atctcaccta
11581 tcaaaagaaa ccacaacccg aaaaaaacta tatattacca tactaatcct actacaacta
11641 ttcctaatta taaccttcac cgccaccgaa ctaatcctat tctatatcct attcgaagca
11701 acactagtac ccacactaat tatcatcaca cgctgaggaa accaaacaga acgactcaat
11761 gcaggacttt atttcctatt ctacacccta gcaggatccc taccactgct agtagcacta
11821 gtttatatcc aaaacaccac aggctcacta aacttcttaa ttatccatta ctgatcccac
11881 ccattatcca actcttgatc aaacattttt atatgattag catgcatcat agccttcata
11941 gtaaaaatac ctctatacgg actccatctt tgactgccaa aagcccatgt agaagcccct
12001 attgcaggtt caatagtact tgcagccgta ctgctaaaac tcggaggcta tggcataatg
12061 cgaatcacta ctattctaaa cccactaaca aactacatag cctatccatt cctcatgctt
12121 tccatatgag gtataatcat aaccagctct atctgcttac gtcaaaccga cctaaaatcc
12181 ttaatcgctt attcatcagt aagtcatata gcacttgtaa tcgtagcaat cataattcaa
12241 accccctgaa gcttcatagg agccacagct ctcataattg cccacggact aacatcctcc
12301 atactattct gcctagccaa cactaactat gaacgagtac acagccgaac cataatccta
12361 gcccgaggac tgcaaacact cctaccactc atagcaacat gatgactaat agcaagcctc
12421 acaaacctag ccctaccccc atccatcaat ctaatcggag aattatttat cattacagca
12481 tcattttcat gatccaacat cacaattatt gtcataggaa taaacataat aattacagct
12541 ctctactctc tctacatact aattattaca caacgaggaa aatacaccca ccacattaac
12601 aacctcaaac cctcattcac acgagaaaac gccctcatag ccctacatat tctaccacta
12661 ctactactga ccttaaaccc taaaataatc ctaggacccc tttactgtag atatagttta
12721 ataaaaaccc tagattgtga atctagtaat agaaaattaa atattcttat ctaccgaaaa
12781 agtttgcaag aactgctaac tcatgcttcc acacttaaaa atgtggcttt ttcaactttt
12841 aaaggatagc agttatccgt tggtcttagg aaccaaaaaa ttggtgcaac tccaaataaa
12901 agtaataaac ccattcgcct cactcacatt aaccacactg actattctaa ccatcccaat
12961 tataatatcc aactcaaaca tctacaaaac taacctttac cctaactacg taaaaaccac
13021 cgtatcctac gccttcactc tcagcctagt ccccttacta atatttatac acacaggcca
13081 agaaataatc atctcaaact gacattgaat aaccctacag accgtagaac tctctcttag
13141 ctttaaaata gactatttct cagtaatatt cattcccgta gcactattcg tcacatgatc
13201 aattatagaa ttctccatat gatacataca ctcagacccc ttcatcaacc gattctttaa
13261 atacctacta ctattcttaa tcactataat aatcctcgta accgccaaca acctcttcca
13321 actctttatc ggatgagaag gcgtaggaat catatcattc ctgctaatcg gatgatgaca
13381 cggacgaaca gacgccaaca cagctgcact acaagcaatc ctatacaacc gcatcggaga
13441 cattggattt gtcctatcca tagcatgatt cttaacccac tcaaacgcat gagattttca
13501 acaaatcttt atactaaaca atgaatgccc aaacatacca ttaatcggcc tactcctagc
13561 tgcagcagga aaatcagctc aattcggact acatccctga ttgccctcag caatagaagg
13621 cccaactccc gtatcagcat tactacactc cagtacaata gtagtagcag gggtatttct
13681 actcatccgc ttctacccct taatagaaac taacaaacta gttcaaacca taacactatg
13741 cctaggagct atcaccacct tatttacagc actatgtgca atcacacaaa atgatatcaa
13801 aaaaatcgta gccttctcaa cttcaagcca actaggcttg ataatagtga caatcggcat
13861 caaccaaccc cacctagcat ttcttcatat ctgcatgcac gctttcttca aagcaatact
13921 attcatatgc tccggatcca ttatccacag cctcaatgac gaacaagaca tccgaaaaat
13981 aggcggactg tataaagcaa taccattcac aacaacagca ctaattattg gaagcctggc
14041 attaacagga atgccttatc tcacaggatt ctactcaaaa gaccttatca ttgaagcagc
14101 aaacatatcc tacacaaacg cctgagccct actaataaca ttaattgcca catccctaac
14161 cgctgcctac agcactcgaa ttatcttctt tgcattccta gggcaaccac gtttcccacc
14221 cctagtccta attaatgaaa ataaccccct actaattaac tctattaaac gccttttaat
14281 cggaagcatc ttcgctggct ttatcatctc caacaacatc ccaccaataa cagtaccaaa
14341 cacaacaata cccctttaca taaaaataac agccctaatc gtaaccatca taggattcat
14401 actagcccta gagctaaaca acacaaccta ctacctgaaa tttaaatacc catcacaaac
14461 atacaaattt tccaacatac taggatatta tccctccatc atacaccgcc taccaacata
14521 ccacaacctg tctataagcc aaaaatccgc atcatcatta ctagacttaa tttgactaga
14581 aactattcta ccaaaaacaa cctctttcat ccaaataaaa atatcaatta tagtatcaaa
14641 tcaaaaaggc ctaatcaaac tatactttct ctccttccta atcactatta taatcagcat
14701 aatactattt aattaccacg agtaatctcc ataataacaa caactccaat aagcaatgat
14761 caaccagtaa caataactaa tcaagtacca taactatata aagcagcaat ccccatagct
14821 tcctcactaa aaaaccctga atcacccgta tcataaatta ctcaatcccc aagcccatta
14881 aacttaaaaa taatttctac ttcctcttcc ttcaatgcat aataaaccat acaaaactcc
14941 attattaaac cagaaacaaa tgctccaaaa acagtcttat tagaaactca aacctcaggg
15001 tacatctcag tagccatggc agtagtataa ccaaaaacca ctaacatacc ccccaaataa
15061 atcaaaaaca ccattaaacc taaaaaagac ccaccaaaat tcaatacaat accacaacca
15121 actccaccac ttacaatcaa cccaagtcca ccataaatag gagagggttt agaagaaaaa
15181 ccaacaaacc caataacaaa aatagtactt aaaataaatg caatatatat tgtcattatt
15241 ctcacatgga atctaaccac gaccaatgac atgaaaaatc atcgttgtac ttcaactaca
15301 agaaccttaa tgaccaacat ccgaaaatca cacccactaa taaaaattat caacaacgca
15361 ttcattgacc tcccagcccc ctcaaacatc tcatcatgat gaaacttcgg ttccctctta
15421 ggcatctgcc taatcttgca aatcctaaca ggcctgttct tagcaataca ttacacatca
15481 gacacaacaa cagctttctc atcagttaca cacatctgtc gagacgtaaa ttacggatga
15541 gttattcgct acctacatgc aaacggagca tccatgttct ttatttgcct attcatccac
15601 gtaggccgag gcctatacta cggatcctat atattcctag aaacatgaaa cattggagta
15661 gtcctactat ttaccgttat agcaacagcc ttcataggct acgtcctgcc ctgaggacaa
15721 atatcattct gaggagctac ggtcatcaca aatctactat cagctatccc ttatatcgga
15781 acagacctcg tagaatgaat ctgagggggc ttttccgtcg acaaagcaac cctcacacga
15841 ttcttcgcct ttcactttat cctgccattc atcattaccg ccctcgcagc cgtacatctc
15901 ctattcctgc acgaaaccgg atccaacaac cctaccggaa tctcatcaga catagacaaa
15961 attccatttc acccatacta cactattaaa gacattctag gggccttatt tataatacta
16021 atcctactaa tccttgtact attctcacca gacctactag gagacccaga caactacacc
16081 ccagcaaacc cactaaacac cccaccccat attaaaccag aatgatattt cttattcgcc
16141 tacgctatcc tacgttcaat tcctaataaa ctaggtggag tgctagctct aatagcctcc
16201 atcctaatcc taattttaat gcccatacta cacacatcca aacaacgaagcataatattt
16261 cgaccactaa gtcaatgcct attctgaata ctagtagcag acctcattac actaacatga
16321 attggaggac aacccgtaga acacccattc atcatcatcg gccaactagc ctccatctta
16381 tatttcctaa tcattctagt attgatacca atcactagca tcatcgaaaa caacctatta
16441 aagtgaagag tctttgtagt atataaaata ccctggtctt gtaaaccaga aaaggaggac
16501 cacccctccc caagactcaa ggaaggagac taactccgcc atcagcaccc aaagctgaaa
16561 ttctaactaa actattccct g