分析扇贝的系统发育谱系的方法 本发明涉及分析扇贝的系统发育谱系的方法,特别是涉及测定扇贝的线粒体DNA(mtDNA)核苷酸碱基序列中的非编码区序列,以分析这种谱系的方法。
在过去,一直是从天然养鱼场中捕捉和直接生产扇贝,但近年来因需求量日益增加而导致扇贝大量人工养殖。结果,采用了某些人工技术来控制种子扇贝的接种繁殖,然而这对整个生物体的遗体结构造成不利影响,更不必说扇贝了。这种人工接种和培养控制将导致基因库的减少和扇贝地系统发育谱系品种的减少。这就意味着在不久的将来,特殊扇贝的群体将减少其谱系品种,而且其自身将不能适应周围环境的各种改变以留下其后式,造成意想不到的严重后果。因此,现在需要分析扇贝的特殊遗传结构,以确定作为保留其谱系多样性之关键因素的DNA多态性或核苷酸序列高变区。
具体地说,日本扇贝(Patinopecten yessoensis)广泛生存在日本北方岛屿、朝鲜半岛北部、萨哈林岛和千岛群岛的冷海岸,是用于食品和食品加工的最有吸引力的扇贝之一。从上面讨论的人工培养问题的角度看,还特别需要最大可能地保留这种日本扇贝谱系。
分析一个扇贝群体的遗传结构的常规方法是基于使用同工酶或异型酶。但是,已发现这些酶学方法的灵敏性较差,而且不足以用作特异性确定和分类特定日本海域中各个日本扇贝群体之谱系的工具。另外,这些常规方法的问题是需要大量的待分析样品、耗费的时间长,以及分析方法中有些步骤的效率低。
此外,迄今尚未报导全面分析每个不同的日本扇贝群体的遗传特征,以及日本扇贝mtDNA之特定碱基序列的方法。因此,迄今尚不能得到有关日本扇贝谱系的数据。
从上述缺点看,本发明的主要目的是提供确保以高精确性和可靠性分析扇贝的系统发育谱系的方法。
为此目的,本发明的方法基本上包括测定扇贝的线粒体DNA(mtDNA)的序列以确定mtDNA之核苷酸序列的步骤,其中核苷酸碱基序列包括其中存在有核苷酸碱基取代座位的非编码区,所说的座位显示作为扇贝之特定谱系指征的序列多态性。
在本发明的一个方面中,该方法可包括以下步骤:从扇贝的闭壳肌中提取作为模板DNA的总DNA;使用基于已知有壳水生动物线粒体16S rRNA基因和12S rRNA基因间保守的核苷酸碱基序列而设计的适当引物,以聚合酶链反应法从模板DNA扩增mtDNA;测定如此扩增之mtDNA的序列同时确定其中的非编码区;然后,使用基于已确定之mtDNA核苷酸碱基序列所设计的适当引物,测定非编码区的序列;定位非编码区中的核苷酸序列取代座位,从而确定扇贝的特定谱系。
使用上述包括Pyso 16S BF引物(5′-CGGCGAAGCCAGGTCAGTTTCTATC-3′)和Pyso 12S BR引物(5′-AGAGCGACGGGCGATGTGTACAC-3′)的适当引物组,分析日本扇贝(Patinopecten yessoensis)线粒体DNA的核苷酸碱基序列,同时定位碱基序列中的非编码区,然后用上述包括Pyso 16S BF引物(5′-CGGCGAAGCCAGGTCAGTTTCTATC-3′)、Pyso NcR引物(5′-AGGTAACCAGAACCAAACTACC-3′)和Pyso 12S AR引物(5′-ACTGCTGGCACCTGGTTGGA-3′)的适当引物组测定mtDNA非编码区的序列。
在本发明的另一个方面中,可以将使用上述适当引物组经前述聚合酶链反应得到的不同扇贝样品的多个不同的扩增的mtDNA分成各自相当于各个不同扇贝群体的不同组群,并测定扩增的各mtDNA的序列同时确定其中的非编码区。然后,使用上述适当的引物测定非编码区的序列,以定位各个不同组群之非编码区中的核苷酸序列取代座位,从而确定作为各组扇贝之特定谱系指征的序列多态性,并借以将不同的扇贝分类为特定的谱系。在那些步骤中,可以包括以下步骤:比较各不同扇贝样品间的核苷酸碱基序列取代座位;从不同的扇贝样品中选择出具有相同核苷酸碱基序列取代座位的特定扇贝样品;得到这些特定样品间的高群体频率;并基于高群体频率确定特定样品间的祖先相同性,从而找出不同扇贝群体间的相同祖先。
在本发明的另一个方面,为了对多个扇贝样品进行高效分析,可在扩增多个扇贝样品的mtDNA后,使用Pyso 16S BF、Pyso NcR和Pyso 12S AR引物直接测定mtDNA非编码区的序列,以定位非编码区中的核苷酸序列取代座位,从而基于不同的扇贝群体快速分析各组多个扇贝样品的谱系。
通过阅读下面的说明书,并参照附图本发明的其它各种优点和特征将明显可见。
图1列出了用于扩增扇贝的相关DNA区域并进行测序的所有引物;
图2显示了SAROMA和AOMORI群体中日本扇贝线粒体DNA之非编码区的序列多态性;
图3显示了已经受LA-PCR扩增的SAROMA、AOMORI和美国扇贝样品中已扩增之线粒体DNA的电泳图形。
图4(A)图解显示了SAROMO和AOMORI样品共有的线粒体DNA的核苷酸碱基序列。
图4(B)显示了图4(A)中所示线粒体DNA之完整核苷酸碱基序列的碱基序列密码。
就脊椎动物和软体动物的线粒体DNA而言,已确定了某些种的完整核苷酸碱基序列(例如参见Hoffmann et al.,Genetics 131:397-412,1992;Hatzoglou et al.,Genetics 140:1353-1366,1995)。脊椎动物线粒体DNA(mtDNA)在其基因组结构中包括显示有很大核苷酸碱基多样性的非编码区,即表明其中发生某些突变的高可变碱基序列(Wilding et al.,J.Mol.Evol.48:348-359,1999;Kurabayashi et al.,Mol.Biol.Evol.,17:266-277,2000)。因此,已将非编码区作为谱系分析和系统发育研究及群体遗传研究的标准。另外,mtDNA是母体遗传的,并且已知其在脊椎动物中有高的突变率。
就扇贝来说,Sellos等人报道说已克隆了扇贝(Pecten maximus)的5.5kbp mtDNA区段,并且测序发现这种mtDNA区段含有两种多肽的基因,两个rRNA和5个tRNA,以及长度为8-125bp的基因间序列(Genbank登记号X92688,1997)。但他们并没有作进一步的研究。La Roche等人和Rigaa等人已表征了扇贝Placopectenmagellanicus和Pecten miximus之mtDNA中的重复元件(Mol.Biol.Evol.7:45-64,1990;J.Mol. Evol.41:189-195,1995)。根据Fuller和Zouros(1993)的报导,发现这种重复元件负责扇贝Placopectenmagellanicus中mtDNA的个体间和个体内长度变异(Curr.Genet.23:365-369,1993)。
从上述关于非日本扇贝种之mtDNA的在先发现来看,我们已对日本扇贝(Patinopecten yessoensis)之mtDNA的核苷酸碱基序列进行了特定分析,并发现这种日本扇贝之mtDNA片段的序列含有一个可显示各个不同扇贝群体之序列多态性的非编码区。
下面将详细描述我们已完成的,用于分析日本扇贝之两个典型的不同群体中的mtDNA方法的一个优选实例,并与外国扇贝进行比较分析,以进一步确定各个日本扇贝群体的详细的系统发育谱系。
1.DNA提取
在本实施例中,提供了下列三种不同的扇贝:两种不同的日本扇贝,一种是在日本的Lake Saroma,Hokkaido培养的,包括同一扇贝群体的多个个体(以下称为“SAROMA”);另一种是在日本的Aomori海岸培养的,也包括同一扇贝群体的多个个体(以下称为“AOMORI”);再一种则是于北美洲培养的外国扇贝(以下称为“美国样品”)。应指出的是,为简便起见,这部分说明中所提到的样品只是取自上述SAROMA和AOMORI群体中的各一个样品及一个美国样品。
从上述三个不同的样品中分别制备约50-100mg小块闭壳肌,从而为下述DNA提取步骤提供约50-100mg的三种扇贝样品。
向三个样品中各加入500μl含有20mg/ml蛋白酶K的TNES-尿素缓冲液,然后于37℃保温样品2小时。保温后,用苯酚-氯仿-异戊醇(25∶24∶1)将裂解物提取2次(即所谓“苯酚-氯仿处理”),然后,经乙醇沉淀回收整个DNA并溶解在50μl蒸馏水中。根据Asahida等人(Fisheries Sci.62:727-730,1996)的方法进行此DNA提取。为了用此方法处理多个样品,使用Multiscreen 96孔滤板FB(Millipore)从保温后的裂解物中回收DNA,并使用96孔DNA沉淀HL试剂盒(Edge Biosystems)以异丙醇沉淀法纯化之。
2.mtDNA片段的扩增
为了从如此提取的各总DNA(模板DNA)中扩增靶mtDNA,使用长而准确的聚合酶链反应(以下称为LA-PCR,LA-PCR试剂盒购自Takara Shuzo),并基于已知甲壳动物线粒体16S rRNA基因和12S rRNA基因间保守的核苷酸序列,设计如图1中所示的将用于LA-PCR的引物。具体地说,首先将大约5-10ng模板DNA与下列物料混合,以制备50μl反应溶液:
LA-Tag聚合酶:5单位;LA-PCR缓冲液:1X;
MgCl2:2.5 mM;dNTP:各400μM;引物:0.2μM。
使用下列八个引物的几种组合,在前述反应溶液中进行LA-PCR:Pyso 16S AF、Pyso 16S AR、Pyso 16S BF、Pyso 16S BR、Pyso12S AF、Pyso 12S AR、Pyso 12S BF和Pyso 12S BR。这些引物的碱基序列如表1中所示。LA-PCR的步骤包括94℃初始变性7分钟,然后进行35次下列反应:98℃变性20秒,55℃退火1分钟和72℃延伸10分钟。
通过0.7%琼脂糖凝胶电泳分离PCR产物,并经溴化乙锭染色显现之。电泳后,从琼脂糖凝胶上切下扩增的DNA并用GFX PCR DNA和凝胶带纯化试剂盒(Ameraham)纯化之。然后,使用pGEM-T Easy(Promega)载体,以大肠杆菌XL1-1 Blue克隆如此处理的扩增的DNA。使用T7引物、SP6引物或选自图1中所列引物中的适当引物,借助染料终止法(如由PE Bioxystems生产的BigDye TerminatorCycle测序试剂盒)测定每个扩增的DNA片段的核苷酸碱基序列。另外,也可以在按上述方法纯化后,不经前述克隆即直接用染料终止法进行序列测定。
这些电泳图形中显现的扩增的DNA片段如图3所示,其中观察到SAROMA和AOMORI样品均在1.3kbp水平上显示其各自与众不同的带,而美国样品则在1.5kbp水平上显示其与众不同的带(相对于凝胶介质中的标志参考带(M)而言)。这一碱基对差异明显地表明,日本扇贝在线粒体结构上不同于美国扇贝。另外,实验显示可以从种和生境出发来容易地将这两种扇贝彼此区分开。再者,这一结果使我们进一步证实,两种日本样品的1.3kbp带是用引物组:Syso 16SBF和Pyso 12S BR检测的,而美国样品的1.5kbp带是用引物组:Pyso12S BF和Pyso 16S BR检测的。使用适当的测序仪测定SAROMA和AOMORI样品中1.3kbp DNA的序列。结果,发现SAROMA样品的1.3kbp带在碱基序列上只除了两个碱基外,几乎完全相同于AOMORI样品的1.3kbp带。使用NCBI BLAST服务器或tRNAscan-SE检索服务器(htto://www.genetics.wustl.edu/eddv/tRNAscan-SE),经同源性检索分析这两种样品的核苷酸碱基序列的数据。结果,发现两种日本样品的碱基序列都含有下列三个特定的基因:16S rRNA基因、tRNA基因和12S rRNA基因,并且进一步含有下列第一和第二非编码区:NcR1和NcR2(参见图4(A)和图4(B))。我们还发现,16S rRNA和12S rRNA基因区各显示与扇贝Pecten maximus之mtDNA的各自16SrRNA和12S rRNA基因区(由Sellos等人测序,1997)有最高同源性,故认为所研究的1.3kbp DNA衍生于线粒体DNA,而不是核DNA。即是说,现在确定的1.3kbp是日本扇贝(Patinopecten yessoensis)的mtDNA,其碱基序列示于图4(A)中。图4(B)中特别是显示日本扇贝之1.3kbp mtDNA的整个编码的核苷酸碱基序列。
基于对某些个体之1.3kbp mtDNA的序列测定结果,我们确定非编码区NcR1和NcR2似乎有很强的序列变异和高突变率。认为这两个非编码区NcR1、NcR2是Saroma和Aomori扇贝群体的个体间发生特异性碱基取代或突变的区域。
3.对mtDNA中非编码区的分析
鉴于mtDNA是母体遗传的并且具有高突变率,所以日本扇贝的mtDNA,特别是其中的非编码区(NcR1和NcR2)也是母体遗传的并且具有高突变率(如上所述)。取SAROMA扇贝1.3kbp mtDNA片段的总共19个样品(即SAROMA群体中的19个扇贝个体),并取AOMORI扇贝1.3kbp mtDNA片段的总共20个样品(即AOMORI群体中的20个扇贝个体),分析这些非编码区的碱基序列。当然,那些多个样品已经受到上述所有处理,包括LA-PCR,其中将扩增的1.3kbp mtDNA片段分成有适当的相应标记的不同组,然后在如上所述的同样条件下进行了测序。
可用任何一种适当的方法测定见于每个样品mtDNA中的非编码区(NcR1和NcR2)的序列。在本实施例中,使用下列三个引物进行上述的染料终止法:Pyso 16S BF、Pyso NcR和Pyso 12S AR,以确定每个SAROMA(19个)和AOMORI(20个)样品的非编码区特异的核苷酸碱基序列。或者,也可以使用适当的引物组进行变性梯度凝胶电泳,以代替染料终止法。
最后,经测定每个SAROMA和AOMORI样品的非编码区碱基序列,揭示出有多个不同核苷酸碱基取代座位定位于非编码区内(特别是第二非编码区NcR2内,参见图2和图4(B)),其表明扇贝个体间mtDNA中的序列多态性。从图2可以看出,SAROMA群体包括10个不同的母系遗体谱系(Gs-1至Gs-10),而AOMORI群体则包括5个不同的母系遗传谱系(Ga-1至Ga-5)。
上述分析的结果进一步显示,SAROMA群体的单元型Gs-1和Gs-8在图2所示核苷酸碱基序列号126至378范围内,在核苷酸碱基序列和序列取代座位上分别相当于AOMORI群体的单元型Ga-1和Ga-4,并提示各个SAROMA和AOMORI单元型的母系遗体群体频率总数分别高达42.11和80%。两群体中共有单元型的这种高群体频率提示,分别相当于AOMORI之单元型Ga-1和Ga-4的SAROMA之单元型Gs-1和Gs-8,是日本扇贝群体中的母系遗传祖先。但在这方面,可以从这一结果推断,从SAROMA群体至AOMORI群体,或反之将会有某些人为迁移。而从图2所示的数据看,这种推测并不太实际,因为图2显示扇贝个体的品种是各自特异于SAROMA和AOMORI群体的。
另外,就序列编号229至449而言,从这一分析结果我们计算出SAROMA群体有0.80%核苷酸碱基多样性,而AOMORI群体有0.38%核苷酸碱基多样性。也就是说,发现SAROMA群体的核苷酸碱基多样性大约是AOMORI群体的两倍,这表明前者相对于后者具有更大的基因库。
根据以上对本发明所作的描述,可以理解到:
(ⅰ)借助PCR分析日本扇贝之mtDNA的核苷酸碱基序列。核苷酸碱基序列的编码如图4(B)中所示。进一步测定显示序列多态性的mtDNA的非编码区的序列,以定位其中的核苷酸碱基取代座位,从而比较性确定某特定扇贝群体的每个扇贝个体中的群体频率,并找出不同扇贝群体间的相同核苷酸碱基序列。基于那些群体频率和相同核苷酸碱基序列,很容易将每个扇贝群体的个体分类为不同谱系,并且,确定不同扇贝群体间的相同核苷酸碱基序列也能判定它们中的某些群体属于母系遗传上同源的群体。因此,有可能用这种分析方法阐明扇贝的系统发育谱系并将扇贝分类为不同的谱系,并且
(ⅱ)与常规酶学分析方法相反,在本发明中将PCR和染料终止方法联合使用,不仅大大提高了分析扇贝mtDNA的灵敏性和精确度,而且也提供了一种快速分析方法,因为该方法并不需要大量样品,也不需要如见于酶学方法中的任何其它的复杂步骤。还可以以高精确度和高速度分析许多样品。
在上述分析中,本发明人发现有必要在地域基础上对天然扇贝群体和人工培养的扇贝群体间的基因组结构进行比较检索。
虽然已描述了本发明,但应明确的是,本发明不只限于这些说明性实施例如实施方案,在不背离待批权利要求范围的前提下可以对本发明作出许多其它改动、替代和增加。本发明的上述方法基本上也可应用于日本扇贝以外的其它种类的扇贝,但为了分析这些扇贝的系统发育谱系,可在设计所使用的引物、PCR条件等方面进行某些调整。