《一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统.pdf》由会员分享,可在线阅读,更多相关《一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统.pdf(39页完整版)》请在专利查询网上搜索。
1、(10)授权公告号 (45)授权公告日 (21)申请号 201410361064.4 (22)申请日 2014.07.25 C12Q 1/68(2006.01) C12N 15/11(2006.01) (73)专利权人 公安部物证鉴定中心 地址 100038 北京市西城区木樨地南里 17 号 (72)发明人 李彩霞 魏以梁 叶健 (74)专利代理机构 北京同立钧成知识产权代理 有限公司 11205 代理人 刘芳 (54) 发明名称 一种对未知来源个体进行非、 欧、 东亚群体遗 传主成分析的方法和系统 (57) 摘要 本发明提供一种对未知来源个体进行非、 欧、 东亚群体遗传主成分析的方法和系统,。
2、 所述方法 包括提取未知来源个体的 DNA ; 获得所述 DNA 的 27 个非、 欧、 东亚群体特异性位点的基因型 ; 将所 述各特异性位点的基因型利用 STRUCTURE 软件获 得群体遗传主成分分析结果。本发明提供的方案 能实现对未知来源个体的非、 欧、 东亚群体遗传主 成分析, 并为未知来源个体进行非、 欧、 东亚群体 来源推断提供数据支持。 (51)Int.Cl. 审查员 刘超 (19)中华人民共和国国家知识产权局 (12)发明专利 权利要求书2页 说明书13页 序列表20页 附图3页 CN 104212886 B 2016.06.22 CN 104212886 B 1.一种对未知来。
3、源个体进行非、 欧、 东亚群体遗传主成分析的方法, 其特征在于, 该方 法包括: 1)提取未知来源个体的DNA; 2)获得所述DNA的27个非、 欧、 东亚群体特异性位点的基因型, 所述27个非、 欧、 东亚群 体特异性位点为: rs595961,rs2710684,rs260690,rs10496971,rs10497191,rs6444724, rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs7752055,rs321198,rs366178, rs3780962,rs4244304,rs1498553,rs3825663,rs72840。
4、4,rs1448485,rs7170869, rs1453858,rs2342747,rs4787040,rs881929,rs1197062和rs4789193; 还包括采用与所述27个特异性位点一一对应的27对扩增引物对其进行扩增以获得扩 增产物的步骤; 以及使用与所述27个特异性位点一一对应的27条延伸引物对所述扩增产物 进行延伸以获得延伸产物的步骤; 所述扩增引物为序列表中SEQIDNo.1至SEQIDNo.54的核苷酸序列; 所述延伸引物 为序列表中SEQIDNo.55至SEQIDNo.81的核苷酸序列; 3)将所述各特异性位点的基因型利用STRUCTURE软件获得群体遗传主成分分析。
5、结果。 2.根据权利要求1所述的方法, 其特征在于, 其中2)还包括在获得延伸产物后, 使用遗 传分析仪分析该延伸产物, 以获得所述27个特异性位点的基因型的步骤。 3.一种对未知来源个体进行非、 欧、 东亚群体遗传主成分析的系统, 其特征在于, 所述 系统包括DNA提取体系, 复合扩增检测体系, 数据获取体系; 所述DNA提取体系用于提取未知来源个体的DNA; 所述复合扩增检测体系用于获得所述DNA的27个非、 欧、 东亚群体特异性位点的基因 型, 所述27个非、 欧、 东亚群体特异性位点为: rs595961,rs2710684,rs260690,rs10496971, rs1049719。
6、1,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs159606, rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs728404, rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062和 rs4789193; 其中, 所述复合扩增检测体系用于采用与所述27个特异性位点一一对应的27对扩增引 物对其进行扩增以获得扩增产物, 并使用与所述27个特异性位点一一对应的27条延。
7、伸引物 对该扩增产物进行延伸以获得延伸产物, 并由获得的延伸产物得到未知来源个体的DNA的 27个特异性位点的基因型; 所述扩增引物为序列表中SEQIDNo.1至SEQIDNo.54的核苷酸序列, 所述延伸引物 为序列表中SEQIDNo.55至SEQIDNo.81的核苷酸序列; 所述数据获取体系用于由所述各特异性位点的基因型利用STRUCTURE软件获得群体遗 传主成分分析结果。 4.一种复合扩增检测体系, 其特征在于, 所述体系包括未知来源个体DNA, 27个非、 欧、 东亚群体特异性位点, 扩增引物以及延伸引物, 所述复合扩增检测体系用于利用扩增引物扩增未知来源个体的DNA的27个特异性位。
8、点 获得扩增产物, 并使用延伸引物对该扩增产物进行延伸, 并由获得的延伸产物得到未知来 源个体的DNA的27个特异性位点的基因型; 所述27个非、 欧、 东亚群体特异性位点为: rs595961 ,rs2710684 ,rs260690 , 权利要求书 1/2 页 2 CN 104212886 B 2 rs10496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220, rs159606,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663。
9、, rs728404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062 和rs4789193; 所述扩增引物由与所述27个特异性位点一一对应的27对扩增引物组成, 所述扩增引物 为序列表中SEQIDNo.1至SEQIDNo.54的核苷酸序列; 所述延伸引物由与所述27个特异性位点一一对应的27条延伸引物组成, 所述延伸引物 为序列表中SEQIDNo.55至SEQIDNo.81的核苷酸序列。 5.一种检测试剂盒, 其特征在于, 包括权利要求4所述的复合扩增检测体系。 权利要求书 2/2 页 3 CN 1042。
10、12886 B 3 一种对未知来源个体进行非、 欧、 东亚群体遗传主成分析的方 法和系统 技术领域 0001 本发明涉及一种推断未知个体来源的方法和系统, 尤其涉及一种对未知来源个体 进行非、 欧、 东亚群体遗传主成分析的方法和系统。 背景技术 0002 伴随经济全球化, 不同国家、 区域间的人员流动加大, 涉外、 反恐、 跨区域流动作案 等复杂案件不断增多, 案件侦查的难度日益加大。 例如, 北京、 上海、 广东等大城市经常出现 涉外案件。 目前国际人种主要分为欧洲、 非洲、 东亚三大人种及由这些人种形成的混合人 种, 我国境内的混合人群主要包括新疆的维吾尔族、 哈萨克族、 柯尔克孜族等欧洲。
11、和东亚的 混合人群。 0003 通常, 从案件现场生物检材中提取到的DNA会进行STR检测, 分型结果录入数据库 比对查找, 或者直接与目标嫌疑人的STR分型进行比对。 而在比对不中的情况下, 我们还可 以利用DNA中蕴含的祖先信息(例如群体遗传主成分析)来推测供者的群体来源, 这对案件 的侦破能起到指导性作用。 在基因组DNA中, 有一部分常染色体SNPs等位基因在不同人群中 会存在较大的频率分布差异, 差值 0.3, 这部分位点被定义为AIMs。 0004 国际上针对洲际层面非、 欧、 东亚这3大最主要人群的分类划分已经研究的较为深 入, 形成了很多不同的AIMs位点组合, 并构建了少数几。
12、套复合扩增检测体系用于实践检验。 目前, 由于已有的AIMs位点组合包含的位点数目较多, 不易于构建复合扩增检测体系, 且由 于受到SNP检测平台的限制, 这些已经构建的检测体系也很难推广使用。 0005 因此, 如何提供一种能有效的对未知来源个体进行非、 欧、 东亚群体遗传主成分析 的方法和系统, 并具有广泛的适用性成为有待解决的问题。 发明内容 0006 本发明提供了一种对未知来源个体进行非、 欧、 东亚群体遗传主成分析的方法, 通 过获得未知来源个体的DNA的27个非、 欧、 东亚群体特异性位点的基因型, 结合STRUCTURE软 件对未知来源个体的非、 欧、 东亚群体遗传主成分析, 从。
13、而为进行未知来源个体的非、 欧、 东 亚群体来源推断提供数据支持。 0007 本发明还提供了一种对未知来源个体进行非、 欧、 东亚群体遗传主成分析的系统, 利用该系统中的复合扩增检测体系能快速获得未知来源个体的DNA27个非、 欧、 东亚群体特 异性位点的基因型, 进而与现有软件结合, 实现对未知来源个体的非、 欧、 东亚群体遗传主 成分析。 0008 本发明还提供了一种复合扩增检测体系, 能快速获得未知来源个体的DNA27个非、 欧、 东亚群体特异性位点的基因型, 为获得未知来源个体的非、 欧、 东亚群体遗传主成分分 析结果提供数据支持。 0009 本发明还提供了一种检测试剂盒, 含有所述复。
14、合扩增检测体系。 该试剂盒能快速 说明书 1/13 页 4 CN 104212886 B 4 获得未知来源个体的DNA27个非、 欧、 东亚群体特异性位点的基因型。 0010 本发明提供的一种对未知来源个体进行非、 欧、 东亚群体遗传主成分析的方法, 该 方法包括: 0011 1)提取未知来源个体的DNA; 0012 2)获得所述DNA的27个非、 欧、 东亚群体特异性位点的基因型, 所述27个非、 欧、 东 亚群体特异性位点为: rs595961 ,rs2710684 ,rs260690,rs10496971 ,rs10497191 , rs6444724,rs1586861,rs28777。
15、,rs13182883,rs1366220,rs159606,rs7752055,rs321198, rs366178,rs3780962,rs4244304 ,rs1498553,rs3825663,rs728404 ,rs1448485 , rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062和rs4789193; 0013 3)将所述各特异性位点的基因型利用STRUCTURE软件获得群体遗传主成分分析结 果。 0014 进一步的, 上述2)包括采用与所述27个特异性位点一一对应的27对扩增引物对其 进行扩增以获得扩增产物的步。
16、骤; 以及使用与所述27个特异性位点一一对应的27条延伸引 物对所述扩增产物进行延伸以获得延伸产物的步骤。 0015 更进一步的, 所述扩增引物为序列表中SEQIDNo.1至SEQIDNo.54的核苷酸序 列; 所述延伸引物为序列表中SEQIDNo.55至SEQIDNo.81的核苷酸序列。 0016 在本发明的一个具体实施方式中, 2)还包括在获得延伸产物后, 使用遗传分析仪 分析该延伸产物, 以获得所述27个特异性位点的基因型的步骤。 在本发明的方案中, 所述遗 传分析仪可以是本领域技术人员常规使用的遗传分析仪, 例如ABI3130或ABI3500型遗传分 析仪, 通过ID-X软件或其他Ge。
17、neMapper软件等分析该延伸产物中所述27 个特异性位点的基因型。 0017 本发明提供的一种对未知来源个体进行非、 欧、 东亚群体遗传主成分析的系统, 包 括DNA提取体系, 复合扩增检测体系, 数据获取体系; 0018 所述DNA提取体系用于提取未知来源个体的DNA; 0019 所述复合扩增检测体系用于获得所述DNA的27个非、 欧、 东亚群体特异性位点的基 因型, 所述27个非、 欧、 东亚群体特异性位点为: rs595961 ,rs2710684 ,rs260690 , rs10496971,rs10497191,rs6444724,rs1586861,rs28777,rs1318。
18、2883,rs1366220, rs159606,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663, rs728404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062 和rs4789193; 0020 所述数据获取体系用于由所述各特异性位点的基因型利用STRUCTURE软件获得群 体遗传主成分分析结果。 0021 在本申请的方案中, STRUCTURE软件为本领域现有的数据分析软件, 其使用方法为 本领域已知的, 利用上。
19、述软件实施本发明的方案对本领域技术人员来说是可以实现的。 0022 进一步的, 所述复合扩增检测体系用于采用与所述27个特异性位点一一对应的27 对扩增引物对其进行扩增以获得扩增产物, 并使用与所述27个特异性位点一一对应的27条 延伸引物对该扩增产物进行延伸以获得延伸产物, 并由获得的延伸产物得到未知来源个体 的DNA的27个特异性位点的基因型。 0023 更进一步的, 所述扩增引物为序列表中SEQIDNo.1至SEQIDNo.54的核苷酸序 说明书 2/13 页 5 CN 104212886 B 5 列, 所述延伸引物为序列表中SEQIDNo.55至SEQIDNo.81的核苷酸序列。 00。
20、24 本发明提供的一种复合扩增检测体系, 包括未知来源个体DNA, 27个非、 欧、 东亚群 体特异性位点, 扩增引物以及延伸引物, 0025 所述复合扩增检测体系用于利用扩增引物扩增未知来源个体的DNA的27个特异性 位点获得扩增产物, 并使用延伸引物对该扩增产物进行延伸, 并由获得的延伸产物得到未 知来源个体的DNA的27个特异性位点的基因型; 0026 所述27个非、 欧、 东亚群体特异性位点为: rs595961 ,rs2710684 ,rs260690, rs10496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs13。
21、66220, rs159606,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663, rs728404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062 和rs4789193; 0027 所述扩增引物由与所述27个特异性位点一一对应的27对扩增引物组成, 所述扩增 引物为序列表中SEQIDNo.1至SEQIDNo.54的核苷酸序列; 0028 所述延伸引物由与所述27个特异性位点一一对应的27条延伸引物组成, 所述延伸 引物。
22、为序列表中SEQIDNo.55至SEQIDNo.81的核苷酸序列。 0029 本发明提供的一种检测试剂盒, 其特征在于, 包括所述的复合扩增检测体系。 0030 在本发明的方案中, 本发明利用所述复合扩增检测体系进行27个特异性位点的分 型的方法, 包括: 1)将提取的未知来源个体DNA作为模板; 2)使用所述扩增引物对作为模板 的未知来源个体DNA进行多重PCR扩增反应以得到扩增产物; 3)使用延伸引物对该扩增产物 进行延伸(例如SNaPshot延伸); 4)将所述延伸产物利用遗传分析仪进行分析, 以获得27个 特异性位点的分型结果。 0031 上述27个特异性位点的组合是申请人通过查阅大量。
23、参考文献, 通过对非、 欧、 东亚 人群的生活环境、 种族起源等进行综合分析, 考察各地区民族人口的表型特征差异, 包括外 形特征, 生理指标等, 针对这些差异进行文献和网络数据库调研, 在已有研究的基础上获得 的能进行非洲、 欧洲、 东亚个体来源推断的位点的组合。 并且这些位点的组合适合构建one- tube复合扩增体系。 0032 所述未知来源个体可以为来自非洲、 欧洲、 东亚人群, 以及其混合人群的样本, 例 如血样、 脱落细胞、 骨头、 牙齿、 精斑和口腔拭子等样本, 这些样本的个体来源未知。 0033 本发明的所述27个非、 欧、 东亚群体特异性位点的信息如表1所示: 0034 表1。
24、 0035 序号SNP位点染色体等位基因 1rs5959611A/G 2rs27106842C/T 3rs2606902A/C 4rs104969712G/T 5rs104971912C/T 6rs64447243A/G 7rs15868613C/T 说明书 3/13 页 6 CN 104212886 B 6 8rs287775A/C 9rs131828835A/G 10rs13662205C/T 11rs1596065A/G 12rs77520556C/T 13rs3211987A/G 14rs3661788G/T 15rs378096210A/G 16rs424430410C/T 17rs。
25、149855311A/G 18rs382566314C/T 19rs72840415A/G 20rs144848515A/C 21rs717086915A/G 22rs145385815A/T 23rs234274716A/G 24rs478704016A/T 25rs88192916G/T 26rs119706217A/C 27rs478919317A/T 0036 本发明提供的优选扩增引物序列如下。 27对扩增引物用PRIMERPREMIER5.0 (PREMIERBiosoft,PaloAlto,CA,USA)设计, 所述27对扩增引物及其相对应的基因座如下 表2所示, PCRU代表上游。
26、引物, PCRL代表下游引物; 说明书 4/13 页 7 CN 104212886 B 7 0037 说明书 5/13 页 8 CN 104212886 B 8 0038 说明书 6/13 页 9 CN 104212886 B 9 0039 0040 本发明的方案具有以下优点: 0041 1、 本发明方法和系统可以进行非洲、 欧洲、 东亚人群, 以及其混合人群(例如中亚 说明书 7/13 页 10 CN 104212886 B 10 人群(欧、 东亚人群的混合)等)的祖先成分划分(即群体遗传主成分分析), 在涉外、 反恐案 件中, 尤其对于在上述案件中提取到的不同种族地域来源人群的生物样本, 。
27、在STRs分型比 对不中的情况下, 确定涉案人员的群体身份来源, 使案件快速定性和明确侦查方向, 能发挥 重要作用。 0042 2、 本申请的方法和系统, 采用27个特异性位点的组合, 构成出能对未知来源个体 进行有效的复合扩增的检测体系, 尤其是one-tube复合扩增体系, 可以节省DNA模板量, 并 适用于毛细管电泳分析方法。 这使得本发明的方法和系统能有效在各种涉及非、 欧、 东亚群 体来源推断的案件中广泛应用。 0043 3、 由实施例数据可以看出, 本申请的方法和系统应用于2起案件4例DNA供者的非、 欧、 东亚群体遗传主成分构成进行了分析, 分析结果与案例的已知群体来源一致, 进。
28、一步, 针对从HapMap数据库中挑选的已知来源的422份样本(包括来自非洲、 欧洲、 东亚人群, 以及 其混合人群的样本)的群体遗传主成分构成进行分析, 由该分析结果得出的群体主成分构 成结果同样与这些样本的已知来源一致, 说明由本发明的的方法和系统获得的非、 欧、 东亚 群体遗传主成分析结果, 可以为非、 欧、 东亚群体来源推断提供准确的数据支持。 附图说明 0044 图1.27个SNP位点采用STRUCTURE软件分析得到14个人群STRUCTURE(K3)群体成 分分析结果图。 其中, YRI和LWK作为典型非洲人群的代表, CEU和TSI作为典型欧洲人群的代 表, CHB和JPT作为。
29、典型东亚人群代表。 ASW美国西南地区非裔人群; CEU美国犹他州的北欧和 西欧人后裔人群; CHB北京汉族人群; CHD美国科罗拉多州丹佛市华人人群; GIH德克萨斯州 休斯顿的古吉拉特语系印度人群; JPT东京的日本人群; LWK肯尼亚Webuye的Luhya人群; MEX 加利福尼亚州洛杉矶的墨西哥人后裔人群; MKK肯尼亚Kinyawa的Maasai人群; TSI意大利的 Toscani人群; YRI尼日利亚伊巴丹的约鲁巴人群; CHN中国北方的汉族人群; CTT中国西藏的 藏族人群; CUX中国新疆的维吾尔族人群(欧洲和东亚混合人群)。 0045 图2: 案件1中样本非、 欧、 东亚。
30、群体遗传主成分构成图。 0046 图3: 案件2中样本1非、 欧、 东亚群体遗传主成分构成图。 0047 图4: 案件2中样本2非、 欧、 东亚群体遗传主成分构成图。 0048 图5: 案件2中样本3非、 欧、 东亚群体遗传主成分构成图。 0049 图6A-6E:对随机抽取的来自个非洲人, 欧洲人, 亚洲人的样本采用本发明方法和 系统检测群体遗传主成分构成的图。 图6A为非洲人样本YRI330, 图6B为欧洲人样本CEU998, 图6C为南亚人(非、 欧、 东亚混合)样本GIH1179, 图6D为东亚人样本CHN870, 图6E为中亚人 (欧、 东亚混合)样本CUX1066。 具体实施方式 0。
31、050 实施例1采用本发明的对未知来源个体进行非、 欧、 东亚群体遗传主成分分析的方 法和系统对未知来源个体进行来源推断 0051 图1为本申请方案中的27个SNP位点采用STRUCTURE软件针对14个人群STRUCTURE (K3)群体成分分析结果。 图1的结果表明了这组位点可以有效区分出非洲、 欧洲、 东亚三 大人群及其混合人群遗传主成分。 说明书 8/13 页 11 CN 104212886 B 11 0052 采用本发明的所述方法和系统对案例1和案例2中的个体进行来源推断。 案例1在 中国东北发现的骨骼残骸, (案件1中骨骼残片已移交美方, 身份已经确认为56年前坠落的 美国空军飞行。
32、员, 欧洲人来源); 0053 案例2中3具烧焦尸体, 需识别其民族来源, 以明确案件的侦查方向(案件2中3名死 者的身份已经确认, 均来自新疆南部地区, 维吾尔族人(即欧-东亚混合人群来源)。 0054 1、 提取待检测个体的DNA作为模板 0055 案例1: 1份骨骼残片, 使用有机法提取DNA溶液。 0056 案例2: 3份静脉血(0 .5ml), 使用DNAbloodmidi试剂盒(QIAGEN ,Hilden , Germany)提取DNA溶液。 0057 2、 对提取的DNA模板进行多重PCR扩增反应 0058 2.1、 引物池配置 0059 扩增引物池的配置, 其中所述扩增引物组。
33、中为所述27个SNP位点一一对应的27对 扩增引物, 每对扩增引物能扩增待检测DNA上包括其相应的SNP位点; 本实施例中, 优选的, 所述27个SNP位点的扩增引物组为序列表中SEQIDNo.1至SEQIDNo.54的核苷酸序列; 本 发明提供的各种引物序列由上海生工生物工程技术服务有限公司合成。 0060 2.2、 多重PCR反应 0061 本实施例使用具有96孔PCR板的AB9700型DNA扩增仪进行多重PCR反应。 0062 (1)配置PCRmix(27-plexPCR(5 L反应体系) 0063 试剂名称配置量( L)浓度 PCR引物池(27-plex)0.135每条引物0.05 d。
34、NTP(10mM)0.050.1mM 10PCRbuffer(缓冲液, 含15mMMg2+)0.5Mg2+1.5mM MgCl2(25mMMg2+)0.7Mg2+3.5mM HotstarTaqplus(5U/ L)0.10.1U ddH2O(去离子水)1.515 DNA22-10ng/ L 总体积5( L) 0064 按上表中的比例分别配置27重PCRmix, 将扩增体系的PCRmix混匀后, 取5 L加入 到96孔PCR板的反应孔中, 再分别在上述反应孔的3 L的PCRmix中加入2 L待检测的DNA模板 (5 L反应体系)。 封膜后, 3000rcf离心1分钟。 0065 (2)扩增程序。
35、 0066 说明书 9/13 页 12 CN 104212886 B 12 0067 0068 2.3、 PCR产物纯化,加入3 L纯化试剂 0069 (1)按照下表的体系, 配制Clean-up试剂 0070 试剂名称配置量( L)浓度 Exo (10U/ L)0.22U SAP(1U/ L)11U 10SAP缓冲液0.31 ddH2O1.5 总计3 0071 (2)将PCR反应后的96孔PCR板3000rcf离心1分钟, 再加入配好的Clean-up试剂, 每孔3 L(每孔终体系为8 L)。 封膜后, 3000rcf离心1分钟, 运行下表所示的程序。 0072 步骤温度时间 13730mi。
36、n 29610min 34 0073 注: 纯化好的PCR产物可以在-20条件下存放。 0074 3、 对纯化后的DNA扩增产物进行SNaPshot延伸反应 0075 (1)解冻纯化好的96孔PCR板(含有步骤2扩增好的DNA产物作为延伸模板)按照下 表所示体系配制27-plex的引物延伸反应混合物。 0076 27-plex延伸反应(10 L反应体系) 0077 说明书 10/13 页 13 CN 104212886 B 13 0078 0079 (2)将解冻后的96孔PCR板3000rcf离心1分钟, 向每个孔中加入7 L配制好的27- plex引物延伸反应混合物(每孔终体系为15 L),。
37、 封膜, 3000rcf离心1分钟, 运行下表所示的 程序。 0080 0081 注: 引物延伸反应结束后的DNA产物可以在-20条件下存放。 0082 (3)延伸产物纯化(去除ddNTPs) 0083 在延伸产物中加入1USAP(1U/ L,1 L), 进行以下的纯化反应程序: 0084 步骤温度时间 13760min 27515min 34 0085 (4)毛细管电泳分型 0086 纯化后的延伸产物在3500XL遗传分析仪(AppliedBiosystems)上检测, 使用 GeneMapperIDX软件(AppliedBiosystems公司)分析数据。 0087 4、 分型结果 说明书。
38、 11/13 页 14 CN 104212886 B 14 0088 0089 将所述各特异性位点的基因型利用STRUCTURE软件获得群体遗传主成分分析结 果。 结果如图2-5所示。 0090 图2为案件1中样本非、 欧、 东亚群体遗传主成分构成图。 由图2可以看出, 非洲人成 分占0.2, 欧洲人成分为99.2, 东亚人成分占0.6; 该群体遗传主成分分析结果支持 DNA供者为欧洲人来源。 0091 图3为案件2中样本1非、 欧、 东亚群体遗传主成分构成图。 由图3可以看出, 非洲人 成分占0.4, 欧洲人成分为38.9, 东亚人成分占60.7; 该群体遗传主成分分析结果支 持DNA供者为。
39、欧-东亚混合人群来源。 0092 图4为案件2中样本2非、 欧、 东亚群体遗传主成分构成图。 由图4可以看出, 非洲人 成分占2.3, 欧洲人成分为51.1, 东亚人成分占46.6; 该群体遗传主成分分析结果支 持DNA供者为欧-东亚混合人群来源。 0093 图5为样本3非、 欧、 东亚群体遗传主成分构成图。 由图5可以看出, 非洲人成分占 2.6, 欧洲人成分为43.0, 东亚人成分占54.4; 该群体遗传主成分分析结果支持DNA供 者为欧-东亚混合人群来源。 说明书 12/13 页 15 CN 104212886 B 15 0094 由本实施例方法获得的上述检材的非、 欧、 东亚群体遗传主。
40、成分分析结果, 分析结 果与案例样本的已知群体来源一致, 说明由本发明方法和系统获得的群体遗传主成分分析 结果能为进行非、 欧、 东亚群体来源推断提供数据支持。 0095 实施例2 0096 利用实施例1相同的方法和系统, 采用相同的步骤对上述样本的对随机抽取的来 自个非洲人, 欧洲人, 亚洲人的样本采用本发明方法和系统检测群体遗传主成分构成分析。 0097 抽取的样本为以下5份: 图6A为非洲人样本YRI330, 图6B为欧洲人样本CEU998, 图 6C为南亚人(非、 欧、 东亚混合)样本GIH1179, 图6D为东亚人样本CHN870, 图6E为中亚人(欧、 东亚混合)样本CUX1066。
41、。 结果如图6所示, 饼图为个体的非、 欧、 东亚群体遗传主成分构成比 例。 按数值从大到小表示个体可能的人群来源, 可以看出群体遗传主成分的分析结果与样 本的已知群体来源一致。 0098 实施例3 0099 利用本发明的方法和系统对HapMap数据库中挑选的已知来源的422份样本重新进 行人种来源推断, 来检验上述非、 欧、 东亚以及其混合人种推断系统的准确性, 结果如表4所 示: 0100 表4非、 欧、 东亚人种推断系统对挑选的422份样本推断结果 0101 0102 0103 其中, 422份样本已知, 非洲人样本(样本量84人), 欧洲人样本(样本量85人), 东亚 人样本(样本量8。
42、6人), 中亚人(欧、 东亚混合)样本(样本量165人) 0104 通过本发明的方法和系统对上述422份样本进行主成分分析, 可以将非洲人样本 全部推断为非洲人, 欧洲人样本全部推断为欧洲人, 东亚人样本全部推断为东亚人, 中亚人 的结果均为欧、 东亚的混合成分, 所有样本均符合其已知的人种来源。 因此通过上述系统可 以为进行非、 欧、 东亚群体来源推断提供准确的数据支持。 说明书 13/13 页 16 CN 104212886 B 16 0001 序列表 1/20 页 17 CN 104212886 B 17 0002 序列表 2/20 页 18 CN 104212886 B 18 0003。
43、 序列表 3/20 页 19 CN 104212886 B 19 0004 序列表 4/20 页 20 CN 104212886 B 20 0005 序列表 5/20 页 21 CN 104212886 B 21 0006 序列表 6/20 页 22 CN 104212886 B 22 0007 序列表 7/20 页 23 CN 104212886 B 23 0008 序列表 8/20 页 24 CN 104212886 B 24 0009 序列表 9/20 页 25 CN 104212886 B 25 0010 序列表 10/20 页 26 CN 104212886 B 26 0011 序列。
44、表 11/20 页 27 CN 104212886 B 27 0012 序列表 12/20 页 28 CN 104212886 B 28 0013 序列表 13/20 页 29 CN 104212886 B 29 0014 序列表 14/20 页 30 CN 104212886 B 30 0015 序列表 15/20 页 31 CN 104212886 B 31 0016 序列表 16/20 页 32 CN 104212886 B 32 0017 序列表 17/20 页 33 CN 104212886 B 33 0018 序列表 18/20 页 34 CN 104212886 B 34 0019 序列表 19/20 页 35 CN 104212886 B 35 0020 序列表 20/20 页 36 CN 104212886 B 36 图1 图2 图3 说明书附图 1/3 页 37 CN 104212886 B 37 图4 图5 图6A 图6B 图6C 图6D 说明书附图 2/3 页 38 CN 104212886 B 38 图6E 说明书附图 3/3 页 39 CN 104212886 B 39 。