《一种基于基因组杂合度鉴定猕猴桃杂交种质的方法.pdf》由会员分享,可在线阅读,更多相关《一种基于基因组杂合度鉴定猕猴桃杂交种质的方法.pdf(9页完整版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 201510114843.9 (22)申请日 2015.03.16 (73)专利权人 中国科学院华南植物园 地址 510650 广东省广州市天河区兴科路 723号 (72)发明人 刘义飞李大卫黄宏文 (74)专利代理机构 武汉宇晨专利事务所 42001 代理人 黄瑞棠 (51)Int.Cl. C12Q 1/68(2006.01) 审查员 田颖 (54)发明名称 一种基于基因组杂合度鉴定猕猴桃杂交种 质的方法 (57)摘要 本发明公开了一种基于基因组杂合度鉴定 猕猴桃杂交种质的方法, 。
2、涉及植物遗传资源评价 和生物技术领域。 本方法是: 对样本进行基因 组低深度测序; 测序数据的参考基因组比对和 单碱基变异位点发掘; 基于单碱基变异位点计 算样本基因组水平的杂合度; 构建猕猴桃属主 要祖先基本物种杂合度分布规律数据库; 将待 测样本与数据库进行杂合度比较识别鉴定杂交 种质。 本发明相比传统分子标记技术大大提高了 鉴定的准确性; 同时相比传统的形态鉴定方法更 加高效快捷, 节省鉴定的时间和成本; 本方法对 不同的测序平台具有广泛的适用性, 可对猕猴桃 种质资源形成全面的评价应用。 权利要求书2页 说明书4页 附图2页 CN 104630382 B 2016.08.17 CN 1。
3、04630382 B 1.一种基于基因组杂合度鉴定猕猴桃杂交种质的方法, 其特征在于: 对样本进行基因组低深度测序 猕猴桃祖先基本种的选择和适用于杂交种质鉴定的测序策略: A、 筛选10个猕猴桃基本祖先物种 根据现有的猕猴桃属物种类群, 这些基本种独立进化, 代表了该属植物90以上的形 态和地理分布变异, 同时基因组基本未受到外源遗传物质的侵蚀; B、 对这10个祖先基本种和待鉴定种质进行5倍基因组低深度测序 样本5倍基因组低深度测序的具体步骤包括: a、 采集样本约5ug的基因组总DNA, 将基因组打断构建180bp的常规小片段测序文库; b、 在高通量测序仪上完成簇的生成, 最后对生成的片。
4、段进行双末端测序获得所有的碱 基信息; c、 将得到的原始测序小片段按标准进行过滤, 从而得到分析所用的基因组数据, 过滤 标准采用测序仪自带软件的缺省值; 测序数据的参考基因组比对和单碱基变异位点发掘 测序数据的猕猴桃参考基因组比对和单碱基发掘方法: A、 利用免费BWA软件基于缺省值将测序reads比对到现有的猕猴桃参考基因组数据库, 然后基于公共SOAPsnp工具软件进行单碱基变异位点的识别和信息收集; B、 由于测序reads的基因组覆盖不均一性会导致SNPs识别的准确性, 因而SNPs的收集 过程中排除reads深度小于6或者大于70的SNPs, 同时排除与邻近SNP的物理距离小于5。
5、bp的 SNP位点来提高精确性; C、 进一步, 基于SOAPsnp的碱基质量得分, 低于20分的位点也被排除掉; 最终对所有的 SNPs的详细信息形成Excel表供后续杂合度计算; 基于单碱基变异位点计算样本基因组水平的杂合度 基于单碱基变异的猕猴桃样本整基因组杂合度计算方法 A、 基于整基因组数据的比对, 排除低比对区域和reads低深度覆盖区域, 剩下的所有位 点为可计算位点; B、 在此基础上, 对所有这些剩下的可计算位点重新定义长度, 即100kb的滑动窗口指 100000个可计算位点; C、 利用SNPs/kb定义杂合度并沿基因组滑动窗口计算所有的杂合度数值; D、 利用二维曲线图。
6、形成样本所有基因组窗口的杂合度分布规律图便于比较分析; E、 利用免费R软件对以上计算过程打包成功能模块, 形成数据输入和结果输出的自动 化完成; 构建猕猴桃属主要祖先基本物种杂合度分布规律数据库 猕猴桃属主要祖先基本种基因组杂合度数据库构建: A、 对10个基本祖先猕猴桃物种, 利用各自的测序数据分别计算杂合度并绘制整基因组 分滑动窗口的杂合度分布图, 最终形成猕猴桃属植物非杂交物种基因组杂合度分布的基本 规律供后续比对参考; B、 通过数据库构建可以得出, 猕猴桃非杂交物种或者种质的整体杂合度分布为具有10 左右的单峰分布的抛物线; 权利要求书 1/2 页 2 CN 104630382 B。
7、 2 C、 所应用的10个祖先基本物种种间存在细微差异但整体分布形态完全一致; 将待测样本与数据库进行杂合度比较识别鉴定杂交种质 待鉴定种质与基础数据库的比对方法: A、 在构建基本种数据库的基础上, 将待鉴定的种质进行同样的5倍基因组低深度测序 和整基因组杂合度计算; B、 将待鉴定种质杂合度分布方式与基础数据库数据进行比较, 有1个或者多个抛物线 峰值且至少一个峰值为祖先基本种峰值10的1.52倍以上的, 则为杂交种质, 否则不能明 确判定其是否经历了杂交渐渗; C、 鉴定的典型杂交物种杂合度分布具有25左右的整基因组杂合度峰值, 且在其左边具 有不典型的1个或多个小峰。 2.根据权利要求。
8、1所述的鉴定猕猴桃杂交种质的方法的应用, 其特征在于: 筛选出猕猴 桃种质资源中的杂交种质供育种应用。 权利要求书 2/2 页 3 CN 104630382 B 3 一种基于基因组杂合度鉴定猕猴桃杂交种质的方法 技术领域 0001 本发明涉及植物遗传资源评价和生物技术领域, 尤其涉及一种基于基因组杂合度 鉴定猕猴桃杂交种质的方法。 具体涉及到猕猴桃属植物种质的基因组低深度测序和基于测 序数据的基因组杂合度计算, 主要祖先物种类群基因组杂合度的基础数据库构建以及待鉴 定种质的比对分析和杂交种质的最终识别鉴定。 背景技术 0002 猕猴桃属 (ActinidiaLindl.) 植物共有54个物种约。
9、75个不同的分类单元。 在自然 界和人工收集保存的各类猕猴桃遗传种质资源中, 由于其本身雌雄异株多年生的植物学特 性, 存在大量的杂交种质资源。 由于对不同遗传资源和基因组的整合, 杂交本身可以有效的 促进植物基因组结构和功能的多样性, 从而进一步促进其形态和适应性变异, 有时甚至能 够产生超越双亲的特征性状。 以猕猴桃属植物为例, 由于频繁的种间杂交渐渗出现, 自然界 猕猴桃属植物具有广泛的形态特征和生态适应性差异, 如多样化的果肉颜色、 果实形态、 果 皮毛被和果实储存期、 不同的地理海拔分布和抗逆抗病性等。 然而, 如何快速准确地识别和 鉴定猕猴桃杂交种质一直是猕猴桃杂交资源利用和遗传育。
10、种过程中所面临的难题。 传统的 分子标记技术由于研究位点的限制, 在准确性上存在一定的问题, 而通过形态学方法的鉴 定耗时费力且往往得不到预期的结果。 0003 植物基因组学相关的理论与技术方法的发展促进了我们对植物进化、 驯化和多样 化的理解。 目前最新发展的基因组测序技术相比以前的方法具有通量高、 单位测序成本低 等特点, 已经广泛应用到不同植物类群的基因组研究, 例如一大批重要的作物如玉米、 水 稻、 大豆等和园艺植物如香蕉、 苹果、 梨等参考基因组的测序组装和注释已经完成。 对于已 有参考基因组的植物类群, 低深度的基因组重测序技术的发展促进了我们对不同植物个体 或者物种间多样性差异的。
11、分子理解。 通过与参考基因组的比较分析, 能够从结构与功能上 阐明种质资源形态与适应性变异的内在遗传基础, 从而进行更加有效的发掘利用。 然而迄 今为止, 在植物杂交种质的鉴别方面, 仍然缺乏有效的基于基因组数据进行直接识别鉴定 的技术方法。 这一方面是由于杂交本身导致了植物基因组的复杂性, 另一方面则是由于缺 乏区别杂交基因组与非杂交基因组之间差异的参数标准。 0004 最近, 猕猴桃属重要代表性物种中华猕猴桃的整基因组测序使得该属植物有了参 考基因组草图, 从而为相关猕猴桃种质资源的基因组学研究打开了窗口。 在传统群体遗传 学研究领域, 植物样本杂合度 (H) 的高低一直是判别其是否经历了。
12、种间杂交渐渗的重要参 数标准之一。 一般而言, 远交植物类群拥有比自交植物更高的物种杂合度水平。 然而, 由于 传统杂合度评估所用的标记局限性, 使得种间结果的比较不可靠, 特别是当杂交渐渗只对 物种部分基因组区域产生遗传交换时, 标记的不完全覆盖性会导致偏差甚至错误的结果。 因而, 急需要利用整基因组数据对样本进行全面评价比较, 形成可靠的杂交种质鉴定和发 掘利用。 说明书 1/4 页 4 CN 104630382 B 4 发明内容 0005 本发明的目的在于提供一种基于基因组杂合度鉴定猕猴桃杂交种质的方法。 0006 本发明的目的是这样实现的: 0007 一、 方法 0008 通过基因组低。
13、深度重测序分析和基于测序数据的整基因组杂合度计算, 在构建该 属植物祖先基本种杂合度分布规律数据库的基础上, 将待鉴定种质的杂合度水平与方式同 数据库进行比较而形成杂交种质的鉴定。 0009 其技术方案包括待鉴定猕猴桃种质与猕猴桃属植物主要的祖先基本物种类群的 基因组低深度测序, 将测序数据比对到猕猴桃属现有的参考基因组形成对单碱基变异位点 (SNPs) 的发掘, 利用发掘的SNPs计算整基因组水平的杂合度 (H) , 然后构建主要祖先基本物 种类群基因组杂合度分布规律数据库, 在此基础上通过待鉴定种质杂合度与数据库的比对 分析识别鉴定杂交种质。 0010 具体地, 本方法包括下列步骤: 00。
14、11 对样本进行基因组低深度测序; 0012 测序数据的参考基因组比对和单碱基变异位点发掘; 0013 基于单碱基变异位点计算样本基因组水平的杂合度; 0014 构建猕猴桃属主要祖先基本物种杂合度分布规律数据库; 0015 将待测样本与数据库进行杂合度比较识别鉴定杂交种质。 0016 二、 应用 0017 筛选出猕猴桃种质资源中的杂交种质供育种应用。 0018 利用本方法共鉴定出人工猕猴桃杂交种质10多份, 而且鉴定结果与已有的人工杂 交数据完全一致; 进一步, 针对整个猕猴桃属植物的物种类群, 利用本方法共鉴定出种间杂 交物种近10个, 占整个猕猴桃属植物物种的约1/6, 而且相关鉴定结果得。
15、到了广泛的形态数 据支持, 并与大量先前研究结果一致。 0019 本发明与现有技术相比, 具有以下优点和效果: 0020 利用整基因组数据使得鉴定结果非常准确, 目前已有鉴定结果的准确率达到了 98%以上; 0021 使用基因组分子鉴定方法, 可在短时间内完成快速鉴定, 特别是对于长生长周 期的猕猴桃植物, 可直接利用种子发芽的幼苗完成鉴定, 大大节约了时间; 0022 由于不同高通量测序平台的大量存在和单位测序成本大幅降低, 可随机选择不 同的测序平台与方法, 对最终的鉴定结果完全没有影响。 因而, 本方法可全面推广应用。 附图说明 0023 图1为本方法的步骤图; 0024 图2为猕猴桃属。
16、祖先基本物种整基因组杂合度分布示意图; 0025 图3为鉴定出的典型杂交种质的整基因组杂合度分布示意图。 具体实施方式 说明书 2/4 页 5 CN 104630382 B 5 0026 下面结合附图和实施例详细说明: 0027 一、 方法 0028 1、 步骤 0029 如图1, 对样本进行基因组低深度测序-1 0030 猕猴桃祖先基本种的选择和适用于杂交种质鉴定的测序策略。 0031 A、 筛选10个猕猴桃基本祖先物种 0032 根据现有的猕猴桃属物种类群, 这些基本种独立进化, 代表了该属植物90%以上的 形态和地理分布变异, 同时基因组基本未受到外源遗传物质的侵蚀; 0033 B、 对。
17、这10个祖先基本种和待鉴定种质进行5倍基因组低深度测序 0034 根据猕猴桃约700M的基因组大小, 获得3.5G左右的数据量可满足本实施例鉴定需 求。 0035 样本5倍基因组低深度测序的具体步骤包括: 0036 A、 采集样本约5ug的基因组总DNA, 将基因组打断构建180bp的常规小片段测序文 库; 0037 B、 在高通量测序仪上 (如本实施例利用Illumina公司生产的Hiseq2000系列测序 仪) 完成簇的生成, 最后对生成的片段进行双末端测序获得所有的碱基信息; 0038 C、 将得到的原始测序小片段 (reads) 按标准进行过滤, 从而得到分析所用的基因 组数据, 过滤。
18、标准采用测序仪自带软件的缺省值。 0039 2、 步骤 0040 如图1, 测序数据的参考基因组比对和单碱基变异位点发掘-2 0041 测序数据的猕猴桃参考基因组比对和单碱基发掘方法。 0042 A、 利用免费BWA软件基于缺省值将测序reads比对到现有的猕猴桃参考基因组数 据库, 然后基于公共SOAPsnp工具软件进行单碱基变异位点 (SNPs) 的识别和信息收集; 0043 B、 由于测序reads的基因组覆盖不均一性会导致SNPs识别的准确性, 因而本实施 例SNPs的收集过程中排除reads深度小于6或者大于70的SNPs, 同时排除与邻近SNP的物理 距离小于5bp的SNP位点来提。
19、高精确性; 0044 C、 进一步, 基于SOAPsnp的碱基质量得分, 低于20分的位点也被排除掉; 最终对所 有的SNPs的详细信息形成Excel表供后续杂合度计算。 0045 3、 步骤 0046 如图1, 基于单碱基变异位点计算样本基因组水平的杂合度-3 0047 基于单碱基变异的猕猴桃样本整基因组杂合度计算方法。 0048 本发明采用如下方式对整基因组杂合度进行计算: 0049 A、 基于整基因组数据的比对, 排除低比对区域和reads低深度覆盖区域, 剩下的所 有位点为可计算位点; 0050 B、 在此基础上, 对所有这些剩下的可计算位点重新定义长度, 即100kb的滑动窗口 指1。
20、00000个可计算位点; 0051 C、 利用SNPs/kb定义杂合度 (即每kb长度包含的杂合SNPs位点数) 并沿基因组滑动 窗口计算所有的杂合度数值; 0052 D、 利用二维曲线图形成样本所有基因组窗口的杂合度分布规律图便于比较分析; 说明书 3/4 页 6 CN 104630382 B 6 0053 E、 利用免费R软件对以上计算过程打包成功能模块, 形成数据输入和结果输出的 自动化完成。 0054 4、 步骤 0055 如图1, 构建猕猴桃属主要祖先基本物种杂合度分布规律数据库-4 0056 猕猴桃属主要祖先基本种基因组杂合度数据库构建。 0057 A、 对本实施例的10个基本祖先。
21、猕猴桃物种, 利用各自的测序数据分别计算杂合度 并绘制整基因组分滑动窗口的杂合度分布图, 最终形成猕猴桃属植物非杂交物种基因组杂 合度分布的基本规律共后续比对参考; 0058 B、 通过数据库构建可以得出, 本实施例猕猴桃非杂交物种或者种质的整体杂合度 分布为如图2所示的具有10左右的单峰分布的抛物线; 0059 C、 所应用的10个祖先基本物种种间存在细微差异但整体分布形态完全一致。 0060 5、 步骤 0061 如图1, 将待测样本与数据库进行杂合度比较识别鉴定杂交种质-5 0062 待鉴定种质与基础数据库的比对方法。 0063 A、 在构建基本种数据库的基础上, 将待鉴定的种质进行同样。
22、的5倍基因组低深度 测序和整基因组杂合度计算; 0064 B、 将待鉴定种质杂合度分布方式与基础数据库数据进行比较, 有1个或者多个抛 物线峰值且至少一个峰值为祖先基本种峰值10的1.52倍以上的, 则为杂交种质, 否则不 能明确判定其是否经历了杂交渐渗; 0065 C、 本实施例鉴定的典型杂交物种杂合度分布如图3所示具有25左右的整基因组杂 合度峰值, 且在其左边具有不典型的1个或多个小峰。 0066 二、 应用 0067 基于该方法, 本实施例构建了10种猕猴桃祖先基本种基因组杂合度数据库 (表1) , 这些物种的平均基因组杂合度约为10左右。 0068 表110种猕猴桃祖先基本种基因组杂。
23、合度 (H) 平均峰值分布 0069 物种中华毛花阔叶软枣山梨硬齿葛枣柱果长叶小叶 H峰值101110998711118 0070 基于该方法, 本实施例鉴定出人工培育的各类猕猴桃杂交种质10多份, 这些杂交 种质有相应的杂交数据记录, 实施例的鉴定结果与已有的人工杂交数据完全一致。 以人工 育种材料HZ-3为例, 其于2001年由中华猕猴桃和毛花猕猴桃通过人工杂交而成。 通过基因 组杂合度计算, 其整基因组杂合度峰值为17,为基础数据库物种的1.7倍, 并且在其左侧有2 和7的两个次峰。 因而鉴定结果表明其为杂交种质。 0071 基于该方法, 本实施例共鉴定出猕猴桃属植物存在的种间杂交物种近。
24、10个, 约占 整个猕猴桃属植物物种的1/6, 而且相关的鉴定结果得到了形态数据的广泛支持, 部分与先 前已有的研究结果保持一致, 另外一部分则为新的杂交种质发现。 以湖北猕猴桃为例, 通过 基因组杂合度的计算, 其峰值为27,为基础数据库祖先种的2.7倍, 鉴定其为自然杂交种, 这 与以前的分子标记鉴定结果一致。 而对于另一个物种黄毛猕猴桃, 其基因组杂合度峰值为 25,则为通过本方法鉴定的新杂交种。 说明书 4/4 页 7 CN 104630382 B 7 图1 图2 说明书附图 1/2 页 8 CN 104630382 B 8 图3 说明书附图 2/2 页 9 CN 104630382 B 9 。