新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒.pdf

上传人:梁腾 文档编号:10582385 上传时间:2021-06-24 格式:PDF 页数:120 大小:4.24MB
收藏 版权申诉 举报 下载
新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒.pdf_第1页
第1页 / 共120页
新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒.pdf_第2页
第2页 / 共120页
新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒.pdf_第3页
第3页 / 共120页
文档描述:

《新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒.pdf》由会员分享,可在线阅读,更多相关《新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒.pdf(120页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010225821.0 (22)申请日 2020.03.26 (71)申请人 福州福瑞医学检验实验室有限公司 地址 350011 福建省福州市晋安区新店镇 猫岭路9号C区厂房9#厂房4F 申请人 中国医学科学院 (72)发明人 王洋李杰王辰高汉林郭超 王健伟任丽丽杨明刘静 赵晔 (74)专利代理机构 北京路浩知识产权代理有限 公司 11002 代理人 黄爽 (51)Int.Cl. C40B 50/08(2006.01) C12Q 1/70(2006.01) C12Q 1/6。

2、869(2018.01) G16B 20/20(2019.01) G16B 20/30(2019.01) C12R 1/93(2006.01) (54)发明名称 新型冠状病毒全基因组高通量测序文库的 构建方法以及用于文库构建的试剂盒 (57)摘要 本发明提供新型冠状病毒全基因组高通量 测序文库的构建方法以及用于文库构建的试剂 盒。 所述方法包括: 1)病毒RNA反转录; 2)利用锚 定部分Illumina接头序列的多重扩增引物进行 第一轮PCR反应; 3)利用标签化Illumina文库扩 增引物进行第二轮PCR反应, 扩增产物经纯化, 得 到高通量测序文库。 利用本发明提供的锚定多重 扩增引物。

3、组合, 能够对新型冠状病毒COVID-19的 基因组进行高效靶向富集, 克服现有方法靶向性 低, 实验时效低, 且易带入宿主背景污染的影响, 有利于在较少的测序数据量、 成本下, 较短时间 内完成COVID-19的病毒全基因组测序, 从而实现 COVID-19病毒的鉴别诊断以及病毒突变鉴定。 权利要求书8页 说明书29页 序列表78页 附图4页 CN 111334868 A 2020.06.26 CN 111334868 A 1.新型冠状病毒全基因组高通量测序文库的构建方法, 其特征在于, 包括以下步骤: A、 提取病毒样本RNA, 反转录成单链cDNA或双链cDNA; B、 根据已公布的新型。

4、冠状病毒COVID-19基因组序列, 进行叠瓦式全覆盖式引物设计, 分别设计得到锚定部分Illumina接头序列的多重扩增引物组1和锚定部分Illumina接头序 列的多重扩增引物组2, 以单链cDNA或双链cDNA为模板, 分别利用引物组1、 引物组2进行第 一轮PCR反应, 将扩增产物按照等摩尔量混合以覆盖病毒全基因组; C、 以步骤B中混合后的扩增产物为模板, 利用标签化Illumina文库扩增引物进行第二 轮PCR反应, 扩增产物经纯化, 得到高通量测序文库; 其中, 步骤B中锚定部分Illumina接头序列的多重扩增引物组1和锚定部分Illumina接 头序列的多重扩增引物组2的设计。

5、方法包括: B1、 根据新型冠状病毒COVID-19基因组序列, 分别设计多重特异性扩增引物组I和多重 特异性扩增引物组II, 引物组I包括正向引物F池和反向引物R池, 引物组II包括正向引物F 池和反向引物R 池, 每对正向引物和反向引物对应于一个扩增子; 在引物组I的相邻两个扩 增子序列内, 分别设计引物组II的正向引物和反向引物, 在引物组II的相邻两个扩增子序 列内, 分别设计引物组I的正向引物和反向引物, 周而复始, 直到引物组I对应的扩增子和引 物组II对应的扩增子以叠瓦式覆盖病毒全基因组; B2、 将Illumina部分接头序列按照5 -3 方向添加到各正向引物的5 端, 将Il。

6、lumina 部分接头序列按照5 -3 方向添加到各反向引物的5 端; 将带有Illumina部分接头序列 的正向引物F池和带有Illumina部分接头序列的反向引物R池作为锚定部分Illumina 接头序列的多重扩增引物组1; 将带有Illumina部分接头序列的正向引物F 池和带有 Illumina部分接头序列的反向引物R 池作为锚定部分Illumina接头序列的多重扩增引 物组2; 其中, Illumina部分接头序列的序列如下: 5 -I7标签化引物3 末端序列- AGATGTGTATAAGAGACAG-3 ; I l l um i na 部分 接 头 序 列的 序 列 如下 : 5 。

7、- I 5标 签 化 引物3 末端 序 列- AGATGTGTATAAGAGACAG-3 ; 且I7标签化引物3 末端序列的大小为915bp, I5标签化引物3 末端序列的大小为8 14bp, 以保证I7标签化引物和I5标签化引物可以特异性退火至扩增子上的3 末端结合位 置。 2.根据权利要求1所述的方法, 其特征在于, 步骤B中各引物对之间的Tm阈值差为2 ; 和/或 扩增子大小为200-300bp; 和/或 引物设计时去除可能导致引物间或引物内部形成二聚体和茎环结构的引物对; 和/或 在同一多重特异性扩增引物组中, 使基因组上游扩增子的反向引物序列5 端位于下游 扩增子的正向引物序列5 端。

8、的上游。 3.根据权利要求1所述的方法, 其特征在于, 步骤A中将RNA反转录成单链cDNA的方法选 自如下a或b: a、 利用6-10bp随机引物引导单链cDNA合成; b、 利用来自反向引物R池和反向引物R 池中的若干条引物混合成一个特异性反转录引 权利要求书 1/8 页 2 CN 111334868 A 2 物组引导单链cDNA合成, 且这些反向引物沿病毒基因组3 -5 方向均匀分布, 引物间相隔 800-1000bp; 步骤A中将RNA反转录成双链cDNA的方法包括: i、 利用6-10bp随机引物引导单链cDNA合成; ii、 在dNTPs存在的条件下, 利用RNA酶H使RNA-cD。

9、NA杂合双链产生缺口; iii、 以缺口处的产生的小片段RNA为引物, 利用RNA依赖性的DNA聚合酶合成双链cDNA。 4.根据权利要求1所述的方法, 其特征在于, 步骤C中标签化Illumina文库扩增引物如 下: I7标签化引物: 5 -CAAGCAGAAGACGGCATACGAGAT(i7)GTCTCGTGGGCTCGG-3 , I5标签化引 物: 5 -AATGATACGGCGACCACCGAGATCTACAC(i5)TCGTCGGCAGCGTC-3 。 5.根据权利要求4所述的方法, 其特征在于, 步骤B中Illumina部分接头序列的序列 如下: 5 -GTCTCGTGGGCTC。

10、GGAGATGTGTATAAGAGACAG-3 ; Illumina部分接头序列的序列如下: 5 -TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3 。 6.根据权利要求1所述的方法, 其特征在于, 步骤B中锚定部分Illumina接头序列的多 重扩增引物组1和锚定部分Illumina接头序列的多重扩增引物组2共包含250对引物, 其中 正向引物为COV-1-FCOV-250-F, 它们的核苷酸序列分别如SEQ ID NO:3-252所示, 反向引 物为COV-1-RCOV-250-R, 它们的核苷酸序列分别如SEQ ID NO:253-502所示, 其中, COV- 1。

11、-F和COV-1-R为一对引物, COV-2-F和COV-2-R为一对引物, 以此类推。 7.根据权利要求6所述的方法, 其特征在于, 步骤B中锚定部分Illumina接头序列的多 重扩增引物组1的引物信息如下: 权利要求书 2/8 页 3 CN 111334868 A 3 权利要求书 3/8 页 4 CN 111334868 A 4 权利要求书 4/8 页 5 CN 111334868 A 5 锚定部分Illumina接头序列的多重扩增引物组2的引物信息如下: 权利要求书 5/8 页 6 CN 111334868 A 6 权利要求书 6/8 页 7 CN 111334868 A 7 权利要求。

12、书 7/8 页 8 CN 111334868 A 8 其中, 引物编号COV-1对应于引物COV-1-F和COV-1-R, 引物编号COV-2对应于引物COV- 2-F和COV-2-R, 以此类推。 8.根据权利要求1-7任一项所述的方法, 其特征在于, 所述病毒样本来自咽拭子、 肺泡 灌洗液或病毒感染细胞后的上清液分离培养物。 9.用于构建新型冠状病毒全基因组高通量测序文库的试剂盒, 其特征在于, 所述试剂 盒包含权利要求1-8任一项所述方法中使用的锚定部分Illumina接头序列的多重扩增引物 组1和锚定部分Illumina接头序列的多重扩增引物组2以及标签化Illumina文库扩增引物,。

13、 任选包含用于文库构建的各种试剂。 10.权利要求1-8任一项所述方法在新型冠状病毒变异检测中的应用, 所述应用包括: (1)按照权利要求1-8任一项所述方法构建得到待测新型冠状病毒全基因组高通量测 序文库; (2)高通量测序文库质检合格后上机测序; (3)生物信息学分析以及变异位点的检测; 优选地, 步骤(3)包括以下子步骤: 1)应用BWA软件进行新型冠状病毒COVID-19参考基因组MT019531.1索引数据集的构 建, 应用samtools faidx生成fai文件; 2)reads质控分析: 应用SOAPnuke对双末端reads进行过滤和质量控制分析得到clean reads; 。

14、具有以下条件的reads将被去除: 条件1: 含有接头序列污染的reads; 条件2: N碱基个 数超过10的reads; 条件3: 低质量碱基数超过整条reads的50, 所述低质量是指Q38; 3)数据比对和排序: 应用BWA结合samtools工具将clean reads比对到参考基因组 MT019531.1上生成BAM文件, 比对参数为 “-t 32 -M” ; 应用picard软件的SortSam.jar进行 排序; 应用samtools的index工具对排序后的BAM文件建立索引; 应用Qualimap工具对生成 的BAM文件进行质控; 4)变异检测: 应用samtools pil。

15、eup和VarScan对病毒的SNP和InDel进行检测; SNP检测 参数为:“-min-coverage 8 -min-reads24 -min-var-freq 0.1 -min-avg-qual 0 - p-value 1.0 -strand-filter 0 -variants -output-vcf 1” ; InDel检测参数为:“- min-coverage 8 -min-reads2 4 -min-var-freq 0.1 -min-avg-qual 0-p-value 1.0-strand-filter 0-variants-output-vcf 1” ; 5)最后基于MT。

16、019531.1参考基因组的GFF文件, 应用annovar软件对检测到的SNP和 InDel进行注释。 权利要求书 8/8 页 9 CN 111334868 A 9 新型冠状病毒全基因组高通量测序文库的构建方法以及用于 文库构建的试剂盒 技术领域 0001 本发明涉及生物技术领域, 具体地说, 涉及新型冠状病毒全基因组高通量测序文 库的构建方法以及用于文库构建的试剂盒。 背景技术 0002 新型冠状病毒COVID-19(severeacute respiratory syndrome coronavirus 2, SARS-CoV-2)属乙型冠状病毒属, 和其他已发现的冠状病毒基因组类似, 。

17、COVID-19基因组包 含6个主要的开放阅读框(ORF, Open Reading Frame), 分别为orf1ab、 ORF3a、 ORF6、 ORF7a、 ORF8和ORF10, 以及其他一些附属基因(accessory genes), 分别为S基因、 E基因、 M基因和N 基因。 通过对病毒进行全基因组高深度测序是目前灵敏度和特异性最强的获得病毒基因组 整体核酸突变、 病毒分型、 进化关系研究的方法之一; 但受制于宿主核酸背景干扰等因素, 目前主流的病毒全基因组高通量测序方案均存在测序数据量要求大, 实验成本较高、 时效 性较低等问题。 0003 目前由中国国家药品监督管理局(NMP。

18、A)审批的针对COVID-19的检测试剂盒, 大多 基于Taqman探针的荧光实时定量PCR(qRT-PCR)检测方法, IgG/IgM的胶体金抗体检测方法 以及基于磁微粒化学发光法的IgM抗体检测方法; 其中涉及核酸检测层面, qRT-PCR方法特 异性较强, 可在2h内完成阳性携病毒样本的相对定量; 但由于RNA病毒的变异往往远快于其 他类型病毒, 一旦病毒基因组上的探针结合位置和特异性引物结合位置出现突变, 同时受 提取的病毒RNA质量和实验手段以及实验室人员操作等因素影响, 灵敏度较低(假阴性较 高), 易出现Ct值不稳定或Ct值大于40等非置信数值, 假阴性提高带来误诊率、 漏诊率提。

19、高; 基于免疫学抗体抗原反应的IgG/IgM的胶体金抗体检测, 时效性极快, 但假阳性高, 仍需要 后续的临床诊断支撑; CT检测作为临床确诊的金标准, 依赖于大型仪器, 普筛实现较难; 而 基于油包水微滴技术的数字PCR(ddPCR)特异性强, 灵敏性较强; 但其缺点在于, 通量低, 成 本高, 引物结合位置一旦出现突变, 检出率会受到影响。 0004 而使用高通量测序研究微生物/病毒基因组领域, 尤其是RNA病毒的研究中, 主要 以RNA-seq为主要技术手段对病毒全基因组测序, 通过对宿主分离的总RNA进行宿主核糖体 RNA(hrRNA, Human Ribosomal RNA)剔除(r。

20、RNA depletion)进行二代测序文库的构建后测 序, 这种方法的缺点在于分离病毒时带入的宿主基因组和转录组信息会导致下机数据中来 自病毒基因组reads只占极少的一部分(0.01-0.1), 因此起始核酸RNA要求量较高; 同时, 后续生信分析进行序列比对及组装时往往会存在一定比例的gap以及部分病毒基因组区域 覆盖度和测序深度不足, 整体覆盖度比例不足, 下机数据量要求高(根据病毒大小和病毒在 宿主中的丰度往往超过10G data以上), 实验成本较高、 时效性较低等缺点。 最近一项发表 在自然(Nature)期刊的研究成果表明, 对一例人体分离的新型冠状病毒进行RNA-seq并通 。

21、过宏基因组(Metagenomics)分析方法研究, 在下机后所有获得的10038758的测序读长中, 经过滤来自宿主人类的测序读长, 最终只获得1582条测序读长用于后续的COVID-19分析。 说明书 1/29 页 10 CN 111334868 A 10 而通过靶向液相杂交捕获体系的病毒全基因组测序, 特异性较强, 数据量要求低; 缺点在 于, 对于起始靶cDNA要求量较高, 存在捕获不到病毒基因组的风险, 同时探针设计费用高, 时效性较慢(杂交捕获共计12h以上), 临床转化适应度不高; 通过文献检索, 使用靶向多重 PCR测序(TMS, Targeted Multiplexing-P。

22、CR Sequencing)技术进行RNA病毒全基因组高通 量测序的研究鲜有报道。 0005 为了弥补该领域技术空白, 我们提出了一种基于靶向多重聚合酶链式反应扩增子 测序(Targeted Multiplexed Amplicon-seq)的新型冠状病毒(COVID-19)全基因组突变快 速鉴别诊断技术和试剂盒应用。 该方法不受宿主基因组影响, 针对COVID-2019的靶向性强, 覆盖度高且均一, 样本起始量要求低, 实验及测序成本较现行病毒高通量测序方法大幅降 低, 时效性大幅提高, 可实现对咽拭子、 肺泡灌洗液等生物样本以及病毒培养样本中COVID- 19病毒的高灵敏度, 准确性以及全。

23、面的鉴别诊断。 发明内容 0006 本发明的目的是提供一种基于靶向多重聚合酶链式反应扩增子测序技术 (Targeted Multiplexed Amplicon-seq)构建新型冠状病毒全基因组高通量测序文库的方 法以及用于文库构建的试剂盒。 0007 本发明的另一目的是提供上述方法在新型冠状病毒变异检测中的应用。 0008 为了实现本发明目的, 第一方面, 本发明提供一种新型冠状病毒全基因组高通量 测序文库的构建方法, 包括以下步骤: 0009 A、 提取病毒样本RNA, 反转录成单链cDNA或双链cDNA; 0010 B、 根据已公布的新型冠状病毒COVID-19基因组序列, 进行叠瓦式全。

24、覆盖式引物设 计, 分别设计得到锚定部分Illumina接头序列的多重扩增引物组1和锚定部分Illumina接 头序列的多重扩增引物组2(锚定多重扩增引物组1和锚定多重扩增引物组2), 以单链cDNA 或双链cDNA为模板, 分别利用引物组1、 引物组2进行第一轮PCR反应, 将扩增产物按照等摩 尔量混合以覆盖病毒全基因组; 0011 C、 以步骤B中混合后的扩增产物为模板, 利用标签化Illumina文库扩增引物进行 第二轮PCR反应, 扩增产物经纯化, 得到高通量测序文库; 0012 其中, 步骤B中锚定部分Illumina接头序列的多重扩增引物组1和锚定部分 Illumina接头序列的多。

25、重扩增引物组2的设计方法包括: 0013 B1、 根据新型冠状病毒COVID-19基因组序列, 设计非锚定多重扩增引物组, 分别为 多重特异性扩增引物组I和多重特异性扩增引物组II, 引物组I包括正向引物F池和反向引 物R池, 引物组II包括正向引物F 池和反向引物R 池, 每对正向引物和反向引物对应于一个 扩增子; 在引物组I的相邻两个扩增子序列内, 分别设计引物组II的正向引物和反向引物, 在引物组II的相邻两个扩增子序列内, 分别设计引物组I的正向引物和反向引物, 周而复 始, 直到引物组I对应的扩增子和引物组II对应的扩增子以叠瓦式覆盖病毒全基因组; 0014 B2、 将Illumin。

26、a部分接头序列按照5 -3 方向添加到各正向引物的5 端, 将 Illumina部分接头序列按照5 -3 方向添加到各反向引物的5 端; 将带有Illumina部分 接头序列的正向引物F池和带有Illumina部分接头序列的反向引物R池作为锚定部分 Illumina接头序列的多重扩增引物组1; 将带有Illumina部分接头序列的正向引物F 池 说明书 2/29 页 11 CN 111334868 A 11 和带有Illumina部分接头序列的反向引物R 池作为锚定部分Illumina接头序列的多重 扩增引物组2; 0015 其中, Illumina部分接头序列的序列如下: 5 -I7标签化引。

27、物3 末端序列- AGATGTGTATAAGAGACAG-3 ; 0016 Illumina部分接头序列的序列如下: 5 -I5标签化引物3 末端序列- AGATGTGTATAAGAGACAG-3 ; 0017 且I7标签化引物3 末端序列的大小为915bp, I5标签化引物3 末端序列的大小 为814bp, 以保证I7标签化引物和I5标签化引物可以特异性退火至扩增子上的3 末端结 合位置。 0018 前述的方法, 步骤B中各引物对之间的Tm阈值差为2; 和/或 0019 扩增子大小为200-300bp; 和/或 0020 引物设计时去除可能导致引物间或引物内部形成二聚体(Primer Dim。

28、er)和茎环 结构(Stem-Loop)的引物对; 和/或 0021 在同一多重特异性扩增引物组中, 使基因组上游扩增子的反向引物序列5 端位于 下游扩增子的正向引物序列5 端的上游, 以防止短片段副产物形成并进行PCR竞争。 0022 前述的方法, 步骤A中将RNA反转录成单链cDNA的方法选自如下a或b: 0023 a、 利用6-10bp随机引物引导单链cDNA合成; 0024 b、 利用来自反向引物R池和反向引物R 池中的若干条引物混合成一个特异性反转 录引物组引导单链cDNA合成, 且这些反向引物沿病毒基因组3 -5 方向均匀分布, 引物间相 隔800-1000bp。 0025 步骤A。

29、中将RNA反转录成双链cDNA的方法包括: 0026 i、 利用6-10bp随机引物引导单链cDNA合成; 0027 ii、 在dNTPs存在的条件下, 利用RNA酶H(RNaseH)使RNA-cDNA杂合双链产生缺口; 0028 iii、 以缺口处的产生的小片段RNA为引物, 利用RNA依赖性的DNA聚合酶合成双链 cDNA。 0029 前述的方法, 步骤C中标签化Illumina文库扩增引物如下(SEQ ID NO:503-504): 0030 I7标签化引物: 5 -CAAGCAGAAGACGGCATACGAGAT(i7)GTCTCGTGGGCTCGG-3 , I5标签 化引物: 5 -。

30、AATGATACGGCGACCACCGAGATCTACAC(i5)TCGTCGGCAGCGTC-3 。 0031 优选地, 步骤B中Illumina部分接头序列的序列如下: 5 -GTCTCGTGGGCTCGGAGA TGTGTATAAGAGACAG-3 (SEQ ID NO:1); 0032 Illumina部分接头序列的序列如下: 5 -TCGTCGGCAGCGTCAGATGTGTATAAGAGAC AG-3 (SEQ ID NO:2)。 0033 前述的方法, 步骤B中锚定部分Illumina接头序列的多重扩增引物组1和锚定部分 Illumina接头序列的多重扩增引物组2共包含250对引。

31、物, 其中正向引物为COV-1-FCOV- 250-F, 它们的核苷酸序列分别如SEQ ID NO:3-252所示, 反向引物为COV-1-RCOV-250-R, 它们的核苷酸序列分别如SEQ ID NO:253-502所示, 其中, COV-1-F和COV-1-R为一对引物, COV-2-F和COV-2-R为一对引物, 以此类推。 0034 优选地, 步骤B中锚定部分Illumina接头序列的多重扩增引物组1、 锚定部分 Illumina接头序列的多重扩增引物组2的引物信息分别见表1、 表2。 说明书 3/29 页 12 CN 111334868 A 12 0035 表1锚定多重引物组1的引。

32、物信息 0036 说明书 4/29 页 13 CN 111334868 A 13 0037 说明书 5/29 页 14 CN 111334868 A 14 0038 0039 表2锚定多重引物组2的引物信息 说明书 6/29 页 15 CN 111334868 A 15 0040 说明书 7/29 页 16 CN 111334868 A 16 0041 说明书 8/29 页 17 CN 111334868 A 17 0042 0043 其中, 引物编号COV-1对应于引物COV-1-F和COV-1-R, 引物编号COV-2对应于引物 COV-2-F和COV-2-R, 以此类推。 0044 本发。

33、明中, 所述病毒样本可以来自咽拭子、 肺泡灌洗液或病毒感染细胞后上清分 离培养物等生物样本。 0045 第二方面, 本发明提供用于构建新型冠状病毒全基因组高通量测序文库的试剂 盒, 所述试剂盒包含上述文库构建方法中使用的锚定部分Illumina接头序列的多重扩增引 物组1和锚定部分Illumina接头序列的多重扩增引物组2以及标签化Illumina文库扩增引 物, 任选包含用于文库构建的各种试剂(如扩增酶试剂、 相应缓冲液等)。 0046 第三方面, 本发明提供上述文库构建方法在新型冠状病毒变异检测中的应用, 所 述应用包括: 0047 (1)按照上述方法构建得到待测新型冠状病毒全基因组高通量。

34、测序文库; 0048 (2)高通量测序文库质检合格后上机测序; 0049 (3)生物信息学分析以及变异位点的检测。 0050 优选地, 步骤(3)包括以下子步骤: 说明书 9/29 页 18 CN 111334868 A 18 0051 1)应用BWA软件进行新型冠状病毒COVID-19参考基因组MT019531.1索引数据集的 构建, 应用samtools faidx生成fai文件; 0052 2)reads质控分析: 应用SOAPnuke对双末端reads进行过滤和质量控制分析得到 clean reads(过滤后读长); 具有以下条件的reads将被去除: 条件1: 含有接头序列污染的 r。

35、eads; 条件2: N碱基个数超过10的reads; 条件3: 低质量(Q38)碱基数超过整条reads的 50; 0053 3)数据比对和排序: 应用BWA结合samtools工具将clean reads比对到参考基因组 MT019531.1上生成BAM文件, 比对参数为 “-t 32-M” ; 应用picard软件的SortSam.jar进行排 序; 应用samtools的index工具对排序后的BAM文件建立索引; 应用Qualimap工具对生成的 BAM文件进行质控; 0054 4)变异检测: 应用samtools pileup和VarScan对病毒的SNP和InDel进行检测; S。

36、NP 检测参数为:“-min-coverage 8-min-reads24-min-var-freq 0.1-min-avg-qual 0- p-value 1.0-strand-filter 0-variants-output-vcf 1” ; InDel检测参数为:“-min- coverage 8-min-reads2 4-min-var-freq 0.1-min-avg-qual 0-p-value 1.0- strand-filter 0-variants-output-vcf 1” ; 0055 5)最后基于MT019531.1参考基因组的GFF文件, 应用annovar软件对检测。

37、到的SNP 和InDel进行注释。 0056 借由上述技术方案, 本发明至少具有下列优点及有益效果: 0057 利用本发明提供的锚定多重扩增引物组合, 能够对新型冠状病毒COVID-19的基因 组进行高效靶向富集, 克服现有方法靶向性低, 实验时效低, 且易带入宿主背景污染的影 响, 有利于在较少的测序数据量、 成本下, 较短时间内完成COVID-19的病毒全基因组测序。 0058 本发明提供的多重聚合酶链式反应扩增引物特异靶向新型冠状病毒COVID-19基 因组序列, 不受宿主人类RNA的影响, 样本起始量要求低, 可实现对咽拭子、 肺泡灌洗液等样 本提取的COVID-19 RNA病毒全基因。

38、组进行特异性检测、 COVID-19病毒鉴别诊断以及病毒突 变鉴定。 本发明对多重PCR扩增引物序列进行了多轮检测和优化, 最终获得的测序数据覆盖 均一度达到90以上; 同时本方法克服了基于RNA病毒基因组的RNA-seq测序方法引入大量 宿主RNA残留导致的病毒本身基因组下机数据过少, 实验周期过长, 实验起始核酸材料量大 的弊端, 亦可对常规qRT-PCR方法快速检测出的具有疑似症状的假阴性病人进行二次检测、 确诊。 0059 实际使用中, 本发明还对建库过程中靶向富集以及进一步扩增的PCR反应体系和 程序进行了优化, 有效提高现有通用多重PCR反应扩增效率低和均一性较差的问题。 附图说明。

39、 0060 图1为本发明引物设计原理。 0061 图2为本发明实施例1中的测序文库质控安捷伦2200微电泳峰图。 其中, a为文库 46d1-1的质检结果, b为文库50d1-1的质检结果, 横坐标上Size(bp)代表文库片段大小, 纵 坐标Sample Intensity代表信号强度。 0062 图3为本发明实施例2中的测序文库质控安捷伦2200微电泳峰图。 其中, a为文库 46d1-2的质检结果, b为文库50d1-2的质检结果, 横坐标上Size(bp)代表文库片段大小, 纵 说明书 10/29 页 19 CN 111334868 A 19 坐标Sample Intensity代表信。

40、号强度。 0063 图4为本发明实施例3中的测序文库质控安捷伦2200微电泳峰图。 其中, a为文库 48d5-1的质检结果, b为文库47d1-1的质检结果, 横坐标上Size(bp)代表文库片段大小, 纵 坐标Sample Intensity代表信号强度。 0064 图5为本发明实施例4中的测序文库质控安捷伦2200微电泳峰图。 其中, a为文库 48d5-2的质检结果, b为文库47d1-2的质检结果, 横坐标上Size(bp)代表文库片段大小, 纵 坐标Sample Intensity代表信号强度。 0065 图6为本发明实施例5中的测序文库质控安捷伦2200微电泳峰图。 其中, a为。

41、文库 XH1P2_R的质检结果, b为文库WHP6_R的质检结果, c为文库XH1P6_R的质检结果, 横坐标上 Size(bp)代表文库片段大小, 纵坐标Sample Intensity代表信号强度。 具体实施方式 0066 本发明提供一种基于靶向多重聚合酶链式反应扩增子测序的新型冠状病毒 (COVID-19)全基因组突变快速鉴别诊断技术和试剂盒应用, 根据所述方法设计的引物组 合、 试剂盒, 以及使用前述引物组合的COVID-19单链RNA建库方法可实现咽拭子、 肺泡灌洗 液等生物样本以及病毒培养样本中新型冠状病毒COVID-19的准确性以及全面的鉴别诊断。 0067 本发明还提供一种针对。

42、所有类型已知基因组序列的RNA病毒的突变进行快速鉴 定, 鉴别的思路和参考模式, 进一步地, 可以根据实际需求, 更换靶向不同RNA病毒基因组序 列的锚定多重PCR引物序列, 开发成适应不同应用范围的试剂盒。 0068 本发明的技术方案如下: 0069 本发明提供一种用于人类新型冠状病毒(COVID-19)全基因组高通量测序的文库 构建方法, 所述方法包括以下步骤: 0070 1、 病毒单链RNA的反转录合成一链cDNA的方法包括: 步骤a、 6碱基-10碱基随机引 物(Random 6mer-10mer Primer)引导的一链cDNA(1st cDNA)合成; 步骤b、 1st cDNA不。

43、进行 纯化或纯化后进入后续PCR扩增反应; 或步骤a、 使用权利要求3a中的非锚定反向引物池R中 的若干引物混合成一个特异性反转录引物组引导的一链cDNA合成, 所选特异性反转录引物 结合位置沿病毒基因组3 -5 方向均匀分布, 引物间相隔800-100bp碱基的距离; 步骤b、 一 链cDNA经纯化后进行后续PCR扩增反应; 病毒单链RNA的反转录合成双链cDNA的方法包括: 步骤a、 6碱基-10碱基随机引物引导的一链cDNA合成; 步骤b、 RNA酶H(RNaseH)在脱氧核糖核 苷三磷酸(dNTP)的辅助下, 介导RNA-1st cDNA杂合双链(RNA-1st cDNA hybrid。

44、)缺口产生; 步骤c、 以缺口处的产生的小片段RNA为引物, 使用RNA依赖性的DNA聚合酶合成二链cDNA (2nd cDNA); 步骤d、 双链cDNA的回收纯化; 所述步骤均可采用商品化反转录和二链合成试 剂盒。 0071 2、 设计锚定部分Illumina测序接头序列的COVID-19病毒基因组多重特异性引物 250对: 0072 a .根据美国国立生物技术信息中心(NCBI)网站上公布的COVID-19基因组 MT019531.1序列全长(Accession No: MT019531GWHABKH00000000), 设计两组多重扩增引物 组1和2(每一组引物池分别包括正向引物F池和。

45、反向引物R池); 在扩增引物组1的相邻两个 扩增子序列内, 分别设计扩增引物组2的正向引物和反向引物, 在扩增引物组2的相邻两个 说明书 11/29 页 20 CN 111334868 A 20 扩增子序列内, 分别继续设计扩增引物组1的正向引物和反向引物, 周而复始, 直到扩增引 物组1和扩增引物组2的扩增产物可以叠瓦式覆盖整个病毒全基因组(图1)。 引物设计设定 不同引物间的Tm阈值差为2, 扩增子产物大小设定为200-300bp, 同时设计中去除可能 导致引物间/或引物内部形成二聚体(Primer Dimer)和茎环结构(Stem-Loop)的引物对; 同 一扩增引物组中, 尽量保证基因。

46、组上游扩增子的反向引物序列5 端位于下游扩增子的正向 引物序列5 端的上游, 以防止短片段副产物形成并进行PCR竞争; 同时保证体系内扩增效率 接近高度一致。 0073 b .设计锚定Illumina部分接头序列的锚定多重扩增引物F池, 将Illumina Nextera接头部分序列(5 -GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3 )依照5 -3 方向添 加到正向引物F池中的所有引物的5 端; 其中5 -AGATGTGTATAAGAGACAG-3 为Illumina Nextera接头中的Tn5转座酶结合位点序列, 5 -GTCTCGTGGGCTCGG-3 与用。

47、于Illumina完整 文库扩增的标签化引物(I7 Indexed Primer)3 末端序列相同的序列; 其中, 5 - GTCTCGTGGGCTCGG-3 可适当缩短或增长, 以保证Illumina完整文库扩增的标签化引物(I7 Indexed Primer)3 末端序列(I7的下游)可以正常退火至其上即可。 0074 c .设计锚定Illumina部分接头序列的锚定多重扩增引物R池, 将Illumina Nextera接头部分序列(5 -TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3 )依照5 -3 方向添加 到上游引物R池中的所有引物的5 端; 其中5 -AGA。

48、TGTGTATAAGAGACAG-3 为Illumina Nextera接头中的Tn5转座酶结合位点序列, 5 -TCGTCGGCAGCGTC-3 与用于Illumina完整文 库扩增的标签化引物(I5 Indexed Primer)3 末端序列相同的序列; 其中, 5 - TCGTCGGCAGCGTC-3 可适当缩短或增长, 以保证Illumina完整文库扩增的标签化引物(I5 Indexed Primer)3 末端序列(I5的下游)可以正常退火至其上即可。 0075 d、 将合成的锚定多重扩增引物F池和锚定多重扩增引物R池, 混合组成锚定多重扩 增引物组1(Anchored Primer 。

49、Pool1)和锚定多重扩增引物组2(Anchored Primer Pool2), 引物混合模式见表1和表2。 在实际应用中, 需要将锚定多重扩增引物组1或锚定多重扩增引 物组2的扩增产物按照等摩尔量混合以覆盖整个病毒全基因组。 0076 本发明提供的文库构建方法包括: 步骤1)反转录病毒单链RNA成一链cDNA或反转 录病毒单链RNA合成双链cDNA, 其中双链cDNA合成试剂优选为EpiNext Hi-Fi cDNA试剂盒 (Epigentek), 一链cDNA合成试剂优选为TAKARA PrimeScript 1st strand cDNA Synthesis 试剂盒(TAKARA, C。

50、at No.6110A); 反转录引物选择为6-10碱基随机引物或非锚定反向引物 池R中的若干引物混合成的特异性反转录引物组; 步骤2)使用锚定多重扩增引物组1和锚定 多重扩增引物组2, 分别进行PCR反应, 靶向富集新型冠状病毒cDNA; 3)对步骤2)中的PCR产 物进行纯化, 并按照等摩尔量混合; 4)对靶向富集的所述cDNA进行PCR文库扩增, 获得可用 于Illumina测序平台测序的DNA文库; 5)文库纯化。 步骤2)所述PCR的反应体系包括: cDNA模 板5 L-10 L, 锚定多重扩增引物组1或锚定多重扩增引物组2 5 L, DNA聚合酶以及2缓冲 液体系共15 L, 或根。

展开阅读全文
内容关键字: 新型 冠状病毒 基因组 通量 序文 构建 方法 以及 用于 文库 试剂盒
关于本文
本文标题:新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10582385.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1