引用的相关申请
本申请要求2009年8月11日提交的美国临时专利申请第 61/233,042号和2010年2月26日提交的美国临时专利申请第 61/308,578号的优先权,出于各种目的,每个专利申请的内容通过引 用全文并入本文。
发明背景
根据医院和医学专业人员目前使用的各种方法,在妊娠期间可以 检测各种遗传疾病,例如染色体非整倍性。然而,这些方法中的大多 数是侵入性的,并且具有意外的胎儿丢失或流产的风险。使用母体血 浆中的胎儿DNA进行染色体非整倍性的非侵入性产前诊断,是一个 得到积极研究的领域,并且明确需要新的和更为可靠的早期检测方法。 本发明提供了通过胎儿特异性的表观遗传标志物和遗传标志物的组合 来检测染色体非整倍性(例如21三体)的新方法。
具体而言,使用包括联合亚硫酸氢盐限制性分析和甲基化DNA 的免疫沉淀的方法,然后使用覆瓦式阵列(tiling array)杂交(MeDIP-芯 片),以及用亚硫酸盐测序确认任何靶基因座,本发明人搜索了染色体 21、18、和13上在胎盘和母体血细胞中差别甲基化的胎儿DNA标志 物。使用甲基化敏感的限制性核酸内切酶消化,之后使用实时聚合酶 链式反应(PCR)或微流体数字PCR分析,对得到的标志物进行了分析。 通过比较这些表观遗传标志物与遗传标志物的剂量,进行了染色体剂 量分析,所述遗传标志物为源自胎儿且能够通过其独特的多核苷酸序 列与母体DNA序列相区分的DNA序列。此类遗传标志物的一个实例 是存在于Y染色体上的锌指蛋白Y连锁(ZFY)基因。
例如,发现全羧化酶合成酶(HLCS)基因的推定启动子在胎盘中高 甲基化,而在母体血细胞中低甲基化。使用高甲基化HLCS和ZFY基 因座进行的染色体剂量比较可以区分21三体和整倍体胎盘DNA样 品。本发明人证实,表观遗传-遗传染色体剂量方法是用于非侵入性母 体检测染色体非整倍性的新方法,所述染色体非整倍性例如21三体 (T21)、18三体(T18)、或13三体(T13)。利用涉及于染色体非整倍性 的任何染色体上的表观遗传标志物,该方法提供了一种用于非侵入性 产前诊断的普遍可用技术。
发明概述
本发明提供了用于检测孕妇怀有的胎儿中的染色体非整倍性的方 法。所述方法包括下述步骤:(a)测定取自所述孕妇的生物样品中胎儿 来源的甲基化标志物的量,其中所述甲基化标志物位于与染色体非整 倍性相关的染色体上或位于与染色体非整倍性相关的染色体的区段 内,并且其中所述胎儿来源的甲基化标志物由于DNA差别甲基化而 与其母体来源的对应物相区分;(b)测定所述样品中胎儿来源的遗传标 志物的量,其中所述遗传标志物位于参照染色体上,并且其中所述胎 儿来源的遗传标志物由于多核苷酸序列的差别而与所述样品中其母体 来源的对应物相区分,或所述遗传标志物不存在于所述母体基因组中; (c)测定来自(a)和(b)的所述量的比率;以及(d)将所述比率与标准对照 进行比较,其中所述比率高于或低于标准对照指示了胎儿中存在染色 体非整倍性。通常,标准对照值近似人基因组中预期的基因或染色体 的剂量或比率,但是取决于检测方法中使用的具体方法学,可能存在 微小变化。例如,在整倍体男性基因组中,存在2个拷贝的染色体21 和1个拷贝的Y染色体。因此,染色体21上的表观遗传标志物与Y 染色体上的遗传标志物之间的剂量比率可能是大约2。
在一些情况下,所述胎儿来源的甲基化标志物来自胎盘。在其它 情况下,所述母体来源的对应物来自孕妇的血细胞。所述胎儿来源的 甲基化标志物可以比其母体来源的对应物甲基化程度高,或它可以比 其母体来源的对应物甲基化程度低。
在一些情况下,所述样品是母体全血、血清、血浆、尿液、羊水、 生殖道灌洗液、胎盘组织样品、绒毛膜样品、或含有分离自母体血液 的胎儿细胞的样品。在其它情况下,所述样品是含有胎儿核酸的任何 样品。
在一些情况下,所述甲基化标志物是全羧化酶合成酶(HLCS)基因 的一部分或邻近全羧化酶合成酶(HLCS)基因。例如,如表2所示的 所述HLCS基因的若干区域(包括推定启动子区域)可用作甲基化标志 物。其它甲基化标志物包括标志物18A和标志物13A。如下限定其它 甲基化标志物:约15至450个核苷酸的区域且包含一个胞嘧啶,所述 区域为(1)选自MAT.18.0094、MAT.13.0023、MAT.13.0020、 MAT.13.0038、MAT.18.0071、MAT.18.0097、MAT.21.0178、和 TAS.21.1175的基因组基因座;或(2)不超过所述基因座上游和/或下游 10kb。如下限定染色体21上的一些特定标志物:染色体21上约15 至450个核苷酸的区域且包含一个胞嘧啶,所述区域为(1)选自 CGI137、磷酸二酯酶9A(PDE9A)、智人蛋白磷酸酶1、调控(抑制性) 亚基2假基因2(PPP1R2P2)、和类Fem1A(秀丽线虫(Caenorhabditis elegans))的基因组基因座,或(2)不超过所述基因座上游和/或下游10 kb。结合本文所述的任一种或多种遗传标志物,预期这些甲基化标志 物用于根据本发明的检测方法中。
在一些情况下,步骤(a)包括用差别修饰甲基化和非甲基化DNA 的试剂处理所述样品。这样的试剂可包括亚硫酸氢盐或基于甲基化状 态结合DNA的蛋白质或化学品;或者,所述试剂可包括优先切割甲 基化DNA或优先切割非甲基化DNA的酶。
在一些情况下,所述遗传标志物不存在于母体基因组中。在其它 情况下,所述遗传标志物位于Y染色体上。通常,所述胎儿来源的遗 传标志物基于遗传多态性而与母体来源的遗传标志物相区分,所述遗 传多态性包括单核苷酸多态性(SNP)、简单串联重复多态性、和插入- 缺失多态性。在一个实施例中,所述遗传标志物是锌指蛋白Y连锁(ZFY) 基因。在另一个实施例中,所述遗传标志物是在TMED8基因中包含 SNP rs6636的基因组序列,例如SEQ ID NO:1或SEQ ID NO:2。
在一些情况下,可以使用多于一种甲基化标志物或多于一种遗传 标志物。通常,步骤(a)或步骤(b)可包括扩增所述甲基化标志物和/或遗 传标志物、尤其是胎儿来源的甲基化标志物和遗传标志物的过程。例 如,所述扩增为通过聚合酶链式反应(PCR),例如甲基化特异性PCR; 或者所述扩增可以是核酸序列特异性扩增。
在一些情况下,通过分子计数进行步骤(a)或(b)。在其它情况下, 步骤(a)或(b)包括数字聚合酶链式反应、实时定量聚合酶链式反应、阵 列捕获、基于核酸序列的检测、大规模平行基因组测序、单分子测序、 或用彩色编码探针对进行的多核苷酸多重检测。在一些其它情况中, 步骤(a)或(b)包括质谱或与微阵列杂交、荧光探针、或分子信标。
在一些情况下,与染色体非整倍性相关的染色体是染色体13、18、 21、或X。为了进行数据解读,在一些情况下,当所述比率高于或低 于标准对照至少1个标准偏差时,其指示了胎儿中存在染色体非整倍 性,而在其它情况下,当所述比率高于或低于标准对照至少2个或甚 至3个标准偏差时,指示了胎儿中存在染色体非整倍性。
上述方法在广泛应用时,可以用于评估特定目标染色体相比其它 染色体的量的任何潜在变化的非诊断情况中,所述其它染色体为不疑 似其相对量具有任何变化的参照染色体。
本发明还可以以装置或包括一个或多个此类装置的系统进行实 施,所述装置或系统能够实施本文所述方法步骤的全部或部分。例如, 在一些情况下,在接纳取自孕妇的生物样品后,所述装置或系统执行 下述步骤:(a)测定样品中与染色体非整倍性相关的源自胎儿的甲基化 标志物的量;(b)测定样品中参照染色体上的源自胎儿的遗传标志物的 量;(c)测定来自(a)和(b)的所述量的比率;和(d)将所述比率与标准对 照进行比较,以及提供指示胎儿中是否存在染色体非整倍性的输出。 在其它情况下,在步骤(a)和(b)已经执行并且来自(a)和(b)的所述量已 经输入到装置中之后,本发明的装置或系统执行步骤(c)和(d)的工作。 优选地,所述装置或系统为部分或全部自动化的。
附图简要说明
图1.HLCS区域B2的克隆和亚硫酸盐测序结果。在第一排对个体 CpG位点进行编号,其中相对于转录起始位点(位置0)定义核苷酸位 置。第一CpG位点(-232)对应于UCSC基因组浏览器(UCSC Genome Browser)的人类2006年3月(hg18)汇编的chr21:37275031(反向链)。 每个后面的排描绘了通过克隆研究的单个DNA分子中CpG位点上的 甲基化状态。实心环和空心环分别代表甲基化和非甲基化的CpG位 点。来自21三体、正常的首三月和正常的末三月胎盘组织样品的克隆 分别用前缀“T21PLN,”“正常的PLN1st”和“正常的PLN 3rd”标记,而 来自母体血细胞的那些克隆用前缀“MBC”标记。通过前缀后的样品编 号来表示来自不同妊娠个体的胎盘和母体血细胞。
图2.基因剂量实验的数字读出。HLCS和RASSF1A测定以单重形 式运行,而ZFX/Y测定以双重形式运行。每个芯片分成12个面板, 每个面板间隔成765个反应孔。具有靶分子的反应孔以红色或蓝色点 显示,而无扩增的反应孔以灰色点显示。HLCS、RASSF1A和ZFY显 示为红色。ZFX显示为蓝色。(A)用于酶消化的整倍体胎盘DNA样品 的数字PCR结果的图示。每个样品占据4个面板,因此每个芯片可以 容纳3个样品。(B)用于经酶消化的母体血浆DNA样品的数字PCR结 果的图示。来自样品的DNA均匀分布在全部12个面板中。应注意, 对于母体血浆分析,ZFY(胎儿DNA)的拷贝数远低于ZFX(胎儿加母 体的DNA)的拷贝数。
图3.整倍体和21三体胎盘组织DNA样品中的基因剂量比较。(A) HLCS与RASSF1A的比率。(B)HLCS与ZFY的比率。虚线描绘正常参 照范围。
图4.整倍体和21三体母体血浆DNA样品中的基因剂量比较。 针对每个样品绘出了HLCS与ZFY的比率。虚线描绘正常参照范围。
图5.4个数字PCR测定(HLCS、RASSF1A、ZFY和ZFX)的基因组 序列。示出了UCSC基因组浏览器的人类2006年3月参照序列(NCBI Build 36.1)上的染色体位置。带下划线的核苷酸代表酶识别位点。大写 字母的粗体核苷酸代表正向和反向引物。小写字母的粗体核苷酸代表 小沟结合(MGB)探针序列。
图6.(A)HLCS区域B2和(B)C21orf81的COBRA结果的凝胶电 泳。分析了2个21三体胎盘(T21PLN)、2个正常的首三月胎盘(正常 的PLN 1st)、2个正常的末三月胎盘(正常的PLN 3rd)、和2个首三月母 体血细胞(MBC)。用(+)或不用(-)BstUI酶孵育PCR产物。通过出现较 小的消化产物来检测DNA甲基化。在凝胶电泳中使用了1kb梯状条 带(Invitrogen Carlsbad,CA)(M)。
图7.来自4个胎盘组织和8个母体血细胞的HLCS DNA的定量。 通过将酶消化后HLCS的拷贝数除以由模拟消化获得的拷贝数,计算 样品的甲基化指数。“正常的PLN”代表胎盘DNA,“MBC”代表母体血 细胞DNA。
图8.血浆中的产后清除。(A)用(+)或(B)不用(-)限制性酶消化的母 体血浆样品中HLCS的检测。“前”代表分娩前的血浆样品,“后”代表 分娩后的血浆样品。通过以线连接的相同标示描绘来自相同个体的成 对样品。
图9.整倍体和21三体胎盘组织DNA样品中的染色体剂量比较, 所述比较通过测定(A)HLCS与经模拟消化的TMED8-C的比率和(B) HLCS与经BstUI消化的TMED8-C的比率进行。虚线描绘正常参照范 围。
图10.整倍体和21三体胎盘组织DNA样品中的染色体剂量比较, 所述比较通过测定(A)HLCS与经模拟消化的TMED8-G的比率和(B) HLCS与经BstUI消化的TMED8-G的比率进行。虚线描绘正常参照范 围。
图11.BstUI消化的、整倍体和21三体母体血浆DNA样品中的染 色体剂量比较,所述比较通过测定(A)高甲基化HLCS与TMED8-C等 位基因的比率和(B)高甲基化HLCS与TMED8-G等位基因的比率进行。 虚线描绘正常参照范围。
图12.通过克隆的亚硫酸盐测序测定的6对首三月整倍体胎盘和 母体血细胞中标志物18A的DNA甲基化水平。对每个样品的总计8 个克隆进行了标度。以实心环代表甲基化位点,而以空心环代表非甲 基化位点。通过将甲基化克隆的数量除以每个CpG位点处克隆的总数 而得到每个CpG位点处的甲基化指数(MI)。通过将克隆的甲基化CpG 位点的数量除以每个样品的克隆的CpG位点总数而得到甲基化位点 频率。标示出紧邻CpG位点的每个基因组位置的甲基化敏感的限制性 核酸内切酶的识别位点位置。根据UCSC基因组浏览器 (genome.ucsc.edu)的人类基因组2006年3月汇编(hg18)定义基因组位 置。
图13.通过Epityper测定分析整倍体(n=6)和T18(n=6)胎盘中 标志物18A的DNA甲基化水平。全部T18和整倍体胎盘都获自首三 月。使用曼-惠特尼秩和检验(Mann Whitney Rank Sum Test)比较整倍体 病例与T18病例在每个CpG单元处的甲基化指数(MI)。
图14.母体血浆中抗消化的标志物18A序列的表征。(A)分娩胎儿 之前和之后母体血浆中抗消化的标志物18A DNA的浓度。(B)在怀有 男性胎儿的孕妇中,抗消化的标志物18A DNA的浓度与建立的胎儿 遗传标志物ZFY的浓度之间的相关性。
图15.在整倍体(n=5)和18三体(T18)(n=5)胎盘DNA样品中 染色体18(标志物18A)与Y染色体(ZFY)的相对剂量。通过虚线描绘 正常参照范围(平均值±1.96SD)。
图16.在整倍体(n=27)和18三体(T18)(n=9)母体血浆样品中 胎儿染色体18(标志物18A)与Y染色体(ZFY)的相对剂量。通过虚线 描绘正常参照范围(平均值±1.96SD)。
图17.3对首三月整倍体胎盘和母体血细胞中β-肌动蛋白基因区 域的DNA甲基化水平,通过克隆的亚硫酸盐测序测定。亚硫酸盐测 序数据的结果参见图12。此区域用于开发对照测定,以用于检查酶消 化的效率。
图18.通过克隆的亚硫酸盐测序分析的整倍体胎盘(n=6)和母体 血细胞(n=6)中标志物13A的DNA甲基化水平。全部样品都获自首 三月。对每个样品的总计8个克隆进行了标度。以实心环代表甲基化 位点,而以空心环代表非甲基化位点。通过将甲基化克隆的数量除以 每个CpG位点处克隆的总数而得到每个CpG位点处的甲基化指数 (MI)。通过将克隆的甲基化CpG位点的数量除以每个样品的克隆的 CpG位点的总数而得到甲基化位点频率。标示出紧邻CpG位点的每个 基因组位置的甲基化敏感的限制性核酸内切酶的识别位点位置。根据 UCSC基因组浏览器(genome.ucsc.edu)的人类基因组2006年3月汇编 (hg18)绘出基因组位置。
图19.通过Epityper测定分析整倍体(n=5)和T13(n=5)胎盘中 标志物13A的DNA甲基化水平。13三体(T13)胎盘中的4个获自首三 月,1个获自中三月。全部整倍体胎盘都获自首三月。使用曼-惠特尼 秩和检验比较整倍体病例与T13病例的每个CpG单元处的MI。
图20.通过测定抗消化的标志物13A与ZFY的比率进行整倍体(n =10)和13三体(T13)(n=5)胎盘DNA样品中的染色体剂量比较。虚 线描绘正常参照范围。
定义
本申请使用的术语“妊娠相关疾病”是指可能影响孕妇、该孕妇所 怀的胎儿或者孕妇和胎儿二者的任何病症或者疾病。这种病症或者疾 病可能在有限的时间段显示其症状,例如在妊娠或者分娩期间,或者 可能在胎儿出生后持续其一生。“妊娠相关疾病”必定伴随妊娠,且 不仅仅是孕妇偶发病症。换而言之,所述疾病不是非妊娠妇女可发生 的疾病。妊娠相关疾病的一些实例包括异位妊娠、先兆子痫、早产、 和胎儿染色体异常例如13、18、或21三体。
本文使用的术语“染色体非整倍性”包括表现具有染色体异常数 量的任何遗传缺陷,包括具有比任一个染色体正常数量多或少的染色 体,以及除正常对之外具有任一个染色体的多余部分,或者缺少正常 对中任一个染色体的一部分。在一些情况下,所述异常可以涉及多于 一个染色体,或一个或多个染色体的多于一个部分。最常见的染色体 非整倍性为三体,例如21三体,其中受累患者的基因组具有3个染色 体21,而非正常的2个(即1对)染色体21。在较少情况中,除正常对 之外,患者可能具有染色体21的额外片段(少于全长)。在其它情况下, 染色体21的一部分可能移位到其它染色体例如染色体14上。在这一 实例中,染色体21称为“与染色体非整倍性相关的染色体”,而第二、 非相关的染色体(即,患者基因组中正常对中存在的染色体)例如染色 体1为“参照染色体”。还存在其中相关染色体的数量小于正常数量 2的情况。特纳综合征是这样的染色体非整倍性的一个实例,其中女 性个体的X染色体的数量从2个减少为1个。
在与“甲基化标志物”进行比较以测定它们的相对量或浓度(即比 率)的上下文中使用的“遗传标志物”是指,存在于参照染色体的基因 组序列中的多核苷酸序列,基于多核苷酸序列(例如多态性)的差异或 者所述序列的存在或根本不存在(例如序列存在于男性胎儿的Y染色 体上,而不存在于孕妇的基因组中),所述多核苷酸序列允许不同等位 基因(例如来自两个不同个体的等位基因,例如来自胎儿的等位基因相 对于来自孕妇的等位基因)彼此相区分。在此上下文中,位于与染色体 非整倍性相关的染色体上的“甲基化标志物”是指具有异常数量的染 色体上基因组多核苷酸序列;或者在其中存在染色体额外片段或缺少 染色体的一部分的情况下,所述″甲基化标志物″位于相关染色体的所 述片段或部分内。甲基化标志物的甲基化模式的差异允许相应的甲基 化标志物与两个不同个体(例如胎儿和孕妇)相区别。
本文使用的术语“表观遗传状态”是指除了一级核苷酸序列以外 的核酸(例如DNA或RNA)分子水平的任何结构特征。例如,基因组 DNA的表观遗传状态可以包括其二级或三级结构,所述结构由例如其 甲基化模式或者其与细胞蛋白的结合决定或受到它们的影响,所述细 胞蛋白例如组蛋白和此类蛋白的修饰形式(例如乙酰化、去乙酰化、和 甲基化)。
当本申请使用术语“甲基化模式”或“甲基化状态”来描述基因 组序列的甲基化状态时,是指位于与甲基化相关的特定基因组基因座 的DNA片段的特征。这种特征包括、但不限于,此DNA序列内的任 何胞嘧啶(C)残基是否是甲基化的、甲基化C残基的位置、残基的任何 特定序列中甲基化C的百分比、以及甲基化的等位基因差异,所述差 异归因于例如等位基因来源的差异。术语“甲基化模式”或者“甲基化状 态”还指生物样品中残基的任何特定序列中甲基化C或非甲基化C的 相对或者绝对浓度。
本文使用的术语“单核苷酸多态性”或“SNP”是指在相同基因的不 同等位基因内存在于单核苷酸残基处的多核苷酸序列变化,所述相同 基因可以是位于来自相同个体的相同染色体2个拷贝上的相同基因(例 如来自胎儿的2个等位基因),或者可以是来自不同个体(例如胎儿和 孕妇)的相同基因。该变化可能发生在基因的编码区或非编码区(例如 启动子区或其附近,或者内含子)内或者基因间区域中。检测一个或多 个SNP可以区分单个基因的不同等位基因。
本文使用的术语“简单串联重复多态性”是指在相同基因的不同 等位基因中以核苷酸序列的不同数量的串联重复(例如1个或多个核苷 酸的串联重复)而显示的多核苷酸序列变化,所述相同基因可以是位于 来自相同个体(例如胎儿)的相同染色体2个拷贝上的相同基因,或者 可以是来自2个不同个体(例如胎儿和孕妇)的相同基因。该变化往往 发生在基因的非编码区(例如启动子区或其附近,或者内含子)内或者 基因间区域中。检测一个或多个串联重复数量可以区分单个基因的不 同等位基因。
本文使用的术语“插入-缺失多态性”是指,在相同基因的不同等 位基因中,以存在或不存在短核苷酸序列(例如1-3个核苷酸)而显示的 多核苷酸序列变化,所述相同基因可以是位于来自相同个体(例如胎儿) 的相同染色体2个拷贝上的相同基因,或者可以是来自不同个体(例如 胎儿和孕妇)的相同基因。该变化可以发生在基因的非编码区(例如启 动子区或其附近,或者内含子)内或者基因间区域中。检测是否存在短 核苷酸序列可以区分单个基因的不同等位基因。
本文使用的术语“血液”是指来自孕妇或者检测妊娠可能性的妇 女的血液样品或制品。该术语包括全血或者血液的任何组分,例如常 规定义的血清和血浆。
本文使用的术语“亚硫酸氢盐”包括所有类型的亚硫酸氢盐,例如 亚硫酸氢钠,其能够将胞嘧啶(C)化学转化成尿嘧啶(U),而不化学修 饰甲基化胞嘧啶,因此可以基于DNA的甲基化状态差别修饰DNA序 列。
本文使用的“差别修饰”甲基化或者非甲基化DNA的试剂包括,在 一定过程中与甲基化和非甲基化差别反应的任何试剂,通过所述过程 从甲基化和非甲基化的DNA产生可区分产物或者可定量区分的结果 (例如结合或沉淀的程度),由此允许鉴定DNA甲基化状态。此类过程 可以包括、但不限于,化学反应(例如通过亚硫酸氢盐进行的非甲基化 C→U转变)、酶处理(例如通过甲基化依赖的核酸内切酶进行的切割)、 结合、和沉淀。因此,优先切割甲基化DNA的酶是当DNA是甲基化 的时候以高得多的效率切割DNA分子的酶,而当DNA不是甲基化的 时候,优先切割非甲基化DNA的酶显示具有显著更高的效率。在本 发明的上下文中,“差别修饰”甲基化和非甲基化DNA的试剂还指,取 决于DNA序列的甲基化状态,在其结合DNA序列或沉淀DNA序列 方面表现具有差别能力的任何试剂。此类试剂中的一类为甲基化DNA 结合蛋白质。
术语“核酸”或“多核苷酸”是指脱氧核糖核酸(DNA)或者核酸核酸 (RNA)以及其单链或者双链形式的聚合物。除非具体限定,该术语包 括了含有天然核苷酸已知类似物的核酸,所述类似物具有与参照核酸 类似的结合性质,并且以类似于天然存在的核苷酸的方式进行代谢。 除非另外指出,特定核酸序列还提示性地包括其保守修饰的变体(例如 简并密码子取代)、等位基因、同源基因、单核苷酸多态性(SNP)、和 互补序列以及明确指出的序列。具体而言,可以通过产生序列实现简 并密码子取代,所述序列中一个或多个所选(或者全部)密码子的第三 位被混合碱基和/或脱氧肌苷残基取代(Batzer等人,Nucleic Acid Res. 19:5081(1991);Ohtsuka等人,J.Biol.Chem.260:2605-2608(1985);和 Rossolini等人,Mol.Cell.Probes 8:91-98(1994))。术语核酸可以与基 因、cDNA、和基因编码的mRNA互换使用。
术语“基因”表示参与产生多肽链的DNA片段;它包括编码区前后 参与基因产物的转录/翻译/和转录/翻译的调节的区域(前导区和尾区) 以及各个编码片段(外显子)之间的间隔序列(内含子)。
术语“基因座”表示,在参照基因组汇编(例如UCSC基因组浏览 器的人类基因组2006年3月汇编(hg18))的染色体(即基因组位置或染 色体位置)上由起始核苷酸位置至结尾核苷酸位置而限定的DNA区 段。基因座可能覆盖或可能不覆盖基因、CpG岛、或转录/翻译的任何 产物的基因组位置。在本申请中,基因座通常是指由实验数据(例如 MeDIP-芯片数据集)和后续数据分析(例如MAT、TAS)鉴定含有不同 DNA甲基化水平的DNA连续区段。基因座可以含有一个或多个CpG 位点。可以将基因座再分成有利于分析(例如Epityper测定、亚硫酸盐 测序、多核苷酸扩增和测定)的更短的区段(例如含CpG的基因组序列、 片段或区域)。可以将基因座开发为一种或多种胎儿表观遗传标志物。 在本申请的上下文中,基因座还指由某些生物信息学标准鉴定的DNA 连续区段。
在本申请中,术语“多肽”、“肽”、和“蛋白质”可以互换使用,用 来指氨基酸残基的聚合物。所述术语应用于氨基酸聚合物,其中一个 或多个氨基酸残基是相应的天然存在的氨基酸的人工化学模拟物,所 述术语还应用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合 物。本文使用的所述术语包括任何长度的氨基酸链,包括全长蛋白质 (即抗原),其中氨基酸残基通过共价肽键连接。
术语“氨基酸”是指天然存在的和合成的氨基酸,以及氨基酸类似 物和氨基酸模拟物,其以类似于天然存在的氨基酸的方式起作用。天 然存在的氨基酸是由遗传密码编码的那些氨基酸,以及之后被修饰的 那些氨基酸,例如羟脯氨酸、γ-羧基谷氨酸、和O-磷酸丝氨酸。
本文的氨基酸可以用公知的3字母符号或者1字母符号表示,其 由IUPAC-IUB生化命名委员会推荐。同样地,核苷酸可以用它们通常 接受的单字母代码表示。
当在本申请中使用时,“增加”或“减少”是指数量相对于建立 的标准对照的可检测的阳性或阴性变化。增加是标准对照值的至少 10%或20%或者至少50%、80%、或100%的阳性变化;在一些情况下, 增加可以是对照值的至少约1.5倍、至少约2倍、至少约3倍。类似 地,减少是对照值的至少1/10、1/6、1/5或者至少1/3或甚至1/2的阴 性变化。在本申请中按照如上所述的相同方式使用表述相对于比较基 准的数量变化或差异的其它术语,例如“更多”、“更少”、“更高”、 和“更低”。
本文使用的“多核苷酸杂交方法”是指基于多核苷酸形成 Watson-Crick碱基配对的能力在合适的杂交条件下利用已知序列的多 核苷酸探针来检测多核苷酸存在和/或数量的方法。这种杂交方法的实 例包括Southern印迹和Northern印迹。
本文使用的“引物”是指可用于扩增方法(例如聚合酶链式反应 (PCR))中的基于对应于目标基因的多核苷酸序列来扩增核苷酸序列的 寡核苷酸,所述目标基因例如处于各种甲基化状态的HLCS基因。用 于扩增多核苷酸序列的PCR引物中的至少一个对于所述序列为序列 特异性的。
本文使用的“数字聚合酶链式反应”是指常规聚合酶链式反应 (PCR)方法的改进形式,其可以用于直接定量核酸(包括DNA、cDNA 或RNA)和以克隆方式扩增所述核酸,使得可以直接定量地测量靶核 酸的量。数字PCR通过在一些分开的反应室内捕获或分离存在于样品 中的每个单独的核酸分子而实现此直接定量测量,所述反应室能够定 位和浓缩扩增产物至可检测水平。在PCR扩增后,含有PCR终产物 的室的数量即绝对核酸数量的直接测量值。可以在毛细管、微乳液、 小型化室的阵列中、或在核酸结合表面上,通常以稀释的方法,进行 单独的核酸分子的捕获或分离。数字PCR的基础方法学描述于例如 Sykes等人,Biotechniques 13(3):444-449,1992;以及Vogelstein和 Kinzler,Proc Natl Acad Sci USA 1999;96:9236-41中。
本文使用的术语“分子计数”是指,允许分子或分子复合物的数 量的定量测量的任何方法,所述数量往往是在具有独特特征的其它共 存分子或复合物情况中的相对数量。分子计数的多种方法描述于例如 Leaner等人,Analytical Chemistry 69:2115-2121,1997;Hirano和Fukami, Nucleic Acids Symposium Series No.44:157-158,2000;Chiu等人,Trends in Genetics 25:324-331,2009;以及美国专利第7,537,897号中。
本文使用的“标准对照”是指下述反映比率的值,所述比率为位 于与特定染色体非整倍性(例如13、18、或21三体)相关的染色体上的 胎儿基因组序列的量或浓度除以位于参照染色体上的胎儿遗传标志物 的量或浓度的比率,参照染色体上胎儿遗传标志物的量或浓度为见于 来自怀有染色体正常胎儿的普通健康孕妇的生物样品(例如血液、血 浆、或血清)中的量或浓度。“标准对照”可以以不同方式测定,并且 取决于其使用情况而表示不同的值。例如,当用于表观遗传-遗传剂量 方法(其中针对遗传标志物测量表观遗传标志物)中时,所述“标准对 照”为反映下述比率的值,所述比率为位于与特定染色体非整倍性(例 如13、18、或21三体)相关的染色体上的胎儿基因组序列的量或浓度 除以位于参照染色体上的胎儿遗传标志物的量或浓度的比率,参照染 色体上胎儿遗传标志物的量或浓度为见于来自怀有染色体正常胎儿的 普通健康孕妇的生物样品(例如血液、血浆、或血清)中的量或浓度。 在一些情况下,基于处于某妊娠期的普通健康孕妇测定标准对照,而 在其它情况下,不就妊娠期加以区别。
在描述孕妇的上下文中使用的术语“平均”是指代表健康妇女的 随机选择组的某些相关特征,例如见于妇女血液中的母体和胎儿来源 的特定基因或基因组序列的甲基化模式,所述健康妇女怀有染色体正 常胎儿且在样品收集时未患有任何妊娠相关疾病或病症。此所选组应 该包括足够数量的妇女,使得这些妇女中的目标基因的平均数量或甲 基化模式以合理的准确性反映具有健康胎儿的健康孕妇的一般群体中 的相应模式。此外,所选妇女组通常和进行血液检测以指示潜在的妊 娠相关疾病的妇女具有类似的妊娠期。用于实施本发明的优选妊娠期 可以取决于要进行筛选的疾病而变化。例如,优选尽可能早地筛选和 诊断胎儿染色体非整倍性。并且,用于检测的优选妊娠期还可以取决 于进行检测的目标基因。
用于本申请中的术语“量”是指,存在于样品中的目标多核苷酸序 列的数量,所述目标多核苷酸序列例如遗传标志物或胎儿来源的表观 遗传/甲基化标志物。可以以绝对值表示这样的数量,所述绝对值即样 品中多核苷酸序列的总量(例如分子的质量或数量);或者以相对值(例 如比率,或相对于其它标志物)表示;或者表示为样品中多核苷酸序列 的浓度(例如质量/单位体积,或者分子数量/单位体积)。
发明的详细描述
I.引言
在许多国家中,筛查三体例如21三体(T21)构成了现代产科护理 的重要组成部分。可常规用于产前门诊的常用筛查方法针对与染色体 非整倍性相关的附带现象(epiphenomenon),而非直接针对胎儿中的实 际染色体剂量(Wapner等人,N Engl J Med 2003;349:1405-13;Malone 等人,N Engl J Med 2005;353:2001-11)。对于限定检测,在常规筛查程 序中需要侵入性过程,例如绒毛膜取样和羊膜腔穿刺术。然而,这些 方法可能造成过程相关的妊娠丢失(Tabor等人,Lancet 1986;1:1287- 93)。
1997年母体血浆中的无细胞胎儿DNA的发现为非侵入性产前诊 断提供了新的可能(Lo等人,Lancet 1997;350:485-7;Lo和Chiu,Nat Rev Genet 2007;8:71-7)。对母体血浆样品中源自胎儿的父系遗传的遗传物 质的检测,允许产前检测胎儿Rhesus D血型(Lo等人,N Engl J Med 1998;339:1734-8;Finning等人,Bmj 2008;336:816-8)以及性别连锁疾病 的胎儿性别测定(Costa等人,N Engl J Med 2002;346:1502)。然而,对 胎儿染色体非整倍性的非侵入性产前诊断检测的开发还具有更大的挑 战。
对于来自母体血浆核酸分析的T21的直接检测,已经开发了2组 主要方法。第一组涉及存在于胎儿特异性核酸标志物中的单核苷酸多 态性(SNP)的等位基因比率分析(Lo和Chiu,Nat Rev Genet 2007;8:71- 7)。后者的实例包括循环胎盘mRNA(所谓的RNA-SNP方法)(Lo等人, Nat Med 2007;13:218-23)和DNA甲基化标志物(所谓的表观遗传等位 基因比率方法)(Tong等人,Clin Chem 2006;52:2194-202)。此方法的主 要不利之处在于,这些方法仅适用于对所分析的SNP为杂合的胎儿。 并且,在特定基因座内存在的具有足够高杂合率的SNP数量有限,所 以对于此方法来说,群体覆盖是主要挑战。第二组方法涉及使用单分 子计数方法,例如数字PCR(Lo等人,Proc Natl Acad Sci USA 2007;104:13116-21)和大规模平行基因组测序(Chiu等人,Proc Natl Acad Sci USA2008;105:20458-63;Fan等人,Proc Natl Acad Sci USA 2008;105:16266-71)。在这些方法中,对单独的血浆DNA分子进行计 数。此类方法的精确性使得存在于怀有T21胎儿的孕妇的血浆中的源 自染色体21的DNA分子的微小增加得以检测。这些方法的一个不利 之处在于,如果在不具有胎儿特异性的标志物(例如来自染色体21的 随机序列)上使用,则需要对极大量的分子进行计数,例如在使用大规 模平行基因组测序的近期实验中所示例的,其中每个病例需要分析数 百万个分子(Chiu等人,Proc Natl Acad Sci USA2008;105:20458-63; Fan等人,Proc Natl Acad Sci USA2008;105:16266-71)。此后一要求与 使用昂贵设备和试剂以及相对复杂的生物信息学相关。
本申请描述了用于从母体血浆中非侵入性产前检测染色体非整倍 性(例如21三体)的新方法,所述方法基于潜在涉及于非整倍性(例如染 色体21)的染色体上的胎儿特异性DNA甲基化标志物和参照染色体上 的胎儿特异性DNA标志物的浓度比率。此方法称为表观遗传-遗传 (EGG)染色体剂量方法。与上文描述的表观遗传等位基因比率相比, 该EGG方法不要求胎儿特异性DNA甲基化标志物和SNP存在于DNA 的短区段内,因此更为容易地实现群体覆盖。该EGG方法比基于表观 遗传标志物的方法更精确,其中后者通常以染色体21上的一个表观遗 传标志物和参照染色体上的一个表观遗传标志物进行。
为了使该EGG方法可用于三体检测,关键是在相关染色体例如染 色体21、18、或13上具有良好的胎儿特异性DNA甲基化标志物。一 种优选类型的标志物是这样的标志物,其在胎儿中为高甲基化的,而 在母体血细胞中为低甲基化,以使得可以使用甲基化敏感的限制性酶 消化掉母体序列。事实上,之前的工作已证实,RASSF1A基因的启动 子即是一种这样的标志物,不同的是它在染色体3上(Chan等人,Clin Chem 2006;52:2211-8;Chiu等人,Am J Pathol 2007;170:941-50)。已经 报道了染色体21上的很多胎儿DNA甲基化标志物(Chim等人,Clin Chem 2008;54:500-11;Old等人,ReprodBiomed Online 2007;15:227-35; Papageorgiou等人,Am J Pathol 2009;174:1609-18)。本发明人使用靶向 染色体21上35个基因启动子区域的联合亚硫酸氢盐限制性分析 (COBRA)(Xiong和Laird,Nucleic Acids Res 1997;25:2532-4)进行了其 它标志物的搜索。从而发现了全羧化酶合成酶(生物素-(丙酰基-辅酶 A-羧酶(ATP-水解化))连接酶)(HLCS)基因的差别甲基化推定启动子区 域为新的高甲基化胎儿DNA标志物。然后使用HLCS实施了该EGG 原理。染色体18和13上的胎儿特异性甲基化标志物的发现进一步允 许使用类似的策略来检测18和13三体。
II.一般方法学
实施本发明利用分子生物学领域中的常规技术。公开了用于本发 明的一般方法的基础教科书包括Sambrook和Russell,Molecular Cloning,A Laboratory Manual(3rd ed.2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);和Current Protocols in Molecular Biology(Ausubel等人,eds.,1994)。
对于核酸,以千碱基(kb)或碱基对(bp)为单位提供大小。这些是源 自琼脂糖或丙烯酰胺凝胶电泳、源自经测序核酸、或源自公布的DNA 序列的估值。对于蛋白质,以千道尔顿(kDa)或氨基酸残基数为单位提 供大小。从凝胶电泳、从经测序蛋白质、从得到的氨基酸序列、或从 公布的蛋白质序列估计蛋白质大小。
非商业可获得的寡核苷酸可以以化学方式合成,例如根据由 Beaucage和Caruthers,Tetrahedron Lett.22:1859-1862(1981)首次描述 的固相亚磷酰胺三酯法进行,其中使用描述于Van Devanter等人, Nucleic Acids Res.12:6159-6168(1984)中的自动合成仪。使用任何本领 域认可的策略进行寡核苷酸的纯化,所述策略例如非变性丙烯酰胺凝 胶电泳或描述于Pearson和Reanier,J.Chrom.255:137-149(1983)的阴 离子交换高效液相色谱(HPLC)。
可以使用例如Wallace等人,Gene 16:21-26(1981)的用于对双链 模板进行测序的链终止法来验证用于本发明的遗传标志物的序列或基 因组序列,例如HLCS或ZFY基因的多核苷酸序列和合成的寡核苷酸 (例如引物)。
III.血液样品的获得和DNA的提取
本发明涉及分析见于母体血液中的适合的胎儿染色体DNA的表 观遗传-遗传染色体剂量,作为非侵入性手段,以检测妊娠相关病症或 疾病的存在和/或监测其进展。因此,实施本发明的第一步为获得来自 孕妇的血液样品并从所述样品提取DNA。
A.血液样品的获得
从处于适于使用本发明的方法进行检测的妊娠期的孕妇获得血液 样品。适合的妊娠期可以取决于所检测的疾病而变,如下文所讨论的。 根据医院或诊所一般采取的标准操作程序从妇女收集血液。收集外周 血的适合的量(例如通常为5-50mL),并可以在进一步制备前根据标准 操作储存。
B.血液样品的制备
可以使用例如全血、血清、或血浆根据本发明分析见于母体血液 中的胎儿DNA。用于制备来自母体血液的血清或血浆的方法是本领域 技术人员熟知的。例如,可以将孕妇的血液置于含有EDTA或专门的 商品例如Vacutainer SST(Becton Dickinson,Franklin Lakes,NJ)的管 中,以防止血液凝结,并且可以通过离心从全血获得血浆。作为EDTA 的替代物,可以将肝素或柠檬酸盐用作抗凝剂。另一方面,可以在血 液凝结后经离心或不经离心获得血清。如果使用离心,则通常(但非绝 对)在合适的速度、例如1,500-3,000x g进行。在转移至用于DNA提 取的新试管之前,可以使血浆或血清进行另外的离心步骤。替代这些 离心步骤或额外地,还可以使用一个或多个离心步骤,以从血浆或血 清中去除颗粒状物质。
除全血的非细胞部分以外,还可从富含于血沉棕黄层部分的细胞 部分回收DNA,所述细胞部分可以在离心来自妇女的全血样品并去除 血浆后获得。还可以针对循环于母体血液中的胎儿有核细胞富集细胞 部分。此类富集程序可以包括涉及一种或多种针对胎儿细胞的抗体的 分选或选择程序,或者包括靶向可以区分胎儿与母体细胞的物理、生 化、生物物理或其它特征的程序。所述分选程序可以涉及例如荧光活 化细胞分选器、磁性活化细胞分选或微流体的技术。所述选择程序可 以涉及显微操作或激光捕获显微切割、用光学镊子操作或任何其它单 细胞操作程序。可以靶向的胎儿细胞类型包括有核红血细胞、淋巴细 胞、单核细胞、滋养层、或细胞残余物,例如凋亡的胎儿细胞。
C.DNA的提取
已知多种用于从包括血液的生物样品提取DNA的方法。可以采 用DNA制备的一般方法(例如Sambrook和Russell,Molecular Cloning: A Laboratory Manual 3d ed.,2001所述);还可以使用各种可商业购买 的试剂或试剂盒以从来自孕妇的血液样品获得DNA,所述试剂或试剂 盒例如QIAamp DNA Mini Kit或QIAamp DNA Blood Mini Kit(Qiagen, Hilden,Germany)、GenomicPrepTM Blood DNA Isolation Kit(Promega, Madison,WI)、和GFXTM Genomic Blood DNA Purification Kit (Amersham,Piscataway,NJ)。还可以使用这些方法中多于一种的组合。
IV.DNA的甲基化特异性修饰
为了正确地鉴定存在于样品中的胎儿和母体DNA之间差别甲基 化的表观遗传标志物或基因组序列(例如HLCS基因)的来源,必需分 析从上一步骤分离的DNA的甲基化状态,从而区分胎儿和母体DNA。 在从孕妇的血液样品提取后,用能够以差别甲基化方式而化学修饰 DNA的试剂处理DNA,所述差别甲基化方式即在处理后,由于甲基 化胞嘧啶(C)残基和非甲基化C残基将产生不同且可区分的化学结构。 通常,此类试剂与DNA分子中的非甲基化C残基反应,并将每个非 甲基化C残基转化成尿嘧啶(U)残基,而甲基化C残基保持不变。这 种C→U转变允许基于核酸一级结构的变化进行甲基化状态的检测 和比较。适于此目的的示例性试剂为亚硫酸氢盐,例如亚硫酸氢钠。 用于使用亚硫酸氢盐进行DNA的化学修饰的方法是本领域熟知的(参 见例如Herman等人,Proc.Natl.Acad.Sci.USA 93:9821-9826,1996), 本文将不再详细论述。
本领域技术人员将会认识到,本文未指出但具有差别修饰甲基化 和非甲基化DNA的相同性质的任何其它试剂都可用于实施本发明。 例如,还可通过甲基化敏感的限制性酶实现DNA的甲基化特异性修 饰,所述酶中的一些通常切割非甲基化DNA片段,而不切割甲基化 DNA片段,而其它酶(例如甲基化依赖的核酸内切酶McrBC)切割含有 甲基化胞嘧啶的DNA,而不切割非甲基化DNA。此外,化学修饰和 限制性酶处理的组合,例如联合亚硫酸氢盐限制性分析(COBRA)也可 以用于实施本发明。
V.多核苷酸序列扩增和测定
在以差别甲基化方式修饰DNA之后,将经处理的DNA进行基于 序列的分析,使得用作表观遗传标志物的源于与非整倍性相关的染色 体的胎儿DNA的基因组序列(例如HLCS基因)可以与来自母体DNA 的相同基因相区分,并且可以定量地测定样品中所述胎儿基因的量或 浓度且与来自胎儿来源的参照染色体的遗传标志物的量或浓度进行比 较,然后将二者的比率与标准对照进行比较。
A.核苷酸序列的扩增
在甲基化特异性修饰后,在表观遗传标志物的序列分析之前,任 选地进行扩增反应。在本发明的一些实施方式中,进行扩增以优先地 扩增具有特定甲基化模式的标志物的一部分,使得仅来自一个特定来 源(例如来自胎盘或胎儿其它组织)标志物得到检测,且分析其数量或 浓度。如期望,使用选择性地扩增标志物序列的胎儿形式的已知扩增 方法进行参照染色体上的遗传标志物的扩增,所述参照染色体上的遗 传标志物允许基于多核苷酸序列的差别进行胎儿或母体来源的测定。 通常,通过认真的引物设计实现优先扩增。
已建立了各种多核苷酸扩增方法,并且频繁用于研究中。例如, 用于多核苷酸序列扩增的聚合酶链式反应(PCR)的一般方法是本领域 熟知的,因此本文不进行详细描述。对于PCR方法、操作程序、和原 理的综述,参见例如Innis等人,PCR Protocols:A Guide to Methods and Applications (PCR技术手册:方法与应用指南),Academic Press,Inc. N.Y.,1990。还可从供应商,例如Roche Molecular Systems,获得PCR 试剂和操作程序。
最通常用热稳定酶作为自动化过程实施PCR。在此过程中,经过 变性区、引物退火区、和延伸反应区自动地循环反应混合物的温度。 特异性地适于此目的的机器是可商业购买的。改进的且更敏感的PCR 方法例如实时PCR和数字PCR也可用于本发明的某些实施方式中。
尽管靶多核苷酸序列(例如表观遗传标志物的一部分,其中胎儿和 母体序列是差别甲基化的)的PCR扩增通常用于实施本发明,但是本 领域技术人员将认识到,可以通过任何已知方法实现见于母体血液样 品中的HLCS基因序列的扩增,所述方法例如连接酶链式反应(LCR)、 转录介导的扩增、和自身持续序列复制或基于核酸的扩增(NASBA), 所述方法中的每一种都提供了足够的扩增。还可将分支DNA技术用 于定量地证明特定标志物序列(代表特定甲基化模式或特定多核苷酸 序列)的存在,或定量地测定母体血液中特定标志物序列的量或浓度。 对于用于直接定量临床样品中的核酸序列的分支DNA信号扩增的综 述,参见Nolte,Adv.Clin.Chem.33:201-235,1998。
B.多核苷酸序列的测定
同样已建立了用于多核苷酸序列测定的技术,并且广泛实施于相 关研究领域中。例如,用于多核苷酸测序的基础原理和一般技术描述 于关于分子生物学和重组遗传学的各种研究报告和论文集中,例如 Wallace等人,同上;Sambrook和Russell,同上;和Ausubel等人, 同上。常规实施于研究实验室中的人工或自动DNA测序方法可用于 实施本发明。用于实施本发明的方法的适于检测多核苷酸序列中的改 变(例如C→U)的其它手段包括但不限于质谱、引物延伸、多核苷酸 杂交、实时PCR、熔解曲线分析、高分辨率熔解分析、异源双链体分 析、焦磷酸测序、和电泳。
VI.建立标准对照
为了建立用于实施本发明的方法的标准对照,首先选择怀有健康 胎儿的一组健康孕妇。这些妇女是在使用本发明的方法筛查妊娠相关 病症的适合的妊娠时间段内,所述妊娠相关病症例如胎儿染色体非整 倍性及其它。任选地,所述妇女具有类似的妊娠期,例如在妊娠的相 同三期内,如在首三月或中三月。
通过已建立的常规采用的方法证实所选孕妇和她们所怀有的胎儿 的健康状态,所述方法包括但不限于,妇女的一般体检,妇女的遗传 分析、和使用CVS和羊膜腔穿刺术的胎儿遗传分析。
此外,怀有健康胎儿的健康孕妇的所选数量也必须具有合理的规 模,以使得从该组获得的母体血液中的胎儿遗传和表观遗传标志物的 平均量/浓度、量/浓度比率、和母体血液中一种或多种表观遗传标志物 的甲基化模式可以被合理地认为代表怀有健康胎儿的健康妇女一般群 体中的正常或平均水平或者甲基化模式。优选地,所选的组至少包括 10位妇女。
胎儿表观遗传标志物甲基化模式可以反映此基因的甲基化状态的 多个不同且可分开的方面。例如,甲基化模式的一个方面是,C残基 是否是甲基化的;其它方面是标志物特定区域内的甲基化C碱基的数 量;该模式的进一步方面是多个分析DNA分子中任何给定位置处的 甲基化C的百分比。甲基化模式的其它方面可以包括、但不限于,甲 基化的等位基因差别,差别甲基化等位基因的比率等等。胎儿表观遗 传标志物甲基化模式还可以根据组织类型例如胎盘或其它胎儿组织而 变化。因此,可以对用于检测的不同胎儿组织建立单独的标准对照。
当基于见于所选健康对照组的每位妇女的各自的值对存在于母体 样品中的胎儿标志物特定组建立了胎儿表观遗传-遗传标志物比率的 平均值时,该平均或中位或代表值或者模式被认为是标准对照。取自 这些健康对照妇女的样品应该理想地在侵入性程序之前获取。在同一 过程中还测定标准偏差。在一些情况下,可以对表观遗传标志物的甲 基化模式的不同方面建立单独的标准对照,例如基于表观遗传标志物 序列的不同区域。
实施例
以下仅以说明方式而非以限定方式提供下述实施例。本领域技术 人员会容易地认识到,可以改变或修改多个非关键参数,以产生基本 上相同或类似的结果。
实施例1
I.材料和方法
研究参与者
招募了就诊于香港威尔士亲王医院妇产科(Department of Obstetrics and Gynaecology,Prince of Wales Hospital,Hong Kong)的具 有整倍体和21三体妊娠的妇女。从参加该研究的个体获得了知情同意 书,并且从香港中文大学-新界东联网联合临床研究伦理委员会(Joint Chinese University of Hong Kong-New Territories East Cluster Clinical Research Ethical Committee)获得了伦理批准。
通过COBRA进行的染色体21上的差别甲基化区域的筛选
将COBRA(Xiong和Laird,Nucleics Acid Res 1997;25:2532-4)用于 评估来自胎盘和母体血细胞的DNA样品中染色体21上的基因组序列 的甲基化状态。
通过COBRA鉴定的差别甲基化基因座的克隆和亚硫酸盐测序分析
将来自COBRA分析的PCR产物用于克隆和亚硫酸盐测序。为了 以单个分子的分辨率分析甲基化状态,使用pGEM-T Easy Vector System(Promega,Madison,WI)将PCR产物TA克隆到质粒载体中。使 用载体引物T7和SP6PCR克隆来自阳性重组克隆的插入片段,然后 使用BigDye Terminator Cycle Sequencing v 1.1试剂盒(Applied Biosystems,Foster City,CA)、根据制造商的说明书通过循环测序进行 分析。在乙醇沉淀后,将样品重悬于10μL的Hi-Di甲酰胺中,然后 在3100DNA分析仪(Applied Biosystems)上运行。使用SeqScape软件 (Applied Biosystems)分析测序数据。在标度之前确认亚硫酸氢盐转化 完全。通过将甲基化CpG位点的总数除以全部克隆的CpG位点计算 甲基化位点频率(Chiu等人,Am J Pathol 2007;170:941-50)。
HLCS基因座的常规实时定量PCR分析
基于COBRA筛选和亚硫酸盐测序结果,我们开发了甲基化敏感 的限制性核酸内切酶(MSRE)消化阵列,随后进行靶向HLCS基因座区 域B2的实时定量PCR分析,所述基因座区域B2在胎盘中为高甲基 化的,而在母体血细胞中为非甲基化的。使用酶消化允许分析HLCS 基因座在不同基因组DNA样品中的甲基化模式。此外,可以消除母 体血浆样品中的背景母体DNA分子。用于实时PCR测定的引物和探 针的序列列于表1。
通过微流体数字PCR平台进行的基因剂量分析
通过在微流体数字PCR平台上的聚合酶链式反应分析染色体21 和参照标志物的基因剂量比较(Ottesen等人,Science 2006;314:1464-7; Warren等人,Proc Natl Acad Sci USA 2006;103:17807-12)。用于表观 遗传-表观遗传比较的基因座是染色体21上的HLCS和染色体3上的 RASSF1A(Chiu等人,Am J Pathol 2007;170:941-50)。二者都是高甲基 化胎儿DNA标志物。用于表观遗传-遗传比较的基因座是来自怀有男 性胎儿的妊娠的染色体21上的HLCS和Y染色体上的ZFY。用于全 部测定的引物和探针的序列和PCR热循环条件列于表1。
统计分析
使用SigmaStat 3.5软件(SPSS)进行统计分析。
血液和组织样品的收集
在妊娠首三月中的常规产前诊断阶段期间收集绒毛膜样品 (CVS)。从分娩后的整倍体末三月妊娠以及从妊娠终止后的整倍体和 21三体妊娠收集胎盘组织样品。通过完全染色体核型分型确认胎儿染 色体状态。从全部个体收集母体外周血样品(12-20mL EDTA)。将额 外的12mL血液收集到来自分娩后的末三月妊娠的EDTA管中。首、 中和末三月的样品的妊娠期分别为12-14周、17-21周和38-40周。
血液和组织样品的处理
通过如前描述的双离心操作程序处理母体外周血样品(Chiu等人, Clin Chem 2001;47:1607-13)。以2,500g离心血细胞部分,然后去除任 何残余的血浆。分别用QIAamp DNA Blood Mini Kit和QIAamp DSP DNA Blood Mini Kit(Qiagen,Hilden,Germany)的血液和体液操作程序 提取来自外周血细胞的DNA和来自母体血浆的DNA。用QIAamp DNA Mini Kit(Qiagen)、根据制造商的组织操作程序提取来自CVS和 月台盘的DNA。
通过COBRA进行的染色体21上的差别甲基化区域的筛选
如下描述了COBRA程序。使用EZ DNA Methylation Kit(Zymo Research,Orange,CA)、根据制造商的说明书在1微克的每个DNA样 品上进行亚硫酸氢盐转化。然后用HotStar Taq DNA Polymerase Kit (Qiagen,Hilden,Germany)中提供的试剂,使40纳克的亚硫酸氢盐-转 化的DNA(基于初始的DNA输入量进行计算)进行PCR扩增。用于每 个PCR的试剂组成列于表2。通常,以20μL反应进行PCR,所述反 应具有1x PCR Buffer、MgCl2、50μM的每种dNTP、正向和反向引物、 HotStar Taq聚合酶、以及有或没有2X PCRx增强剂(Invitrogen, Carlsbad,CA)。加热情况为:95℃下进行15分钟,然后是45-55个 循环,以及最后72℃延伸3分钟,每个循环为95℃进行20秒、适 合的退火温度进行30秒、72℃进行1.5分钟。然后使PCR产物进行 限制性酶消化。针对要用于每个相应的基因座的限制性酶区分亚硫酸 氢盐转化后甲基化和非甲基化序列的能力对所述酶进行选择。基本上, 限制性位点仅存在于甲基化或非甲基化序列之一而非二者中,以使得 序列之一将被消化,而另一个序列将保持完整。在制造商的推荐温度 下,用5μL PCR产物、1x适合的缓冲液、和10U限制性酶(或者对 于模拟消化则无),在20μL反应中进行限制性酶消化2h。全部的酶 都购自New England Biolabs(Ipswich,MA)。然后通过琼脂糖凝胶电泳 分析消化产物。
HLCS基因座的常规实时定量PCR分析
MSRE消化。对于每个胎盘和母体血细胞DNA样品,使100ng DNA进行MSRE消化。在制造商的推荐温度下,在50μL反应中进行 限制性酶消化至4少16h,所述反应具有1x适合的缓冲液、25U的HpaII 和50U的BstUI(或者对于模拟消化则无)(New England Biolabs)。对于 每个母体血浆样品,将1.6mL血浆用于DNA提取,然后在50μL的 去离子水中稀释,使其中21μL进行限制性酶消化。在制造商的推荐 温度下,在30μL反应中进行酶消化至少16h,所述反应具有1x适合 的缓冲液、20U的HpaII和30U的BstUI(或者对于模拟消化则无)。 然后通过实时定量PCR分析消化产物。所选限制性酶仅消化非甲基化 DNA,而不消化甲基化DNA。由于来自COBRA分析的数据已证实 HLCS在胎盘组织中为高甲基化的而在母体血细胞为非甲基化的,预 期一定比例的来自胎盘组织的DNA将保持是可检测的,而多数来自 母体血细胞的DNA将被消化,从而在限制性酶处理后变得无法检测。
实时定量PCR分析。针对HLCS基因组DNA的经和未经限制性 酶消化的定量分析开发了实时PCR测定。将4微升的经限制性酶处理 的DNA或模拟消化样品用于实时PCR测定。每个反应含有1xTaqMan Universal PCR Master Mix(Applied Biosystems)、300nM的每种正向和 反向引物(Integrated DNA Technologies,Coralville,IA)、和100nM的 TaqMan探针(Applied Biosystems)。引物和探针的序列列于表1。加热 情况为50℃下进行2分钟,95℃下进行10分钟,然后是50个循环, 每个循环为95℃进行15秒和60℃进行1分钟。全部反应一式两份 进行,然后取平均数。通过光密度测量初始定量的系列稀释的人基因 组DNA用作测定的定量标准物,并且测定的检测限值是每反应1拷 贝。因为限制性酶消化后的可检测HLCS分子代表了甲基化部分,因 此将实时定量PCR表示为甲基化指数。通过将酶消化后的HLCS的拷 贝数除以经模拟消化获得的拷贝数计算样品的甲基化指数。进行母体 血浆DNA分析,以示出高甲基化HLCS分子的产后清除。
通过微流体数字PCR平台进行的基因剂量分析
MSRE消化。使用MSRE,BstUI(New England Biolabs)消化低甲基 化DNA。在60℃下用BstUI酶消化提取的DNA 16h。对于CVS、 胎盘组织和母体血细胞,使用40U的BstUI酶消化用于微流体数字 PCR测定的200ng的DNA。包括经模拟消化的等分试样作为消化对 照。对于模拟消化,使等量DNA经受相同的消化条件,而不加入酶。 对于血浆样品,使用20U的BstUI酶消化来自末三月样品的3.4-4.8 mL血浆的DNA。对于首三月和中三月血浆样品,使用40U或60U 的BstUI酶消化从4.4-9.1mL血浆提取的DNA。图5以下划线示出 了具有BstUI限制性位点的靶序列。
微流体数字PCR分析。设计了用于HLCS、RASSF1A和ZFY基因 座(图5)的微流体数字PCR测定,分别代表染色体21、染色体3和Y 染色体的剂量。之前已描述了ZFX/Y阵列和数字PCR分析的基础(Lun 等人,Clin Chem 2008;54:1664-72)。引物和探针的序列列于表1。在 BioMark系统(Fluidigm,South San Francisco,CA)上使用12.765Digital Arrays(Fluidigm)进行数字实验。该数字阵列由12个面板组成,每个 面板进一步间隔成765个反应孔。用每个面板,将反应设置为10μL 混合物,其终浓度为:根据制造商的操作程序,用测定上样缓冲液和 样品上样缓冲液稀释的1xTaqMan Universal PCR Master Mix(Applied Biosystems)、125nM TaqMan探针(Applied Biosystems)、和900nM正 向和反向引物(Integrated DNA Technologies)。输入的DNA体积为对于 每个10μL反应混合物的3.5μL。加热情况为50℃下进行2分钟, 95℃下进行10分钟,然后是50个循环,每个循环为95℃进行15 或30秒,然后57℃或60℃进行1分钟。每个测定的加热循环条件 说明于表1。HLCS和RASSF1A测定以单重测定进行。ZFX/Y测定以 双重反应进行。
经BstUI消化的基因组DNA样品的测定特异性。使来自CVS、 胎盘、和母体血细胞的DNA样品在BstUI消化后进行HLCS、RASSF1A、 和ZFX/Y数字PCR分析。在酶消化后,将DNA稀释为1-2ng/μL的 浓度,以加入用于数字PCR分析的反应混合物中。来自CVS和胎盘 的DNA样品构成抗酶消化的HLCS和RASSF1A分子,因此在限制性 酶消化后应该检测到信号。另一方面,我们预期在血细胞中没有检测 水平或检测水平低,因为它们在这两个基因座处是低甲基化的。
ZFX/Y基因座不含有任何BstUI酶消化位点,因此限制性酶处理 应该不对DNA分子具有任何作用。ZFY分子构成来自男性胎儿的源 自胎儿的序列,以用于比率比较。
经BstUI消化的血浆DNA样品的测定特异性。在BstUI-消化母体 血浆DNA样品后,用去离子水进行4倍稀释。然后将样品与反应混 合物混合,以上样到微流体芯片上进行分析。
通过表观遗传-表观遗传方法和表观遗传-遗传方法进行的基因剂 量比较。对BstUI限制性酶消化后的整倍体和T21胎盘DNA样品进行 HLCS、RASSF1A和ZFX/Y基因座的数字PCR分析。对于母体血浆分 析,我们比较了在来自整倍体和T21妊娠的经BstUI消化的DNA样品 中HLCS与ZFY的比率。
II.结果
通过COBRA进行的染色体21的差别甲基化区域的筛选
选择了染色体21上的35个启动子区域用于使用COBRA方法的 差别甲基化筛选,其中30个与CpG岛(CGI)无关,而其它5个与CGI 相关。定义CGI的标准如下:长度>400bp、GC含量>50%,且观 察到的CpG/预期的CpG的比率>0.6(Yamada等人,Genome Res 2004;14:247-66)。从UCSC基因组生物信息数据库的2006年3月人类 参照序列(网站:www.genome.ucsc.edu/)(NCBI Build 36.1)获得了邻近 35个启动子的转录起始位点(-1kb至+500bp;转录起始位点为0)的 DNA序列,并且设计了51个COBRA测定以在胎盘组织和母体血细 胞之间比较甲基化模式(表2)。
在该51个测定中,比较了从首三月和末三月以及母体血细胞收集 的胎盘组织之间启动子区域的甲基化模式。将来自正常妊娠的至少一 个胎盘组织和一个母体血细胞样品用于COBRA筛选(表2)。在筛选的 区域中,通过COBRA鉴定了HLCS和C21orf81(GenBank登记号 AF326257)的推定启动子区域在胎盘组织和母体血细胞之间是差别甲 基化的。HLCS区域B2的代表性COBRA结果示例于图6A,其中相 比母体血细胞,胎盘为高甲基化的;C21orf81的代表性COBRA结果 示例于图6B,其中相比胎盘组织,母体血细胞为轻微甲基化的。
HLCS基因座的克隆和亚硫酸盐测序分析
在HLCS区域上进行克隆和亚硫酸盐测序实验以进一步以单个分 子的分辨率分析甲基化状态,结果示于图1。HLCS区域的测序结果确 认了,HLCS的超甲基化为胎盘特异性的,其甲基化位点频率为0.435 至0.699。尽管在母体血细胞样品中的靶序列的3’-末端(即位置-57至 +111,转录起始位点为0)检测到低甲基化水平(甲基化位点频率< 0.100),但是几乎对于从-232至-67的CpG位点未观察到甲基化。 经MSRE消化的胎盘、母体血细胞和血浆DNA样品的实时定量PCR
基于HLCS区域B2的COBRA和亚硫酸盐测序数据,开发了MSRE 消化测定,然后进行实时定量PCR分析以分析从胎盘和母体血细胞提 取的基因组DNA的差别甲基化。
将来自8个母体血细胞样品与从整倍体妊娠收集的2个首三月和 2个末三月胎盘组织样品的HLCS推定启动子区域的甲基化模式进行 了比较。进行限制性酶消化,然后进行实时定量PCR分析,结果示于 图7。来自全部母体血细胞样品的DNA几乎都被限制性酶消化,得到 的甲基化指数近似0(中值:0.0178,四分位距(IQR):0.0121-0.0281)。 胎盘组织DNA样品被部分消化,得到的甲基化指数范围为0.567至 0.966。
之前的数据提示,胎盘是胎儿DNA的主要来源(Bianchi,Placenta 2004;25Suppl A:S93-S101),而母体血细胞是母体血浆中可检测的背景 母体DNA的主要供应者(Lui等人,Clin Chem 2002;48:421-7)。因此得 到这样的假说:HLCS DNA分子的胎盘特异性部分,即甲基化或不可 消化部分,可以在母体血浆中检测到。收集了25对分娩前和分娩后的 末三月母体血浆样品,进行限制性酶消化,然后进行实时定量PCR分 析。结果示例于图8。在全部的经酶消化的分娩前的血浆样品中都获 得了阳性HLCS信号。来自经酶处理的分娩前和分娩后的血浆样品的 清除模式提示了,抗消化的HLCS分子是妊娠特异性的(P=<0.001, Wilcoxon符号秩检验)。分娩后的血浆样品中的中值HLCS浓度仅为分 娩前的样品的8.1%(分别为20.1和247.8个拷贝/mL)(图8A)。对于经 受模拟消化的样品,分娩后的血浆样品的中值HLCS浓度为分娩前的 样品的83.8%(分别为1208.5和1442.4个拷贝/mL)(图8B)。经模拟消 化,在分娩前的血浆样品中检测到胎儿和母体DNA二者,而在分娩 后的样品中仅得到母体DNA。注意到的是,分娩前和分娩后的样品与 模拟消化之间的HLCS浓度差异是统计上显著的(P=0.003,Wilcoxon 符号秩检验)。来自BstUI消化等分试样的数据显示,有5个母体血浆 样品具有相对较高水平的胎儿DNA,并且这5个样品与在甚至未经酶 消化的分娩后的样品中显示HLCS浓度显著下降的样品相同。这可以 促成明显的甚至未经酶消化的“清除”模式。在分娩后的血浆样品中观 察到的HLCS浓度的降低可能是由于一些样品具有异常高水平的胎儿 DNA(P=0.003,Wilcoxon符号秩检验)。注意到的是,该5个具有显 著高浓度的HLCS的分娩前样品与酶消化比较中的前5个样品匹配。
微流体数字PCR平台上的基因剂量分析
在微流体数字PCR平台上进行了染色体21和参照染色体标志物 的基因剂量比较。染色体21标志物为高甲基化的HLCS,染色体3和 Y染色体上的参照标志物分别为高甲基化的RASSF1A和男性特异性的 ZFY。
将2对胎盘组织和母体血细胞样品用于检测HLCS和RASSF1A检 验经和不经酶消化的性能。还进行ZFX/Y测定(GenBank登记号ZFX: NM_003410和ZFY:NM_003411)。由于这些基因座上没有酶消化位 点,预期拷贝数将不受酶消化的影响。使用2个分娩后的母体血浆样 品测试抗消化的HLCS和RASSF1A分子的产后清除。
在每个基因组DNA样品上进行每个测定的一个面板。对于分娩 后的母体血浆,将经酶消化的DNA分布到用于给具有阳性结果的任 何孔标度的2个面板中。基因组DNA和血浆DNA样品的结果分别概 述于表3A和3B。计算每个目标基因座的阳性孔的数量。分布到面板 中的分子的实际数量按照泊松分布,并通过下述公式进行校正:
靶标=-ln[E/N]x N,
其中靶标是靶分子的经泊松校正的计数,ln是自然对数,E是阴性(空 白)孔的数量,N是反应中数字PCR孔的总数。
来自经BstUI消化的胎盘DNA样品的结果显示,当与经模拟消化 的样品进行比较时,约60%-70%的HLCS和RASSF1A分子保持为可 检测的。在母体血液DNA中,低甲基化RASSF1A分子被BstUI酶处 理完全消化,而一些HLCS分子在样品中保持为可检测的。对于ZFY 和ZFX测定,从经模拟或BstUI消化的DNA样品计得的拷贝数无变 化(表3A)。
分娩后的母体血浆分析显示,在BstUI酶消化后,都检测到HLCS 和RASSF1A分子的极低水平(表3B)。 通过MSRE消化、然后通过数字PCR分析在胎盘DNA样品中进行的 基因剂量比较
将HLCS和RASSF1A测定应用于10个整倍体和12个21三体胎 盘DNA样品(表4A)。对每个测定进行4个面板的计数(图2A)。在整 倍体和T21样品中的阳性HLCS和RASSF1A扩增数量的比率为统计上 显著差异的(P=0.005,曼-怀氏等级和检验)。然而,在2组之间具有 大的覆盖(图3A)。由整倍体样品计算的正常参照范围(限定为HLCS与 RASSF1A平均比率±1.96SD)为0.86-1.63。超过一半的T21病例落 在参照范围内。不同样品中的2个基因座的甲基化密度异质性可以促 成HLCS与RASSF1A比率的大的个体间变化。为了解决这一精确性问 题,对于整倍体和T21DNA样品之间的剂量比较可需要更稳定的基 线。
然后研究了独立于其甲基化状态的胎儿特异性基因座(即ZFY基 因座),以用作在怀有男性胎儿的妊娠中的基因剂量比较的基线。这是 该表观遗传-遗传学(EGG)方法的重要特征。
使用于HLCS和RASSF1A比较的经相同限制性酶消化的胎盘DNA 样品进行ZFY数字PCR分析(图2A)。将来自4个面板的总拷贝数用 作上文获得的HLCS分子的总拷贝数的参照基线。整倍体样品的正常 参照范围(限定为HLCS与ZFY的平均比率±1.96SD)计算为1.08- 1.62。全部的T21样品都显示了比正常参照范围高的比率(图3B)。 通过MSRE消化、然后通过数字PCR分析在母体血浆DNA样品中进 行的基因剂量比较
然后将EGG技术应用于来自整倍体和T21妊娠的母体血浆DNA 样品,以确定该EGG方法是否能被应用于胎儿21三体的非侵入性产 前检测。合理地认为,尽管母体血浆中的母体HLCS分子被BstUI酶 限制性消化,从而留下完整的源自胎儿的高甲基化HLCS分子用于分 析,但是源自胎儿的ZFY基因座将不受影响,因为在PCR扩增子内不 存在BstUI酶识别位点,因此提供了用于基因剂量比较的稳定的基线。
从怀有整倍体胎儿的末三月、中三月、和首三月中的每一个获得 8个母体血浆样品。在BstUI消化后,在HLCS和ZFY测定的微流体 芯片上的至少6个面板中分析每个DNA样品(图2B)。使用阳性孔的 总数计算每个样品中的HLCS与ZFY的比率(表4B)。
由24个具有整倍体妊娠的母体血浆样品计算1.49-2.88的正常参 照范围。一个整倍体DNA样品的比率落在正常参照范围外。该样品 在Speedvac浓缩期间干燥,然后在样品制备期间用水重构,这可能是 不准确的原因。来自T21妊娠的全部5个母体血浆样品都具有比参照 范围高的HLCS与ZFY的比率(图4)。数据显示,用EGG方法,可以 在母体血浆样品非侵入性地检测胎儿21三体。
III.讨论
在此研究的第一部分中,本发明人成功地验证了染色体21上的高 甲基化胎儿DNA标志物,即HLCS基因的启动子区域(US专利申请公 开第2007/0275402号)。此标志物的高甲基化性质允许其在母体血浆 中通过使用甲基化敏感的限制性酶消化和PCR扩增而相对简单地得 到检测。
然后使用HLCS证明该新EGG方法是胎儿染色体剂量分析的可行 方法。该EGG方法超过之前的表观遗传等位基因比率分析(Tong等人, Clin Chem 2006;52:2194-202)的主要优势在于,使用此方法可以避免后 一方法对下述的需求:表观遗传靶标和遗传靶标(即SNP)要存在于相 同基因座中,且彼此在短距离内。在此研究中,将Y染色体上的ZFY 基因用作胎儿特异性遗传靶标的模型。然而在实践中,可以使用任何 胎儿特异性遗传靶标,例如胎儿从父亲遗传的而且不存在于怀孕母亲 中的SNP等位基因。可以相对容易地开发多个此类标志物,以确保该 方法的广泛的群体覆盖。
还证明的是,以使用高甲基化HLCS与高甲基化RASSF1A的比率 为例,该EGG方法比单单基于表观遗传标志物的方法具有更高的T21 分辨率。该后一方法的亚最优性能的一个可能解释是由于下述事实: 在单独的源于胎儿的HLCS和RASSF1A分子的DNA甲基化水平上存 在差异,如图1中和在之前公开的亚硫酸盐测序结果可见(Chiu等人, Am J Pathol 2007;170:941-50)。因此,可以预期从这2个潜在变化的参 数测定的比率将比一个参数为相对稳定的遗传标志物(如在该EGG方 法的情况下)的情况具有更宽的参照间隔。
在此研究中,将微流体数字PCR用作检测和测量平台,原因是之 前的结果已显示其为高度精确的分析方法(Lun等人,Clin Chem 2008;54:1664-72;Lun等人,Proc Natl Acad Sci USA2008;105: 19920-5)。该EGG方法还可以在此分子计数方案的其它变型中实施, 例如通过使用‘下一代’测序仪的靶向测序。
在其它染色体(例如染色体18和13)上开发对于产前筛查重要的胎 儿表观遗传标志物,将进一步拓宽该EGG方法的可用性。胎儿表观遗 传标志物的一个实例为SERPINB5基因,其编码染色体18上的maspin (Chim等人,Proc Natl Acad Sci USA 2005;102:14753-8)。Papageorgiou 等人(Papageorgiou等人,Am J Pathol 2009;174:1609-18)描述了染色体 18和13上胎儿表观遗传标志物的其它实例。
实施例2
近期开发了用于胎儿21三体检测的新的表观遗传-遗传学染色体 剂量方法,其中使用胎儿表观遗传标志物即染色体21上的全羧化酶合 成酶(HLCS)的推定启动子,和胎儿遗传标志物即存在于Y染色体上的 锌指蛋白Y连锁(ZFY)基因(Tong等人,Clin Chem 2010;56:90-8)。为了 证明此方法可用于检测男性和女性胎儿两者,本发明人已经研究了参 照染色体上的父系遗传的胎儿单核苷酸多态性(SNP)等位基因用作取 代Y染色体标志物的表观遗传-遗传染色体21剂量测定的基线的用途。
I.材料和方法
研究参与者
招募了在2009年10月至2010年3月就诊于威尔士亲王医院妇产 科的具有整倍体和21三体(T21)妊娠的妇女。从参加此研究的个体获 得了知情同意书,并且从香港中文大学-新界东联网联合临床研究伦理 委员会获得了伦理批准。
在首三月中的常规产前诊断阶段期间收集绒毛膜样品(CVS)。从分 娩后的整倍体末三月妊娠以及从妊娠终止后(TOP)的T21妊娠收集胎 盘组织样品。通过完全染色体核型分型确认每个T21病例的染色体状 态。从全部的个体收集母体外周血样品(在EDTA管中的12mL)。
血液和组织样品的处理
通过如前描述的双离心操作程序处理母体外周血样品(Chiu等人, Clin Chem 2001;47:1607-13)。以2,500g离心血细胞部分,然后去除任 何残余的血浆。分别用QIAamp DNA Blood Mini Kit和QIAamp DSP DNA Blood Mini Kit(Qiagen)的血液和体液操作程序提取来自外周血 细胞的DNA和来自母体血浆的DNA。
用QIAamp DNA Mini Kit(Qiagen)、根据制造商的组织操作程序 提取来自CVS和胎盘的DNA。
染色体剂量分析
分别通过实时定量聚合酶链式反应(qPCR)和数字PCR(Vogelstein 和Kinzler Proc Natl Acad Sci USA1999;96:9236-41)分析胎盘组织和 母体血浆DNA样品中染色体21和参照标志物的染色体剂量比较。通 过将高甲基化HLCS的量与胎儿从父亲遗传的但不存在于怀孕母亲中 的SNP等位基因(rs6636,a C/G SNP)的量进行比较,进行染色体剂量 分析。SNP rs6636位于染色体14上含有8个(TMED8)基因的跨膜 emp24蛋白质转运结构域内,其平均杂合率为0.451+/-0.149(dbSNP build 130)。rs6636是之前描述的SNP(Chow等人,Clin Chem 2007;53:141-2)之一。在此文献中将rs6636SNP测定表示为 TMED8-C/G SNP测定。
甲基化敏感的限制性核酸内切酶(MSRE)消化
使用甲基化敏感的限制性核酸内切酶BstUI(New England Biolabs) 消化低甲基化DNA。在60C下用BstUI酶消化提取的DNA 16小时。 对于CVS、胎盘组织和母体血细胞和正常对照血细胞,使用40U的 BstUI酶消化100ng的DNA以用于PCR测定。包括经模拟消化的等 分试样作为消化对照。对于模拟消化,使等量DNA经受相同的消化 条件,而不加入酶。对于血浆样品,使用20U至40U的BstUI酶消 化来自1.6-5.2mL血浆的DNA。
用于常规实时qPCR分析的测定设计和反应条件
对HLCS和TMED8基因座进行实时PCR分析。引物和探针的序 列列于表5。HLCS、TMED8-C等位基因和TMED8-G等位基因测定全 部以单重反应进行。在HLCS基因座的PCR扩增子内,存在2个BstUI 酶识别位点。相比之下,TMED8SNP测定不含有任何BstUI酶识别位 点。
每个反应设置为25μL混合物,其终浓度为1xUniversal PCR Master Mix(Applied Biosystems)、100nM探针(Applied Biosystems)、300nM的每种正向和反向引物(Integrated DNA Technologies,Coralville,IA)以及25ng DNA输入量。反应在50℃下 开始进行2分钟,在95℃下继续进行10分钟,然后是40个循环, 每个循环为95℃进行15秒和60℃进行1分钟。在7300实时PCR 系统(Applied Biosystems)上进行实验,并通过SDS v1.3.0软件(Applied Biosystems)收集和分析荧光数据。全部反应一式两份进行,然后取平 均数。通过从成人男性血细胞的系列稀释的基因组DNA(浓度范围为 每个反应10000个基因组当量(GE)至3个GE)构建校正曲线。
用于数字PCR分析的测定设计和反应条件
将用于实时PCR分析的相同寡核苷酸序列用于HLCS和 TMED8-C/G SNP数字PCR分析(表5)。此处,HLCS测定与TMED8-C/G SNP测定中的每一个结合以双重反应进行。将荧光探针标记为具有 TMED8-C(FAM)的HLCS(VIC)双链体和具有TMED8-G(VIC)的HLCS (FAM)双链体。
之前已描述了数字PCR分析的基础(Lo等人,Proc Natl Acad Sci U SA 2007;104:13116-21;Lun等人,Clin Chem 2008;54:1664-72)。在384 孔板中每孔的总反应体积为5μL,其终浓度为1xUniversal PCR Master Mix(Applied Biosystems)、100nM探针(Applied Biosystems)、和300nM的每种正向和反向引物(Integrated DNA Technologies)。反应在50℃下开始进行2分钟,在95℃下继续进行 10分钟,然后是50个循环,每个循环为95℃进行15秒和60℃进 行1分钟。在7900HT Sequence Detection System(Applied Biosystems) 上以384孔形式进行实验,然后通过SDS 2.3软件的“绝对定量”应 用(Applied Biosystems)收集荧光数据。
TMED8-C/G SNP测定的特异性
使从胎盘组织提取的具有已知TMED8基因型的基因组DNA进行 HLCS和TMED8双链体测定。用TMED8-C/G SNP测定检测一个等位 基因为纯和的样品的另一个等位基因。C等位基因纯和的样品不应该 显示检测G等位基因TMED8测定的任何信号,反之亦然。
β-肌动蛋白测定作为消化对照
将之前描述的在胎盘和母体血细胞二者中皆为非甲基化的β-肌动 蛋白区域用于测定BstUI消化的效率(Chan等人,Clin Chem 2006;52:2211-8)。将该β-肌动蛋白测定修改为含有2个BstUI酶识别 位点以匹配当前HLCS测定的BstUI酶识别位点的数量。引物和探针 的序列列于表5。将相同序列用于实时qPCR和数字PCR分析二者中。
统计分析
使用SigmaStat 3.5软件(SPSS)进行统计分析。
II.结果和讨论
通过常规实时qPCR进行的染色体剂量分析
将HLCS和TMED8-C/G SNP测定应用于具有杂合的C/G基因型 的总计20个整倍体和9个T21胎盘组织样品。通过使用HLCS与 TMED8-C的比率分析6个整倍体和4个T21样品,并且通过HLCS 与TMED8-G的比率分析剩余的14个整倍体和5个T21样品。通过从 成人男性血细胞提取的系列稀释的基因组DNA(浓度范围为每个反应 10000个GE至3个GE)构建校正曲线,将其用于测定检测样品中的2 个基因座的绝对拷贝数。
将全部3个测定优化为具有类似的效率,如通过校正曲线的斜度 和y-截距所示。HLCS、TMED8-C和TMED8-G测定的校正曲线的斜 度分别为-3.71、-3.70和-3.62,而y-截距显示循环阈值分别为39.62、 39.79和42.04。
胎盘DNA样品中的HLCS与TMED8-C的比率
首先在经模拟消化的胎盘DNA样品中测定HLCS与TMED8-C的 比率。由6个整倍体样品计算的正常参照范围(限定为HLCS与 TMED8-C平均比率±1.96SD)为1.78-2.66。全部4个T21样品都显 示了比正常参照范围高的比率(表6A)(图9A)。
然后使相同样品进行BstUI限制性酶消化,之后进行实时PCR分 析。尽管非甲基化HLCS分子将被BstUI酶处理消化,从而仅留下抗 消化的高甲基化HLCS分子用于PCR检测,但是TMED8分子将保留 完整,因为在TMED8PCR扩增子内无BstUI酶识别位点。正常参照 范围计算为1.24-2.26。正确分类全部样品(表6B)(图9B)。
在模拟和BstUI消化实验二者中,包括具有TMED8SNP的纯和的 GG基因型的胎盘DNA样品以用于测试测定特异性。当应用用于检测 C等位基因的TMED8测定时无信号(表6A和6B)。
胎盘DNA样品中的HLCS与TMED8-G的比率
首先在经模拟消化的胎盘DNA样品中测定HLCS与TMED8-G的 比率。由14个整倍体样品计算的正常参照范围为1.78-2.66。来自整 倍体和T21组中的每一个的一个样品被错误分类(表7A)(图10A)。
然后使相同样品进行BstUI限制性酶消化,之后进行实时PCR分 析。正常参照范围计算为0.90-1.99。来自整倍体和T21组中的每一 个的一个样品被错误分类(表7B)(图10B)。这些样品不是在模拟消化 实验中被错误分类的相同样品。
在模拟和BstUI消化实验二者中,包括具有TMED8SNP的纯和的 CC基因型的胎盘DNA样品以用于测试阵列特异性。当应用用于检测 G等位基因的TMED8测定时无信号(表7A和7B)。
β-肌动蛋白作为消化对照
通过将β-肌动蛋白测定应用于与用于HLCS与TMED8染色体剂 量分析的那些相同的经模拟和BstUI消化的胎盘DNA样品,评估BstUI 酶消化效率。使用相同的校正标准对样品中的β-肌动蛋白序列的量进 行定量。校正曲线的斜度为-3.41,而y-截距显示循环阈值为37.97。 结果显示,超过96%的DNA在全部检测样品中都被消化(表8A和8B)。
通过数字PCR进行的染色体剂量分析
TMED8-C/G SNP测定的特异性
用HLCS和TMED8双链体测定检测具有杂合的C/G、纯和的C/C 和纯和的G/G基因型的胎盘DNA样品,以确定用于检测SNP等位基 因中任一个的特异性。将2个样品用于三组中的每一组。C等位基因 纯和的样品不应该显示检测G等位基因的TMED8测定的任何信号, 反之亦然。
对对于每个靶基因座皆为阳性的孔的数量进行了计数。分布到384 孔面板中的分子的总数按照泊松分布,并如之前描述进行了校正(Tong 等人Clin Chem 2010;56:90-8)。
通过应用HLCS和TMED8-C双链体测定,杂合的C/G和纯和的 C/C基因型的胎盘DNA样品显示了2个基因座都为阳性的孔,而纯和 的G/G基因型的样品仅对于HLCS基因座为阳性的,对于TMED8-C 等位基因未观察到可检测信号(表9A)。
通过应用HLCS和TMED8-G双链体测定,杂合的C/G和纯和的 G/G基因型的胎盘DNA样品显示了2个基因座都为阳性的孔,而纯 和的C/C基因型的样品仅对于HLCS基因座为阳性的,对于TMED8-G 等位基因未观察到可检测信号(表9B)。
结果显示,TMED8-C/G SNP测定在检测单个SNP等位基因中是 特异性的。通过用不同荧光染料标记的等位基因特异性探针赋予了特 异性。
母体血浆DNA样品中的HLCS与TMED8-C的比率
通过比较信息样品中抗消化的HLCS与胎儿特异性的TMED8SNP 等位基因的比率,进行了母体血浆DNA分析。将信息样品定义为其 中胎儿为杂合的而母亲为纯和的样品,本实施例中为TMED8-C/G SNP。将胎儿已从父亲遗传的额外等位基因用作染色体21剂量测定的 参照基线。
将HLCS和TMED8-C双链体测定应用于总计16个整倍体和2个 T21妊娠。在这些样品中,TMED8SNP的胎儿和母体基因型分别为 C/G和G/G。胎儿特异性SNP等位基因为C等位基因。通过BstUI酶 消化后进行数字PCR分析母体血浆DNA样品。在至少1个84孔板中 分析每个样品。使用阳性孔的总数计算每个样品中HLCS与TMED8-C 等位基因的比率。
由整倍体母体血浆样品计算的正常参照范围为2.12-3.65。从末 三月收集了8个样品,从中三月和首三月妊娠中的每一个收集了4个 样品。在这16个整倍体样品中,10个来自怀有女性胎儿的妊娠,6 个来自怀有男性胎儿的妊娠。全部整倍体样品的HLCS与TMED8-C 等位基因比率落在参照范围内。从中三月和首三月妊娠收集的T21样 品显示比参照范围高的比率(图7A)。2个T21病例都怀有女性胎儿。
母体血浆DNA样品中的HLCS与TMED8-G的比率
在信息样品中的其它组中,TMED8SNP的胎儿和母体基因型分别 为C/G和C/C。胎儿特异性SNP等位基因为G等位基因。将HLCS 和TMED8-G双链体数字PCR测定应用于来自9个整倍体妊娠和1个 T21妊娠的经BstUI消化的母体血浆DNA样品。在至少1个384孔板 中分析每个样品。使用阳性孔的总数计算每个样品中HLCS与 TMED8-G等位基因的比率。
由整倍体母体血浆样品计算的正常参照范围为2.06-3.68。在9 个整倍体样品中,从末三月、中三月、和首三月妊娠分别收集5个、3 个和1个病例。这些病例包括怀有女性胎儿的4个妊娠和怀有男性胎 儿的5个妊娠。全部整倍体样品的HLCS与TMED8-G等位基因比率 落在参照范围内。怀有女性胎儿的首三月T21妊娠显示比参照范围高 的HLCS与TMED8-G的比率(图7B)。
β-肌动蛋白作为消化对照
通过将β-肌动蛋白数字PCR测定应用于与用于HLCS与TMED8 染色体剂量分析的那些相同的经BstUI消化的母体血浆DNA样品,评 估BstUI酶消化效率。经消化的DNA样品的等分试样(总消化混合物 的1/50)经确认显示,在进行染色体剂量分析前β-肌动蛋白测定的不超 过1个阳性孔。
III.结论
在上一实施例中,本发明人已基本上证明了,该EGG方法是用于 母体血浆DNA样品中胎儿染色体剂量分析的可行方法。将高甲基化 HLCS基因座用作表观遗传组分,其代表一类胎儿特异性分子,并且 ZFY基因座为男性胎儿特异的遗传标志物。通过比较染色体21上的胎 儿特异性表观遗传标志物与参照染色体上的胎儿特异性遗传标志物之 间的比率,可以推导出染色体21剂量。
在此实施例中,我们进一步证明了,表观遗传-遗传染色体剂量方 法可以应用于三体的产前诊断,其中使用胎儿特异性SNP等位基因作 为代替源自男性胎儿的Y染色体标志物的遗传参照基线。
此处,将位于染色体14上的TMED8基因座内的SNP rs6636用作 实例。通过比较高甲基化HLCS和胎儿特异性TMED8SNP等位基因 之间的比率,可以推导出染色体21剂量。证明了2个SNP等位基因 都可用作这样的遗传参照基线。
通过使用信息SNP等位基因作为遗传参照基线,可以将该EGG 染色体剂量方法应用于男性和女性胎儿二者的21三体的产前诊断。此 外,一些此类标志物的开发将确保该方法的广泛群体覆盖。如之前所 描述(Chow等人Clin Chem 2007;53:141-2),可以首先检测母体血沉棕 黄层样品(其主要包含母体DNA),以确定那些SNP的母体基因型。对 于母亲显示为纯和的SNP,则可以针对检测未出现于母体血浆中母体 基因型中的等位基因。如果血浆样品对于非母体等位基因为阳性的, 则其提示胎儿已从父亲遗传了该等位基因。然后可将母体血浆中的父 系遗传的胎儿特异性等位基因的定量用作使用表观遗传-遗传方法的 基因剂量评估的参照。最后,使用涉及于其它非整倍性中的对产前检 测重要的其它染色体(例如染色体18和13)的表观遗传标志物,将进一 步拓展该EGG方法的临床效用。
实施例3:用于检测胎儿18三体的表观遗传-遗传染色体剂量方法
此实施例证明了表观遗传-遗传(EGG)染色体剂量方法用于检测胎 儿18三体(T18)的应用。该EGG方法的此实施例涉及母体血浆中分别 位于染色体18上的胎儿表观遗传标志物和位于参照染色体上的胎儿 遗传标志物。胎儿表观遗传标志物优选为标志物18A[基因组位置 chr18:10022533-10022724,根据人类基因组2006年3月汇编(hg18)定 义],其为位于基因VAPA(囊泡相关膜蛋白质)-相关蛋白质A)下游75 kb和基因APCDD1(腺瘤性结肠息肉下调蛋白)上游的421kb之间的 146-bp的基因间区,通过甲基化DNA免疫沉淀和覆瓦式阵列分析(描 述于USSN 61/308,578)鉴定。然而,此胎儿表观遗传标志物还可以是 位于上述基因座(即chr18:10022533-10022724)的上游或下游100kb内 的任何含有胞嘧啶的DNA基因组区域。此外,此胎儿表观遗传标志 物还可以是具有区分母体血浆中胎儿和母体染色体18的不同表观遗 传标志(DNA甲基化水平)的任何含有胞嘧啶的DNA基因组区域。
母体血浆中的胎儿遗传标志物优选为位于Y染色体上的锌指Y连 锁(ZFY)基因中的区域。然而,此胎儿遗传标志物还可以是胎儿和其母 亲之间的任何遗传差异,包括单核苷酸多态性(SNP)和插入/缺失(indel) 多态性。
在此实施例中,本发明人采用该EGG方法比较染色体18上的标 志物18A的浓度和Y染色体上的胎儿遗传标志物锌指蛋白Y连锁(ZFY) 基因的浓度,以进行T18的非侵入性产前检测。
I.材料和方法
样品收集
从就诊于香港威尔士亲王医院妇产科或香港赞育医院产前诊断和 咨询部(Prenatal Diagnostic and Counselling Department)或英国伦敦国 王学院医院哈里斯胎儿医学研究中心(Harris Birthright Research Centre for fetal Medicine)的妇女获得样品。招募的全部孕妇都经知情同意。 相应的机构审查委员会批准了该研究。
在首三月和中三月中的常规产前诊断阶段期间收集绒毛膜样品 (CVS)。通过完全染色体核型分型确认了每个整倍体和T18病例的染 色体状态。从全部的个体收集母体外周血样品(在EDTA管中的12 mL)。收集来自英国的血浆,冷冻保存然后于干冰上分批送往香港。
样品处理
通过如前描述的双离心操作程序处理外周血样品(Chiu等人,Clin Chem 2001;47:1607-13)。以2,500g离心血细胞部分,然后去除任何残 余的血浆。
分别用QIAamp DNA Blood Mini Kit和QIAamp DSP DNA Blood Mini Kit(Qiagen)的血液和体液操作程序提取来自外周血细胞的DNA 和来自母体血浆的DNA。用QIAamp DNA Mini Kit(Qiagen)、根据制 造商的组织操作程序提取来自CVS和胎盘的DNA。 胎盘和母体血细胞中的标志物18A甲基化状态的分析
通过克隆和亚硫酸盐测序进行的DNA甲基化分析
通过克隆和亚硫酸盐测序在6对胎盘组织和母体血细胞中分析标 志物18A的甲基化状态。简而言之,使用EZ DNA Methylation Kit (ZymoResearch)、根据制造商的说明书对提取的DNA进行亚硫酸氢盐 转化。通过靶向标志物18A区域的引物,使经亚硫酸氢盐转化的DNA 进行PCR扩增。用于PCR的引物序列列于表10。PCR条件概述于表 11A。然后用pGEM T-Easy Clone Kit(Promega)、根据制造商的说明书, 将PCR产物克隆到质粒载体中。用大肠杆菌菌株JM109(Promega)进 行克隆。然后使用T7和SP6启动子引物(Promega)、根据制造商的说 明书,扩增来自克隆的插入片段(反应条件概述于表11A中的小标题 “菌落PCR测定”下)。然后用BigDye Terminator循环测序v1.1试剂 盒(Applied Biosystems)、根据制造商的说明书,使PCR产物进行测序 反应(反应条件概述于表11A中的小标题“测序反应”下)。然后用乙 醇沉淀DNA,重悬于10μL的Hi-Di甲酰胺,之后在3100DNA Analyzer (Applied Biosystems)上测序。使用SeqScape v2.5软件(Applied Biosystems)分析测序数据。通过检验非CpG胞嘧啶残基的转化率,本 发明人确保每个克隆的>99%亚硫酸氢盐转化。
通过将每个样品的甲基化克隆数除以克隆总数计算每个CpG位点 处的MI。对于每个CpG位点,计算两个生物学重复的平均MI。通过 将每个样品的甲基化克隆数除以标度的克隆总数得到甲基化位点频 率。
T18和整倍体胎盘中标志物18A甲基化状态的分析
通过Epityper测定进行的DNA甲基化分析
用标准MassCLEAVE操作程序(Sequenom)(Ehrich等人Proc Natl Acad Sci USA2005;102:15785-90)(涉及于操作程序中的各反应条件 的细节概述于表11B)进行Epityper测定。简而言之,用靶向标志物 18A的Epityper测定使经亚硫酸氢盐转化的DNA进行PCR扩增。引 物序列列于表10。将T7启动子标签加入到反向引物的3’末端,将 10个碱基的标签加入到引物的5’末端,以使正向和反向引物之间的 解链温度相等。用EZ DNA Methylation Kit(ZymoResearch)、根据制造 商的说明书,使提取的DNA进行亚硫酸氢盐转化,并用PCR扩增。 然后使用T7DNA聚合酶和T7RNA聚合酶,将PCR产物体外转录为 RNA,并用RNase A在具有A-或G-残基的碱基处进行特异性地切割。 该切割反应产生了含有CpG的片段或CpG单元,其大小将取决于CpG 位点的甲基化状态(即,在亚硫酸氢盐转化后,对于甲基化和非甲基化 CpG分别为CpG或TpG)。然后纯化产物,用基质辅助的激光解吸/电 离飞行时间(MALDI-TOF)质谱(MassARRAY Analyzer Compact)进行 解析。通过将甲基化产物的峰高除以甲基化和非甲基化产物二者的峰 高总和计算每个CpG单元的甲基化指数(MI)。
分娩前和分娩后的母体血浆中的甲基化标志物18A序列的检测
将实时定量PCR(qPCR)测定设计为靶向标志物18A。策略性地定 位引物和探针,使得母体DNA中的非甲基化CpG位点(而非胎儿DNA 中的甲基化CpG位点)将被相关限制性核酸内切酶特异性地切割。
甲基化敏感的限制性核酸内切酶(MSRE)消化
使用两种类型的MSRE即HpaII和HinP1I(New England Biolabs) 消化血浆DNA。对于每个血浆样品,从0.8mL-3.2mL血浆提取DNA 并在50μL水中稀释。然后将35μL的经稀释的DNA与各20U的HpaII 和HinP1I(New England Biolabs)在37℃下、在1X NEBuffer1中一起 孵育2小时。
常规实时定量PCR分析
1)胎儿分娩前和分娩后的抗消化的标志物18A的浓度
MSRE消化后,在ABI 7300HT序列检测系统(Applied Biosystems) 上,通过常规qPCR扩增标志物18A的高甲基化DNA序列。每个qPCR 测定的反应体积为50μL,其含有1XUniversal PCR Master Mix(Applied Biosystems)、1500nmol/L的每种正向和反向PCR引物 (Integrated DNA Technologies)、和250nmol/L探针(Integrated DNA Technologies)。用FAM在探针的5’末端进行标记作为报告分子。 加热情况为50℃下进行2分钟,95℃下进行10分钟,40个循环, 每个循环为95℃进行15秒和60℃进行1分钟。引物和探针序列列 于表12。
2)在从怀有男性胎儿的妊娠获得的分娩前母体血浆中抗消化的标志物 18A的浓度和ZFY的浓度的关系
在ABI7300HT序列检测系统(Applied Biosystems)上,用之前建立 的测定(Lun等人,Clin Chem 2008;54:1664-72),通过qPCR测定ZFY 的浓度。每个qPCR测定的反应体积为50μL,其含有1XUniversal PCR Master Mix(Applied Biosystems)、300nmol/L的每种正 向和反向PCR引物、和100nmol/L探针(Applied Biosystems)。用VIC在探针的5’末端进行标记作为报告分子。加热 情况为50℃进行2分钟,95℃进行10分钟,40个循环,每个循环 为95℃进行15秒和60℃进行1分钟。引物和探针序列列于表12。
对于通过qPCR分析进行定量,通过从男性外周血细胞样品提取 的系列稀释的已知浓度的基因组DNA(其通过NanoDrop ND-1000 (Thermo Fisher Scientific Waltham),使用DNA-50设置进行定量)生成 校正曲线。然后使用其构建具有从每个反应3个拷贝至每个反应 10,000个拷贝的线性动态范围的定量标准。检测的限值(LOD)为每个 反应3个拷贝。在LOD浓度下进行20个重复的反应,100%的孔为阳 性的且具有39.1的定量循环中值(范围为38.2-40.8)。将检测到的高 于该限值的任何信号看作是不可检测的。全部反应进行两次,取平均 数。在每一次PCR运行中都包括多个水空白(无模板的对照)。
EGG染色体剂量分析
本发明人采用该EGG方法比较了从整倍体和T18妊娠获得的胎 盘组织(CVS)和母体血浆样品中染色体18上的胎儿表观遗传标志物即 标志物18A的相对剂量与Y染色体上的胎儿遗传标志物即ZFY的相 对剂量。
甲基化敏感的限制性核酸内切酶(MSRE)消化
涉及标志物18A的EGG分析的消化操作程序与用于qPCR分析 的相同。为了分析胎盘样品,使50ng的DNA进行消化。全部胎盘组 织都从首三月获得。为了分析血浆样品,从获自整倍体或T18妊娠的 首三月、中三月和末三月的1.6mL-3.2mL血浆提取DNA。将来自 每个病例的提取的DNA稀释到50μL水中,然后将其35μL进行消化。
用于数字PCR分析的测定设计和反应条件
开发了双链体数字PCR测定以扩增抗消化的标志物18A和ZFY 序列。之前已描述了数字PCR分析的基础(Lo等人Proc Natl Acad Sci U SA 2007;104:13116-21;Tong等人Clin Chem 2010;56:90-8)。 每孔的反应体积为5μL,其终浓度为1xUniversal PCR Master Mix(Applied Biosystems)和每个靶标的相应引物和探针浓度。 对于标志物18A,反应包括250nM探针(Integrated DNA Technologies)和1500nM的每种正向和反向引物(Integrated DNA Technologies)。对于ZFY,反应包括100nM探针(Applied Biosystems)和300nM的每种正向和反向引物(Integrated DNA Technologies)。用报告分子FAM标记标志物18A的探针,而用报告 分子FAM标记ZFY的探针(表12)。每个靶标的数字PCR反应的总数 为384。引物和探针序列与用于qPCR的那些相同。
为了检验消化完全,开发了其它数字PCR测定,以靶向β-肌动蛋 白基因上的区域,其(i)在来自首三月的胎盘和母体血细胞中为完全非 甲基化的(图17);且(ii)含有和标志物18A类似的MSRE的识别位点数 量和类型。通过克隆的亚硫酸盐测序确认此特定区域的甲基化状态(图 17)。用于涉及于亚硫酸盐测序分析的PCR扩增的引物序列列于表10。 反应条件和针对标志物18A描述的相同。预期完全消化后无β-肌动蛋 白序列可检测到。反应体积为每孔5μL,其终浓度为1xUniversal PCR Master Mix(Applied Biosystems)以及250nM探针(Applied Biosystems)和900nM的每种正向和反向引物(Integrated DNA Technologies)。用报告分子VIC在探针的5’末端进行标记(表 10)。在7900HT序列检测系统(Applied Biosystems)上进行测定。在50℃ 下开始反应2min,在95℃下继续进行10min,然后是55个循环, 每个循环为95℃进行15秒和60℃进行1分钟。对于每个靶标,数 字PCR反应的总数为96。
通过SDS 2.3软件的“绝对定量”应用(Applied Biosystems)收集 全部数字PCR测定的荧光数据。
统计分析
用SigmaStat 3.0软件(SPSS)进行统计分析。
II.结果
标志物18A是潜在的胎儿表观遗传标志物
之前的研究显示,在胎盘和母体血细胞之间为差别甲基化的基因 组区域具有被开发为母体血浆中的胎儿表观遗传标志物的潜力(Chim 等人Clin Chem 2008;54:500-11;Tong等人Clin Chem 2010;56:90-8)。 克隆和亚硫酸盐测序结果揭示了,标志物18A在整倍体胎盘(n=6)中 主要为甲基化的,而在母体血细胞中基本上为非甲基化(n=6)(图12)。 胎盘和母体血细胞中的平均甲基化指数分别为0.68和0.01。
本发明人已通过Epityper研究了标志物18A在整倍体(n=6)和 T18(n=6)胎盘中的甲基化水平。进行了曼-惠特尼秩和检验,以比较 在每个CpG单元处整倍体胎盘与T18胎盘的MI(图13)。合理地认为, 如果标志物18A的甲基化水平不在整倍体和T18胎盘之间显著改变, 则其可以用于比较整倍体和T18母体血浆中的胎儿染色体18的剂量。 发现在标志物18A的靶区域中,全部CpG单元都不在整倍体和T18 胎盘之间具有显著的差别甲基化(图13)。
在酶消化后的母体血浆中的标志物18A检测
本发明人分析并比较了分娩前和分娩后24小时获得的母体血浆 DNA中抗消化的标志物18A的浓度。在每一个消化后样品中都无法 检测到非甲基化β-肌动蛋白序列,这指示消化完全。在分娩胎儿前, 在末三月妊娠(n=10)中的抗消化的标志物18A序列的中值浓度为806 个拷贝/mL。分娩后,血浆浓度下降到测定的检测限值以下,估计为 每反应3个拷贝。胎儿分娩前和分娩后的抗消化的标志物18A序列的 血浆浓度是统计上显著差异的(Wilcoxon符号秩检验,P-值=0.002)(图 14A)。
已经进一步证实了,抗消化的标志物18A序列的血浆浓度与ZFY 基因的血浆浓度显著相关,所述ZFY基因是已建立的分娩前胎儿遗传 标志物(n=13,r=0.91;P-值<0.00001;Spearman相关性)(图14B)。 这些结果提示了,母体血浆中的抗消化的标志物18A序列源自胎儿。 EGG染色体-剂量分析
胎盘DNA样品中的标志物18A与ZFY的比率
用标志物18A和ZFY的双链体数字PCR测定分析来自怀有男性 胎儿的首三月胎盘DNA样品(T18的为5个,整倍体的为5个)。整倍 体和T18样品中标志物18A与ZFY的比率为显著差异的(曼-惠特尼秩 和检验,P-值=0.023)。限定为标志物18A与ZFY的平均比率±1.96SD 的整倍体样品的正常参照范围为1.20-1.66。全部的T18病例都具有 比参照上限高的比率(图15)。
母体血浆样品中的标志物18A与ZFY的比率
为了证明此方法是非侵入性地检测母体血浆中的T18的可行方 法,本发明人分析了从怀有整倍体男性胎儿的孕妇获得的27个母体血 浆样品和从怀有T18男性胎儿的孕妇获得的9个母体血浆样品。在该 27个整倍体病例中,分别从首三月、中三月和末三月获得了18个、4 个和9个病例。从首三月获得了全部T18病例。整倍体和T18组的中 值妊娠期分别为14.1和13.3。正常参照范围为0.34-3.04(图16)。基 于此参照范围,27个整倍体病例中有26和9个T18中有8个被正常 分类,得到的灵敏度为88.9%,特异性为96.3%。
β-肌动蛋白作为消化对照
通过用β-肌动蛋白测定分析经酶消化的母体血浆样品,评估酶消 化效率,所述β-肌动蛋白测定靶向胎盘和母体血细胞中完全非甲基化 的、同时含有类似的MSRE限制性位点作为标志物18A扩增子的区域 (图17)。在全部的经消化的血浆样品中都无法检测到β-肌动蛋白序列。
III.结论
此实施例示例了,使用高甲基化标志物18A作为染色体18上的 胎儿表观遗传标志物和使用ZFY作为Y染色体上的胎儿遗传标志物, 可以应用该EGG方法以从母体血浆获得胎儿染色体18的相对剂量。 还已经证明了,通过用该EGG方法比较整倍体和T18母体血浆样品 中的该相对染色体剂量,18三体的非侵入性产前检测是可行的。使用 此EGG方法进行18三体的非侵入性产前检测,可以通过代替Y-特异 性胎儿遗传标志物(其在此实施例中用作示例)与其它胎儿遗传标志物 (例如参照染色体上父系遗传的SNP)一起,覆盖一般群体中的更多胎 儿,从而特异性地测量母体血浆中的胎儿参照染色体的剂量。
实施例4:用于检测胎儿13三体的表观遗传-遗传染色体剂量方法
此实施例证明了表观遗传-遗传(EGG)染色体剂量方法用于检测胎 儿13三体(T13)的应用。此EGG方法涉及分别位于染色体13上的胎 儿表观遗传标志物和位于参照染色体上的胎儿遗传标志物。胎儿表观 遗传标志物优选为标志物13A[基因组位置chr13:105941431- 105941818,根据人类基因组2006年3月汇编(hg18)定义]。其为位于 基因EFNB2(ephrin-B2)的3’末端处的188-bp区域,通过甲基化DNA 免疫沉淀和覆瓦式阵列分析(描述于USSN 61/308,578)进行鉴定。然 而,此胎儿表观遗传标志物还可以是位于上述基因座(即chr13: 105941431-105941818)上游或下游100kb内的任何含有胞嘧啶的DNA 基因组区域。此外,此胎儿表观遗传标志物还可以是具有区分母体血 浆中胎儿和母体染色体13的不同表观遗传标志(DNA甲基化水平)的 任何含有胞嘧啶的DNA基因组区域。
母体血浆中的胎儿遗传标志物优选为位于Y染色体上的锌指Y连 锁(ZFY)基因中的区域。然而,此胎儿遗传标志物还可以是胎儿和其母 亲之间的任何遗传差异,包括单核苷酸多态性(SNP)和插入/缺失(indel) 多态性。
材料和方法
样品收集
从就诊于香港威尔士亲王医院妇产科或英国伦敦国王学院医院哈 里斯胎儿医学研究中心的妇女获得样品。招募的全部孕妇都经知情同 意。相应的机构审查委员会批准了该研究。
在首三月和中三月中的常规产前诊断阶段期间收集绒毛膜样品 (CVS)。通过完全染色体核型分型确认了每个整倍体和T 13病例的染 色体状态。从全部的个体收集母体外周血样品(在EDTA管中的12 mL)。收集来自英国的CVS,冷冻保存然后于干冰上分批送往香港。
在此研究中,招募了5个T13病例(4个来自首三月,1个来自中 三月)和10个整倍体病例(全部来自首三月)。
样品处理
通过如前描述的双离心操作程序处理母体外周血样品(Chiu等人, Clin Chem 2001;47:1607-13)。以2,500g离心血细胞部分,然后去除任 何残余的血浆。用QIAamp DNA Blood Mini Kit(Qiagen)的血液和体液 操作程序提取来自外周血细胞的DNA。
用QIAamp DNA Mini Kit(Qiagen)、根据制造商的组织操作程序 提取来自CVS和胎盘的DNA。
胎盘和母体血细胞中标志物13A甲基化状态的分析
通过克隆和亚硫酸盐测序进行的DNA甲基化分析
通过克隆和亚硫酸盐测序,在6对胎盘组织和母体血细胞中分析 标志物13A的甲基化状态。使用EZ DNA Methylation Kit (ZymoResearch)、根据制造商的说明书,对提取的DNA进行亚硫酸氢 盐转化。用靶向标志物13A区域的正向引物′5-aggaagagagGGAGG ATAGGAGGAGGGAGTTATAGT-3′和反向引物′5-cagtaatacgactcac tatagggagaaggctAAAATTACACACAATACACACCAAAAAAT,使经亚 硫酸氢盐转化的DNA进行PCR扩增。将此组引物设计为用Epityper 测定进行分析,但其还可应用于经亚硫酸氢盐转化的DNA的PCR扩 增以进行亚硫酸盐测序分析。PCT条件概述于表13A。之后用pGEM T-Easy Clone Kit(Promega)、根据制造商的说明书将PCR产物TA克 隆到质粒载体中。用大肠杆菌菌株JM109(Promega)进行克隆。然后使 用T7和SP6启动子引物(Promega)、根据制造商的说明书,扩增来自 克隆的插入片段(反应条件概述于表13A中的小标题“菌落PCR测定” 下)。然后用BigDye Terminator Cycle Sequencing v1.1试剂盒(Applied Biosystems)、根据制造商的说明书使PCR产物进行测序反应(反应条 件概述于表13A中的小标题“菌落PCR测定”下)。然后用乙醇沉淀 DNA,重悬于10μL的Hi-Di甲酰胺,并在3100DNA Analyzer(Applied Biosystems)上测序。使用SeqScape v2.5软件(Applied Biosystems)分析 测序数据。通过检验非CpG胞嘧啶残基处的转化率,本发明人确保了 每个克隆的>99%亚硫酸氢盐转化。
通过将每个样品(我们实验中为8个)的甲基化克隆数除以克隆总 数计算每个CpG位点处的MI。对于每个CpG位点,计算两个生物学 重复的平均MI。通过将每个样品中的甲基化克隆数除以标度的克隆总 数得到甲基化位点频率。
在T13和整倍体胎盘中标志物13A甲基化状态的分析
通过Epityper测定进行的DNA甲基化分析
用标准MassCLEAVE操作程序(Sequenom)(Ehrich等人Proc Natl Acad Sci USA2005;102:15785-90)(涉及于操作程序中的各反应条件 的细节概述于表13B)进行Epityper测定。简而言之,用靶向标志物 13A区域的正向引物′5-aggaagagagGGAGGATAGGAGGAGGGAG TTATAG T-3′和反向引物′5-cagtaatacgactcactatagggagaaggctAAAA TTACACACAATACACACCAAAAAAT-3′,使经亚硫酸氢盐转化的 DNA进行PCR扩增。在此组引物中,将T7启动子标签加入到反向引 物的3′末端,将10个碱基的标签加入到引物的5′末端,以使正向和反 向引物之间的解链温度相等。用EZ DNA Methylation Kit (ZymoResearch)、根据制造商的说明书,使提取的DNA进行亚硫酸氢 盐转化,并用PCR扩增。然后使用T7DNA聚合酶和T7RNA聚合酶, 将PCR产物体外转录为RNA,并用RNase A在具有A-或G-残基的碱 基处进行特异性地切割。该切割反应产生了含有CpG的片段或CpG 单元,其大小将取决于CpG位点的甲基化状态(即,在亚硫酸氢盐转 变后,对于甲基化和非甲基化CpG分别为CpG或TpG)。然后纯化产 物,用基质辅助的激光解吸/电离飞行时间(MALDI-T0F)质谱 (MassARRAY Analyzer Compact)解析。通过将甲基化产物的峰高除以 甲基化和非甲基化产物二者的峰高总和计算每个CpG单元的甲基化 指数(MI)。
EGG染色体剂量分析
本发明人采用该EGG方法比较了从整倍体和T13妊娠获得的胎 盘组织(CVS)中染色体13上的胎儿表观遗传标志物即标志物18A和Y 染色体上的胎儿遗传标志物即ZFY的相对剂量。
甲基化敏感的限制性核酸内切酶(MSRE)消化
使用三种类型的MSRE即AccI、NlaIV和HpaII(酶, Fermentas Life Sciences)消化胎盘DNA。对于每个样品,将50ng的胎 盘DNA与各2FDU的上述酶在37℃下、在1XBuffer 中一起孵育2小时,然后在65℃下酶灭活20分钟。
用于数字PCR分析的测定设计和反应条件
开发了2个单链体数字PCR测定以分别扩增抗消化的标志物13A 和ZFY。之前已描述了数字PCR分析的基础(Lo等人Proc Natl Acad Sci USA2007;104:13116-21;Tong等人Clin Chem 2010;56:90-8)。
每孔的反应体积为5μL,其终浓度为1xUniversal PCR Master Mix(Applied Biosystems)和每个靶标的相应引物和探针浓度。 对于标志物13A,反应包括250nM探针(Integrated DNA Technologies)和900nM的每种正向和反向引物(Integrated DNA Technologies)。对于ZFY,反应包括100nM探针和300nM 的每种正向和反向引物(Integrated DNA Technologies)。用报告分子 FAM标记标志物13A的探针,而用报告分子FAM标记ZFY的探针(表 14)。每个靶标的数字PCR反应的总数为192。
在7900HT Sequence Detection System(Applied Biosystems)上进行 实验。反应在50℃下开始进行2分钟,在95℃下继续进行10分钟, 对于标志物13A然后是55个循环,每个循环为95℃进行15秒和60 ℃进行1分钟;对于ZFY然后是45个循环,每个循环为95℃进行 15秒和60℃进行1分钟。通过SDS 2.3软件的“绝对定量”应用(Applied Biosystems)收集荧光数据。
统计分析
用SigmaStat 3.0软件(SPSS)进行统计分析。
II.结果
标志物13A是潜在的胎儿表观遗传标志物
之前的研究已显示,在胎盘和母体血细胞之间为差别甲基化的基 因组区域具有被开发为母体血浆中的胎儿表观遗传标志物的潜力 (Chim等人Clin Chem 2008;54:500-11;Tong等人Clin Chem 2010; 56:90-8)。克隆和亚硫酸盐测序结果揭示了,标志物13A在整倍体胎 盘(n=6)中主要为甲基化的,而在母体血细胞中基本上为非甲基化(n= 6)(图18)。胎盘和母体血细胞中的平均甲基化指数分别为0.78和0.00。
本发明人已通过Epityper研究了标志物13A在整倍体(n=5)和 T18(n=5)胎盘中的甲基化水平。进行了曼-惠特尼秩和检验,以比较 在每个CpG单元处5个整倍体胎盘与5个T13胎盘的MI(图19)。合 理地认为,如果标志物13A的甲基化水平不在整倍体和T18胎盘之间 显著改变,则其可以用于比较整倍体和T18胎儿组织或母体血浆中的 胎儿染色体13的剂量。发现在标志物13A的靶区域中,3个CpG单 元都不在整倍体和T13胎盘之间具有显著的差别甲基化(图19)。因此, 通过靶向这3个CpG单元,本发明人设计了其后续的数字PCR测定。
使用胎盘DNA样品的EGG染色体-剂量分析
用标志物13A和ZFY的单链体数字PCR测定分析来自怀有男性 胎儿的妊娠的胎盘DNA样品(T13的为5个,整倍体的为10个)。整 倍体和T13样品中标志物13A与ZFY的比率为显著差异的(曼-惠特尼 秩和检验,P-值=0.023)。限定为标志物13A与ZFY的平均比率± 1.96SD的整倍体样品的正常参照范围为1.40-2.10。除一个以外,全 部T13病例都具有比参照上限大的比率(图20)。
III.结论
此实施例示例了,使用高甲基化标志物13A作为染色体13上的 胎儿表观遗传标志物和使用ZFY作为Y染色体上的胎儿遗传标志物, 可以应用该EGG方法以在首三月和中三月期间获得的胎盘组织中获 得胎儿染色体13的剂量。通过比较整倍体和T13胎盘组织中的该相 对染色体剂量,检测13三体是可行的。此方法具有应用于以非侵入性 方式获得母体血浆中胎儿染色体13的相对染色体剂量和检测13三体 的潜力。
出于各种目的,本申请中引用的全部专利、专利申请、和其它公 开文件(包括GenBank登记号)都通过引用全文并入。
序列表
SEQ ID NO:1rs6636的dbSNP(获自网站ncbi.nlm.nih.gov/snp)
GAAGATTTTC CAAACTACTT TATGTCATTT AGCTTCTATT TTCTGAAGGG CTTTCTTTGG
TGCCATGTAC TCAGATCAGT CAGTTGACTG AAAGATGATC ATGTTTTCTT CGTAAAGATT
TAAGCAATTG GCAACTACAA AGACATTATT TTCTTACTGT TCTATATCAT GTACTGTTGC
TGACATTACA AAAAGGGTCT GGAAGGGAAA CCGTGTCACT GTTTTATCTT TTTTCTTTAA
AATACAAAAG TATCCCAACT AATCATTTAT TATGGTCAGC TTGTTTTACA TGTCCCCTAT
[C/G]
ATGAGAAATG CTATCAACAT CTGTGATTTC TAAGAGTCTT ACCAAATTGT TACTTTAATT
CTTGTGTCCT GCTGAGTGGT TTTTCTTTTA AAATACCATT TTTATCACCC TGTGGCACTG
GGTGTGTTAC TGCGATTACA CTGATGATTC TGAGCTGTGC TTCTTCAAGT AGCTCAGTTC
TTGCGTTTTA TATTAGGTAA CAGTTTTGTG ATGCTTTTGT GCATTCTTTG TCATCTCTTC
TGAGTTTTCG AATCTGTCAT AAATAAACTT TTTCACTATG CACCTGGTAA CATCTGAGTT
SEQ ID NO:2包括SNP rs6636上游和下游100bp的DNA序列(获自网 站genome.ucsc.edu/cgi-bin/hgGateway)
GGAAGGGAAACCGTGTCACTGTTTTATCTTTTTTCTTTAAAATACAAAAG
TATCCCAACTAATCATTTATTATGGTCAGCTTGTTTTACATGTCCCCTAT
[C/G]
ATGAGAAATGCTATCAACATCTGTGATTTCTAAGAGTCTTACCAAATTGT
TACTTTAATTCTTGTGTCCTGCTGAGTGGTTTTTCTTTTAAAATACCATT
表1.用于常规实时PCR和数字PCR测定的寡核苷酸序列和特异性
PCT条件
aFAM=6-羧基荧光素,TAMRA=6-羧基四甲基罗丹明。
bMGB=小沟结合。
cVIC=Applied Biosystems专有染料。
表3A.经模拟和BstUI消化的DNA样品中HLCS、RASSF1A、ZFY和 ZFX的检测
使用文中公式对拷贝数进行泊松分布的校正。
表3B.未处理的和经BstUI消化的DNA样品中HLCS和RASSF1A的 检测
使用文中公式对拷贝数进行泊松分布的校正。
表4.用于数字PCR分析的样品的信息。(A)胎盘组织样品,(B)母体 血浆样品。
(A)
(B)
示出了每个基因座的拷贝数以及HLCS与RASSF1A和HLCS与ZFY的 比率。使用文中公式对拷贝数进行泊松分布的校正。
表5.用于HLCS、TMED8-C/G SNP和β-肌动蛋白测定的寡核苷酸序 列。
aFAM=6-羧基荧光素、MGB=小沟结合。
bVIC=Applied专有染料。
表6.(A)经模拟消化的胎盘DNA和(B)经BstUI消化的胎盘DNA样品 中HLCS与TMED8-C等位基因的比率。1T,首三月;2T,中三月; 3T:末三月。
(A)
(B)
表7.(A)经模拟消化的胎盘DNA和(B)经BstUI消化的胎盘DNA样品 中HLCS与TMED8-G等位基因的比率。1T,首三月;2T,中三月; 3T,末三月。
(A)
(B)
表8.通过β-肌动蛋白实时qPCR分析评估的消化效率。(A)用于HLCS 与TMED8-C的比率分析的样品。(B)用于HLCS与TMED8-G的比率 分析的样品。1T,首三月;2T,中三月;3T,末三月。
(A)
(B)
表9.TMED8-C/G SNP测定的特异性。在样品数目后示出了胎盘的基 因型。对拷贝数进行泊松分布的校正。(A)HLCS和TMED8-C双链体 测定。(B)HLCS和TMED8-G双链体测定。
(A)
(B)
表13A.用于亚硫酸盐测序分析的反应条件。
表13B.用于Epityper分析的反应条件。
表14.分别用于标志物13A和ZFY数字PCR测定的寡核苷酸序列。
注:FAM为6-羧基荧光素,VIC为Applied专用染料, BHQ1为Black-hole淬灭基团1,MGB为小沟结合。