技术领域
本发明涉及与高血压和/或心血管疾病发病风险相关的多个单核苷酸多态性位点及 相关应用,具体涉及检测多个单核苷酸多态性位点的试剂在制备用于预测高血压和/或心 血管疾病发病风险的检测制剂或检测装置中的应用,还涉及一种用于预测高血压和/或心 血管疾病发病风险的检测装置,通过影响亚洲人群血压变异相关的22个单核苷酸多态 性位点检测预测高血压和心血管疾病发病风险。
背景技术
心血管疾病是全球人类健康的首要疾病负担。我国心血管病的发病率和死亡率呈快 速上升趋势。据估计,我国心血管疾病现患病人数至少2.3亿,每年约350万人死于心 血管病。高血压是最常见的心血管疾病之一,也是心血管病的主要危险因素。2013年中 国心血管病报告显示,约70%的脑卒中和50%的心肌梗死的发生与血压升高有关,至少 一半的心血管病死亡与高血压有关。根据历次全国性大规模高血压患病率调查,从上世 纪五六十年代到2007-2009年,高血压患病率已由5.1%上升到26.6%,上升趋势明显, 已成为我国重要疾病负担。因此,高血压的防治已经成为预防心血管疾病、保障国民健 康的重要需求。
高血压和心血管疾病是复杂疾病,由多个微效基因与环境因素长期相互作用所致。 鉴定出与高血压和/或血压升高相关的易感基因和/或致病基因,在人群中筛选增加疾病 风险的易感基因确定易感个体,将有助于高血压和心血管疾病事件(冠心病和脑卒中) 的发病风险预测、新药开发、诊断和个体化治疗。
遗传风险评分(genetic risk score,GRS)是基于遗传易感基因建立个体患病风险的 预测评分模型,在个体水平利用个体遗传风险评分结合传统危险因素进行模型预测是识 别高血压和心血管疾病发病高危人群的有效方法。早期识别高危人群,采取针对性的生 活方式干预,能够有效地减少高血压及心血管疾病的发生,遏制医疗费用增长、延长国 民期望寿命。
发明内容
本发明的一个目的在于提供一种通过多个单核苷酸多态性检测预测高血压和/或心 血管疾病发病风险的方法。
本发明的另一目的在于提供检测多个单核苷酸多态性位点的试剂在制备用于预测 高血压和/或心血管疾病发病风险的检测制剂或检测装置中的应用。
本发明的另一目的在于提供一种用于预测高血压和/或心血管疾病发病风险的检测 装置。
本发明中,通过整合影响亚洲人群血压变异相关的多个单核苷酸多态性位点,在大 量样本的研究对象中进行基因分型,并对研究对象进行多年的随访研究,计算遗传风险 评分(GRS)。在传统危险因素的模型中,加入遗传风险评分,提高对高血压和心血管 事件风险的预测能力。
根据本发明的具体实施方案,所述亚洲人群血压变异的相关的多个单核苷酸多态 性位点包括以下22个单核苷酸多态性位点:CASZ1区域rs880315、MOV10区域的 rs10745332和rs17030613、FIGN区域rs16849225、SLC4A7区域rs820430、ULK4区域 rs9815354、CACNA1D区域rs9810888、FGF5区域rs1902859、ENPEP区域rs6825911、 GUCY1A3区域rs13143871、NPR3区域rs1173766、HFE区域rs1799945、HLA-B区域 rs9266359、CYP21A2区域rs2021783、CYP17A1区域rs4409766、SOX6区域rs4757391、 ATP2B1区域rs17249754、ALDH2区域rs11066280、TBX3-TBX5区域rs1991391、TBX3 区域rs35444、MED13L区域rs11067763和JAG1区域rs1887320。通过检测这些单核苷 酸多态性位点,可以预测高血压和/或心血管疾病发病风险。
从而,一方面,本发明提供了检测多个单核苷酸多态性位点的试剂在制备用于预 测高血压和/或心血管疾病发病风险的检测制剂或检测装置中的应用,其中,所述多个单 核苷酸多态性位点包括以下22个单核苷酸多态性位点:
CASZ1区域rs880315、MOV10区域的rs10745332和rs17030613、FIGN区域 rs16849225、SLC4A7区域rs820430、ULK4区域rs9815354、CACNA1D区域rs9810888、 FGF5区域rs1902859、ENPEP区域rs6825911、GUCY1A3区域rs13143871、NPR3区 域rs1173766、HFE区域rs1799945、HLA-B区域rs9266359、CYP21A2区域rs2021783、 CYP17A1区域rs4409766、SOX6区域rs4757391、ATP2B1区域rs17249754、ALDH2 区域rs11066280、TBX3-TBX5区域rs1991391、TBX3区域rs35444、MED13L区域 rs11067763和JAG1区域rs1887320。
在本发明的大量实验结果基础上,本发明的进一步研究发现,这些SNPs的危险等 位基因分别是:rs880315多态性位点为C;rs17030613多态性位点为C;rs10745332多 态性位点为A;rs16849225多态性位点为C;rs820430多态性位点为A;rs9815354多态 性位点为A;rs9810888多态性位点为G;rs1902859多态性位点为C;rs6825911多态性 位点为C;rs13143871多态性位点为T;rs1173766多态性位点为C;rs1799945多态性 位点为G;rs9266359多态性位点为C;rs2021783多态性位点为C;rs4409766多态性位 点为T;rs4757391多态性位点为C;rs17249754多态性位点为G;s11066280多态性位 点为T;rs1991391多态性位点为G;rs35444多态性位点为A;rs11067763多态性位点 为A;rs1887320多态性位点为A。
可用本领域中任何的可行技术在DNA水平、RNA水平检测本发明所述的多个单核 苷酸多态性位点。例如:可以采用直接测序的方法,通过DNA直接测序可以直接揭示 对照基因和携带突变基因之间的序列差异,具体可以是传统的使用商业测序试剂盒或自 动测序仪对DNA直接进行测序,或是近年来发展的焦磷酸测序(Pyrosequencing)、微 测序(SNaPshot)等。也可以采用基于杂交的方法,具体包括Taqman探针法,DNA芯 片法等。还可以采用基于引物延伸的方法,如基质辅助激光解析离子飞行时间质谱 (MALDI-Tof-MS)。还可以采用基于构象的方法,具体例如限制性片段长度多态性 (RFLP)分析、单链构象多态性(single-strand conformational polymorphism,SSCP) 分析、变性梯度凝胶电泳(denaturing gradient gel electrophoresis,DGGE)分析、变性 高效液相色谱技术(denaturing high performance liquid chromatography,dHPLC)等分析 技术。还可以采用高分辨率溶解曲线分析技术(HRM)。在具体实施时,本领域的技术 人员可以根据实际情况选择上述的任一种技术体外检测本发明所述多个单核苷酸多态 性位点,也可以采用多种技术的组合来体外检测所述多个单核苷酸多态性位点。本发明 中所述的检测多个单核苷酸多态性位点的试剂可以是这些任何可行的检测所述多个单 核苷酸多态性位点的技术中所用到的试剂材料和/或仪器设备等。在本发明的一个具体实 施方式中,应用的是iPLEX Sequenom MassARRAY分型系统对所述多个单核苷酸多态 性位点进行检测,其中将PCR扩增后的延伸产物用MassARRAY Nanodispenser RS1000 点样仪(Sequenom)移至SpectroCHIP(Sequenom)芯片上,使用MALDI-TOP (matrix-assisted laser desorption/ionization–time of fligh,基质辅助飞行时间质谱)分析, 并使用TYPER 4.0软件(Sequnom)分型并输出结果。
根据本发明的具体实施方案,所述的待测个体可以为亚洲人群,优选为中国汉族人 群。具体检测时,待测样品可来自待测个体的血液、尿、唾液、胃液、头发或活组织检 查。
在本发明的具体实施方案中,本发明在中国汉族人群中选取26262例正常人群研究 对象,平均随访观察6.9年,采集空腹血并收集性别、年龄、血压水平、血脂水平、身 高、体重、吸烟、饮酒和疾病史等相关信息。应用iPLEX Sequenom MassARRAY分型 系统,对22个血压相关单核苷酸多态性(SNP)位点进行基因分型实验(CASZ1区域 rs880315、MOV10区域的rs10745332和rs17030613、FIGN区域rs16849225、SLC4A7 区域rs820430、ULK4区域rs9815354、CACNA1D区域rs9810888、FGF5区域rs1902859、 ENPEP区域rs6825911、GUCY1A3区域rs13143871、NPR3区域rs1173766、HFE区 域rs1799945、HLA-B区域rs9266359、CYP21A2区域rs2021783、CYP17A1区域 rs4409766、SOX6区域rs4757391、ATP2B1区域rs17249754、ALDH2区域rs11066280、 TBX3-TBX5区域rs1991391、TBX3区域rs35444、MED13L区域rs11067763和JAG1 区域rs1887320)。使用logistic和cox回归分析评估每个SNP位点与年平均血压增加、 高血压发病以及心血管病事件发生(冠心病和脑卒中)的关系,计算危险等位基因的效 应值(β)、相对危险度(Odds ratio,OR)或风险比(Hazard ratio,HR)。综合每个个体 携带22个SNP位点的危险等位基因情况,对每个研究对象进行遗传风险评分,评分方 法是利用前期血压全基因组研究获得的风险等位基因效应值(β)。将研究对象携带危 险等位基因的数目与危险等位基因效应值(β)相乘获得每个SNP位点遗传效应。然后 对22个SNP的遗传效应求和得到该研究对象的遗传风险评分(GRS),计算公式:遗 传风险评分(GRS)=∑βi×Ni,其中βi指第i个SNP的收缩压和舒张压效应值的平均 值,Ni指研究对象所携带第i个SNP的危险等位基因数目。将遗传风险评分作为连续型 变量,计算遗传风险评分的标准差(SD)。同时,根据所有研究对象遗传风险评分将研 究对象等分为5组。分别为第1组7.765~13.465(G1)、第2组13.466~14.616(G2)、 第3组14.617~15.545(G3)、第4组15.545~16.654(G4)和第5组16.655~22.125 (G5)。与遗传风险评分最低的1组相比,计算其他各组发病风险的高低。结果显示遗 传风险评分是血压升高、高血压以及心血管事件发生的独立危险因素。
在本发明的具体实施方案中,本发明进一步建立了高血压和心血管疾病的发病风险 预测模型。高血压预测模型中包括基因型信息(遗传风险评分分组)和传统危险因素包 括性别、年龄、体重指数、吸烟、饮酒、脉搏、收缩压和舒张压。心血管疾病发病风险 预测模型中包括基因型信息(遗传风险评分分组)和传统危险因素包括性别、年龄、体 重指数,吸烟、饮酒状况、糖尿病、总胆固醇、高密度脂蛋白胆固醇、心血管疾病家族 史、收缩压和服用降压药情况。综合上述遗传和环境因素建立高血压和心血管疾病发病 风险预测模型:
高血压发病风险=1/(1+exp(-Z))。Z=-14.808+0.142×G2+0.193×G3+0.265×G4+ 0.339×G5+0.165×性别+0.034×年龄+0.063×体重指数+(-0.013)×是否吸烟+0.159×是否饮 酒+0.01×脉搏+0.061×收缩压+0.04×舒张压。其中,性别:男=1,女=0;是否吸烟:吸烟 =1,不吸烟=0;是否饮酒:饮酒=1,不饮酒=0;脉搏项:次/分;收缩压:mmHg;舒 张压:mmHg。
心血管疾病发病风险=1/(1+exp(-Z))。Z=-8.558+0.126×G2+0.159×G3+0.297×G4 +0.256×G5+(-0.273)×性别+0.056×年龄+0.035×体重指数+0.19×是否吸烟+ (-0.475)×是否饮酒+0.358×有无糖尿病+0.006×总胆固醇+(-0.028)×高密度脂蛋 白胆固醇+0.643×是否有心血管疾病家族史+0.015×收缩压+0.309×是否服用降压 药。其中,性别:男=1,女=0;是否吸烟:吸烟=1,不吸烟=0;是否饮酒:饮酒=1, 不饮酒=0;有无糖尿病:有=1,无=0;总胆固醇:mg/dl;高密度脂蛋白胆固醇:mg/dl; 是否有心血管病家族史:有=1,无=0;收缩压:mmHg;是否服用降压药:是=1,否=0。
上述模型中,G2、G3、G4、G5为前述根据研究对象遗传风险评分的分组,第1组 7.765~13.465(G1)、第2组13.466~14.616(G2)、第3组14.617~15.545(G3)、 第4组15.545~16.654(G4)和第5组16.655~22.125(G5)。当待测个体遗传风险评 分落入G2、G3、G4、G5任一组时,其相应的组别G值为1,其余取值为0。例如,当 待测个体遗传风险评分落入G2组,G2取值为1,G3、G4、G5均取值0(当待测个体 遗传危险因素评分落入G1组,G2、G3、G4、G5均取值0)。
在本发明的具体实施方案中,本发明将遗传风险评分分组和环境因素暴露信息放入 风险预测模型计算出每名研究对象的高血压和心血管疾病的发病风险。采用作受试者工 作特征曲线(ROC)和模型拟合曲线(Calibration)评估高血压和心血管疾病发生风险 预测模型。根据ROC曲线下面积评价该预测方法的价值。结果显示,高血压和心血管 疾病发生的ROC下面积为分别为0.776和0.813,表明该模型预测性能良好,可以很好 的识别高危人群。模型拟合曲线显示高血压和心血管事件发生风险的预测值和观察值无 显著差异,P值分别为0.882和0.24,模型拟合良好。
从而,另一方面,本发明还提供了一种用于预测高血压和/或心血管疾病发病风险 的检测装置,该检测装置包括检测单元以及数据分析单元;
所述检测单元包括用于检测待测个体携带多个单核苷酸多态性位点的危险等位基 因情况的检测单元(可包括检测所用的试剂材料和/或仪器设备等),获得检测结果;其 中,所述多个单核苷酸多态性位点包括以下22个单核苷酸多态性位点:CASZ1区域 rs880315、MOV10区域的rs10745332和rs17030613、FIGN区域rs16849225、SLC4A7 区域rs820430、ULK4区域rs9815354、CACNA1D区域rs9810888、FGF5区域rs1902859、 ENPEP区域rs6825911、GUCY1A3区域rs13143871、NPR3区域rs1173766、HFE区 域rs1799945、HLA-B区域rs9266359、CYP21A2区域rs2021783、CYP17A1区域 rs4409766、SOX6区域rs4757391、ATP2B1区域rs17249754、ALDH2区域rs11066280、 TBX3-TBX5区域rs1991391、TBX3区域rs35444、MED13L区域rs11067763和JAG1 区域rs1887320;
所述数据分析单元包括用于对检测单元的检测结果进行分析处理的处理单元,获 得遗传风险评分;其中,遗传风险评分的高低与待测个体患高血压和/或心血管疾病发病 风险的高低成正相关。
根据本发明的具体实施方案,本发明的用于预测高血压和/或心血管疾病发病风险 的检测装置,其中:
所述检测单元还包括用于检测待测个体传统危险因素的检测单元(包括检测用的 试剂材料和/或仪器设备等);其中,高血压相关传统危险因素包括性别、年龄、体重指 数、吸烟、饮酒、脉搏、收缩压和舒张压;心血管疾病相关传统危险因素包括性别、年 龄、体重指数,吸烟、饮酒状况、糖尿病、总胆固醇、高密度脂蛋白胆固醇、心血管疾 病家族史、收缩压和服用降压药情况;
所述数据分析单元还包括用于对检测单元的传统危险因素检测结果进行分析处理 的处理单元,获得综合遗传风险评分和传统危险因素的高血压和/或心血管疾病发病风险 预测评分。
本发明所述的用于预测高血压和/或心血管疾病发病风险的检测装置,可以是虚拟 装置,只要能实现所述检测单元以及数据分析单元的功能即可。所述的检测单元可以是 包括各种检测试剂材料和/或检测仪器设备等;所述的数据分析单元可以是任何可以实现 对检测单元的检测结果进行分析处理而得出待测个体遗传风险评分(或综合遗传风险评 分与传统危险因素的结果)的运算仪器、模块或是虚拟设备,例如可以是预先按照上述 遗传风险评分公式而制定的数据图表,将检测单元的检测结果对照该数据图表即能得出 遗传风险评分数值。
根据本发明的具体实施方案,本发明的用于预测高血压和/或心血管疾病发病风险 的检测装置,其中,所述综合遗传风险评分和传统危险因素的高血压和/或心血管疾病发 病风险预测评分符合按照以下模型计算得到的数值:
高血压发病风险预测模型:
高血压发病风险=1/(1+exp(-Z))。Z=-14.808+0.142×G2+0.193×G3+0.265×G4+ 0.339×G5+0.165×性别+0.034×年龄+0.063×体重指数+(-0.013)×是否吸烟+0.159×是否饮 酒+0.01×脉搏+0.061×收缩压+0.04×舒张压。其中,性别:男=1,女=0;是否吸烟:吸烟 =1,不吸烟=0;是否饮酒:饮酒=1,不饮酒=0;脉搏:次/分;收缩压:mmHg;舒张 压:mmHg。
心血管疾病发病风险预测模型:
心血管疾病发病风险=1/(1+exp(-Z))。Z=-8.558+0.126×G2+0.159×G3+0.297×G4 +0.256×G5+(-0.273)×性别+0.056×年龄+0.035×体重指数+0.19×是否吸烟+ (-0.475)×是否饮酒+0.358×有无糖尿病+0.006×总胆固醇+(-0.028)×高密度脂蛋 白胆固醇+0.643×是否有心血管疾病家族史+0.015×收缩压+0.309×是否服用降压 药。其中,性别:男=1,女=0;是否吸烟:吸烟=1,不吸烟=0;是否饮酒:饮酒=1, 不饮酒=0;有无糖尿病:有=1,无=0;总胆固醇:mg/dl;高密度脂蛋白胆固醇:mg/dl; 是否有心血管病家族史:有=1,无=0;收缩压:mmHg;是否服用降压药:是=1,否=0。
上述模型中G2、G3、G4、G5取值参照前述。
应用本发明的技术,根据模型计算获得该研究对象高血压和/或心血管事件发生的 风险,可以判断该研究对象是否为高危人群。完成个体化健康指导报告,报告高血压和 心血管疾病事件发生风险的高低。个体化健康指导报告是在基因型结果的基础上,结合 生活方式危险因素评估研究对象高血压和心血管疾病事件发生的风险,并制定出针对研 究对象的个体化健康行动方案。可见,本发明的技术在高血压和/或心血管疾病的预测和 预防中有重要的应用前景。
附图说明
图1-图9:rs4757391、rs9810888、rs1902859、rs4409766、rs10745332、rs17249754、 rs 880315、rs 9815354和rs11066280基因分型结果散点图(各2块384板)。
图10:遗传风险评分分组和环境因素暴露信息预测高血压和心血管病发病风险的 ROC曲线。
图11:遗传风险评分分组和环境因素暴露信息预测高血压和心血管病发病风险的模 型拟合曲线。
图12:血压相关位点危险等位基因遗传效应速查图表。
图13:遗传风险评分速查图表。
具体实施方式
为了更清楚地理解本发明,现参照下列实施例及附图进一步描述本发明。实施例仅 用于解释而不以任何方式限制本发明。实施例中未注明具体条件的实验方法为所属领域 熟知的常规方法和常规条件,或按照制造商所建议的条件。
实施例一、高血压和心血管疾病的发病风险预测模型的建立
一、病例对照样本入选标准
首先在中国汉族人群中选取正常人群研究对象,研究对象来自中国心血管病多中心 协作研究(InterAsia in China)和中国心血管健康研究多个北方研究中心,研究方案经 各调查中心当地研究机构伦理委员会批准,所有参加者都签署了知情同意书。中国心血 管病多中心协作研究于2000-2001年开始,2008年进行了随访。中国心血管健康研究是 2006-2007年开始调查,2013-2014年进行了随访。平均随访观察6.9年,采集空腹血并 收集性别、年龄、血压水平、血脂水平、身高、体重、吸烟、饮酒和疾病史等相关信息。
血压测量方法:研究对象血压由培训合格的调查员根据美国心脏病学会推荐血压测 量标准测量三次。血压测量前静坐5分钟;并且血压测量前30分钟内避免饮酒、吸烟、 饮用咖啡或茶饮料和体力活动。对于服用降压药物的患者,血压分别按收缩压、舒张压 测量者各增加10和5mmHg计算。高血压定义为:收缩压≥140mm Hg和/或舒张压DBP ≥90mm Hg或自我报告以治疗高血压为目的服用降压药。正常血压定义为不服用任何 降压药,且收缩压<140mm Hg同时舒张压<90mm Hg。
吸烟定义为:一生中吸烟支数是否超过100支(是1/否0)。
饮酒定义为:过去一年研究是否超过12次(是1/否0)。
糖尿病定义为:医院临床诊断(有1/无0)。
体重指数(BMI)计算公式:体重指数(kg/m2)=体重(kg)/身高(m)2
随访阶段:心血管终点事件定义为发生心肌梗死、心绞痛、血运重建、卒中以及死 亡归因为冠状动脉疾病和卒中。随访内容包括跟踪调查对象及其监护人当前居住地进行 入户调查以确定疾病状态等重要信息。如果调查对象报告在随访期间有住院或者急诊留 观,经过培训的调查员使用标准调查表,通过问卷提取其病史、体检结果、实验室检查 结果和出院诊断等信息。所有随访期间的死亡报告都通过从当地卫生部门或公安机关获 得死亡证明进行核实。由中国医学科学院(北京)的心脏病专家、神经科医师和临床流 行病学家组成的终点评估委员会通过回顾所有医院记录和死亡证明以确定调查终点事 件或最终诊断死亡原因。心血管终点事件由两个委员会成员的独立核实诊断,如诊断结 果不同,则由更多的委员会成员讨论确定。
本发明中,分析选取了随访资料和遗传因素评分都有完整数据的参加者,并排除了 基线阶段发生心血管病事件个体,共26262名个体纳入分析(表1),在随访期间378 例冠心病和749例脑卒中发生,共计1078例心血管病事件。7724名基线血压正常且有 随访血压数据的调查对象纳入血压升高和高血压发生的分析。
表1.研究人群的基本特征
总样本量 26262 男性/女性(%男性) 11736/14526(44.69) 年龄(标准差) 50.86(8.92) BMI(kg/m2)(标准差) 24.24(3.65) 收缩压(SBP,mmHg)(标准差) 130.69(22.78) 舒张压(DBP,mmHg)(标准差) 81.68(12.57) 高血压患病率(%) 37.79 总胆固醇(TC,mmol/l)(标准差) 4.71(0.97) 高密度质蛋白胆固醇(HDL,mmol/l)(标准差) 1.35(0.40) 甘油三脂(TG,mmol/l)(标准差) 1.60(1.20) 饮酒(%) 20.99 吸烟(%) 31.02 心血管疾病家族史(%) 9.69
二、SNP选择、基因分型
本发明中,选择了在东亚人群和中国人群全基因组关联研究中与收缩压或者舒张压 相关的22个单核苷酸多态性(SNP)位点,应用iPLEX Sequenom Mass ARRAY平台进 行基因分型。所述22个SNP为:CASZ1区域rs880315、MOV10区域的rs10745332和 rs17030613、FIGN区域rs16849225、SLC4A7区域rs820430、ULK4区域rs9815354、 CACNA1D区域rs9810888、FGF5区域rs1902859、ENPEP区域rs6825911、GUCY1A3 区域rs13143871、NPR3区域rs1173766、HFE区域rs1799945、HLA-B区域rs9266359、 CYP21A2区域rs2021783、CYP17A1区域rs4409766、SOX6区域rs4757391、ATP2B1 区域rs17249754、ALDH2区域rs11066280、TBX3-TBX5区域rs1991391、TBX3区域 rs35444、MED13L区域rs11067763和JAG1区域rs1887320。
基因分型应用iPLEX Sequenom MassARRAY分型系统(CompleteGold Genotyping Reagent Set 384;Sequenom;Cat No.10148-2)完成。其原理为:将包含SNP 位点区域的DNA技术扩增,应用MassARRAY iPLEX单碱基延伸技术,将特异的延伸 引物与PCR产物进行单碱基延伸反应。延伸产物不同的末端碱基将导致延伸后的产物 分子量的差多态性引起的碱基差异通过分子量的差异而体现,通过基质辅助激光解吸检 测延伸产物分子量的大小,应用专用的分析软件,通SNP分型检测。
基因分型的具体实验步骤:
1)应用Sequenom公司Genotyping Tools及MassARRAY Assay Design软件设计待 测SNP位点的PCR扩增引物及单碱基延伸引物。
2)采集受试者外周血,提取DNA样本,并将DNA浓度调整为55μg/μl(±5μg/μl)。
3)PCR反应:
仪器:Gene Amp PCR System 9700(Dural 384),Amplied Biosystems
反应体系(5/μl):
PCR条件:
4)PCR产物碱性磷酸酶处理:在PCR反应结束后,将PCR产物用SAP(shrimp alkaline phosphatase,虾碱性磷酸酶)处理,以去除体系中游离的dNTPs。
反应体系:
反应条件:37℃40min;85℃5min;4℃∞。
5)单碱基延伸
将单碱基延伸反应液2μl,加入4)对应的384孔中,于PCR仪上进行如下反应:
单碱基延伸反应液配比(2μl):
6)树脂纯化
将Clean Resin树脂平铺到6mg的树脂板中,加16μl水到延伸产物的对应孔内;将 干燥后的树脂倒入延伸产物板中,封膜;低速垂直旋转30应物充分接触;离心使树脂 沉入孔底部。
7)芯片点样
启动MassARRAY Nanodispenser RS1000点样仪(Sequenom),将树脂纯化后的延 伸产物移至384孔SpectroCHIP(Sequenom)芯片上。
8)质谱检测
将点样后的SpectroCHIP芯片使用MALDI-TOP(matrix-assisted laser desorption/ ionization–time of fligh,基质辅助飞行时间质谱)分析,检测结果使用TYPER 4.0软件 (Sequnom)分型并输出结果。
9)分型结果
图1至图9分别是rs4757391、rs9810888、rs1902859、rs4409766、rs10745332、 rs17249754、rs 880315、rs 9815354和rs11066280基因分型结果散点图(各2块384板)。
三、遗传风险评分
采用血压的遗传风险评分(GRS)评价22个SNP的累积效应,根据全基因组关联 研究结果,确定用于评价每个SNP对收缩压(SBP)和舒张压(DBP)的平均效应大小 (β加权系数)。22个位点信息见表2。用每个SNP的β加权系数乘以该位点的危险等 位基因数并将结果相加,计算遗传风险评分(GRS),计算公式:遗传风险评分=∑βi×Ni, 其中βi指第i个SNP的收缩压和舒张压效应值的平均值,Ni指研究对象所携带第i个 SNP的危险等位基因数目。将遗传风险评分作为连续型变量或进行5分位分组,分析与 高血压和心血管病事件发生的关系。
统计方法应用Logistic回归和Cox比例风险回归分析单个SNPs以及它们构成的 GRS与血压增高、高血压发生以及心血管病事件发生的相关性,并在模型中校正传统危 险因素。比较在有无GRS的模型中的C指数(C-indice),以评价应用遗传风险评分对 高血压和心血管事件发生风险预测的改进。采用模型拟合曲线(Calibration)评估高血 压和心血管疾病发生风险预测模型拟合是否良好。
表2. 22个血压相关的位点及其效应
*效应值来源于东亚人群和中国人群开展的高血压全基因组关联研究(Nat Genet.2011; 43:531-538,Hum Mol Genet.2015;24:865-874)。
22个血压位点除rs6825911外,每年升高收缩压0.01–0.11mm Hg和舒张压 0.004–0.07mm Hg。其中20个SNPs增加高血压和心血管疾病事件的发生(P=6.06 10-5) (表3)。6个SNP(rs17030613,rs10745332、rs9810888、rs1902859、rs11066280、rs35444 与血压变化或高血压发病相关达到显著水平(P<0.05)。5个SNP(rs880315、rs820430、 rs13143871、rs11066280和rs1887320)与心血管病事件发生相关性达到显著水平 (P<0.05)。
表3. 2 2位点对血压变化、高血压以及心血管疾病事件发生的影响
由上述可以看出,单个遗传位点的作用相对较弱,本发明整合了22个位点的累积效应, 可以显著增加遗传因素的预测能力。按照遗传风险评分值将研究对象5分位法分为5组,分 别为第1组7.765~13.465(G1)、第2组13.47~14.616(G2)、第3组14.62~15.545(G3)、 第4组15.545~16.654(G4)和第5组16.655~22.125(G5)。与遗传风险评分最低的1组 相比,计算其他各组发病风险的高低。随着遗传风险评分分值的增加,收缩压和舒张压水平 也显著增加。(见表4)。遗传风险评分分值从低到高的各组高血压累计发病率分别为29.4%、 31.6%、32.4%、36.2%和36.8%。在模型中加入性别、年龄、体重指数,吸烟、饮酒状况, 脉搏、收缩压和舒张压,与遗传风险评分最低的分组个体相比,处在第二、三、四和第五个 五分位法分组个体发生高血压风险分别增加15%,21%,30%,和40%(趋势检验P =3.82×10-5)。遗传风险评分从低到高各组心血管疾病累计发病率分别为3.1%、3.5%、3.7%、 4.2%和4.4%。在模型中加入性别、年龄、体重指数,吸烟、饮酒状况、糖尿病、总胆固醇、 高密度脂蛋白胆固醇、心血管病家族史、收缩压和服用降压药情况,与遗传风险评分最低的 分组个体相比,处在第二、三、四和第五个五分位法分组个体发生心血管疾病事件发生风险 分别增加11%、15%、32%、和26%(趋势检验P=4.57×10-3)。上述研究结果显示遗传风 险评分是血压升高、高血压以及心血管疾病事件发生的独立危险因素。本发明的遗传风险评 分可以用于预测血压升高、高血压以及心血管疾病事件发生。
表4.遗传风险评分与血压升高、高血压以及心血管事件发生危险
高血压校正性别、年龄、体重指数,吸烟、饮酒状况,脉搏、收缩压和舒张压。
心血管病事件发生校正性别、年龄、体重指数,吸烟、饮酒状况、糖尿病、总胆固醇、高密度脂蛋白 胆固醇、心血管病家族史、收缩压和服用降压药。
遗传风险评分在高血压和心血管事件发生风险预测模型的作用评估:
在传统危险因素的模型中,加入遗传风险评分GRS,能提高对高血压和心血管事件发生 风险的预测能力,C-指数变化为0.2%,P值都均<0.05(表5)。
表5.传统危险因素加入遗传风险评分后的预测模型评估
四、建立高血压和心血管疾病的发病风险预测模型
高血压预测模型中包括基因型信息(遗传风险评分分组)和传统危险因素包括年龄、性 别、体重指数、吸烟、饮酒、脉搏、收缩压和舒张压,相关效应见表6。心血管疾病发病风 险预测模型中包括基因型信息(遗传风险评分分组)和传统危险因素包括性别、年龄、体重 指数,吸烟、饮酒状况、糖尿病、总胆固醇、高密度脂蛋白胆固醇、心血管疾病家族史、收 缩压和服用降压药情况,各个变量的效应见表7。综合上述遗传和环境因素建立高血压和心 血管疾病发病风险预测模型:
高血压发病风险预测模型
高血压发病风险=1/(1+exp(-Z))。Z=-14.808+0.142×G2+0.193×G3+0.265×G4+ 0.339×G5+0.165×性别+0.034×年龄+0.063×体重指数+(-0.013)×是否吸烟+0.159×是否饮酒 +0.01×脉搏+0.061×收缩压+0.04×舒张压。
心血管疾病发病风险预测模型:
心血管疾病发病风险=1/(1+exp(-Z))。Z=-8.558+0.126×G2+0.159×G3+0.297×G4+ 0.256×G5+(-0.273)×性别+0.056×年龄+0.035×体重指数+0.19×是否吸烟+(-0.475)× 是否饮酒+0.358×有无糖尿病+0.006×总胆固醇+(-0.028)×高密度脂蛋白胆固醇+0.643× 是否有心血管疾病家族史+0.015×收缩压+0.309×是否服用降压药。
表6.高血压发生风险预测模型变量
表7.心血管病事件发生风险预测模型变量
将遗传风险评分分组和环境因素暴露信息放入风险预测模型计算出每名研究对象的高 血压和心血管疾病的发病风险。采用作受试者工作特征曲线(ROC)和模型拟合曲线 (Calibration)评估高血压和心血管疾病发生风险预测模型。根据ROC曲线下面积评价该预 测方法的价值。如图10所示,高血压和心血管疾病发生的ROC下面积为分别为0.776和 0.813,表明该模型预测性能良好,可以很好的识别高危人群。模型拟合曲线显示高血压和心 血管事件发生风险的预测值和观察值无显著差异,P值分别为0.882和0.24,模型拟合良好, 见图11。
实施例二、待测个体高血压和心血管疾病发病风险评估实例
根据模型计算获得该研究对象高血压和心血管疾病事件发生的风险,判断该研究对 象是否为高危人群。完成个体化健康指导报告,报告高血压和心血管疾病事件发生风险 的高低。个体化健康指导报告是在基因型结果的基础上,结合生活方式危险因素评估研 究对象高血压和心血管疾病事件发生的风险,并制定出针对研究对象的个体化健康行动 方案。
根据实施例一中所检测的检测的26262名个体22个多态性位点(rs880315、 rs17030613、rs10745332、rs16849225、rs820430、rs9815354、rs9810888、rs1902859、 rs6825911、rs13143871、rs1173766、rs1799945、rs9266359、rs2021783、rs4409766、 rs4757391、rs17249754、rs11066280、rs1991391、rs35444、rs11067763和rs1887320) 情况,平均6.9年的随访观察结果,制定血压相关位点危险等位基因遗传效应速查图表 (图12)以及遗传风险评分速查图表(图13)。遗传风险评分最低组到最高组,高血 压和心血管疾病发病风险逐渐升高,存在明显的剂量效应关系。
待测个体王某,中国汉族人,男性,73岁,利用本发明的用于评估待测个体高血 压和/或心血管疾病发病风险的检测装置评估其患高血压和/或心血管疾病发病风险高低, 所述的用于评估待测个体高血压和/或心血管疾病发病风险的检测装置包括检测单元、数 据分析单元、评估单元,主要按照如下步骤进行:
(一)采集空腹血并收集性别、年龄、血压水平、血脂水平、身高、体重、吸烟、饮 酒和疾病史等相关信息,填入下表(表8)。
表8待测个体信息登记表
(二)分离待测个体抗凝血中DNA,利用检测单元检测22个位点的基因型,该实施 例中,检测单元主要包括iPLEX Sequenom MassARRAY分型系统,具体操作参照说明 书的记载进行。
经检测,王某的22个位点的基因型分别为:rs880315为CC;rs17030613为AC; rs10745332为AG;rs16849225为CC;rs820430为AG;rs9815354为AG;rs9810888 为TT;rs1902859为CT;rs6825911为CC;rs13143871为CC;rs1173766为CC; rs1799945为CC;rs9266359为CC;rs2021783为CC;rs4409766为TT;rs4757391为 TT;rs17249754为GA;rs11066280为AT;rs1991391为GG;rs35444为AA;rs11067763 为AG;rs1887320为AG;其风险等位基因的数目分别为:2、1、1、2、1、1、0、1、 2、0、2、0、2、2、2、0、1、1、2、2、1和1。
(三)对检测结果进行分析处理:
(1)利用数据分析单元对检测结果进行分析处理,其中包括图12所示血压相关位点危 险等位基因遗传效应速查表将所述22个单核苷酸多态性位点的检测结果对照该图表,查 找出各位点相应的危险等位基因遗传贡献,相加,得到遗传风险评分,具体如下:
遗传风险评分=∑βi×Ni,其中βi指第i个SNP的收缩压和舒张压效应值的平均值,
Ni指研究对象所携带第i个SNP的危险等位基因数目。
王某高血压发病遗传风险评分为15.505,查阅图13,处于遗传风险评分第3组。
(2)利用高血压发病预测模型,计算高血压发病风险:
高血压发病风险=1/(1+exp(-Z))。Z=-14.808+0.142×G2+0.193×G3+0.265×G4+ 0.339×G5+0.165×性别+0.034×年龄+0.063×体重指数+(-0.013)×是否吸烟+0.159×是否饮 酒+0.01×脉搏+0.061×收缩压+0.04×舒张压。具体为:
Z=-14.808+0.142×0+0.193×1+0.265×0+0.339×0+0.165×1+0.034×73+0.063×28+ (-0.013)×0+0.159×0+0.01×70+0.061×135+0.04×80=1.931。
高血压发病风险=1/(1+exp(-Z))=0.87。
王某高血压发病风险为0.87,即87%。
(3)利用心血管疾病发病风险预测模型,计算心血管疾病发病风险:
心血管疾病发病风险=1/(1+exp(-Z))。Z=-8.558+0.126×G2+0.159×G3+0.297×G4 +0.256×G5+(-0.273)×性别+0.056×年龄+0.035×体重指数+0.19×是否吸烟+ (-0.475)×是否饮酒+0.358×有无糖尿病+0.006×总胆固醇+(-0.028)×高密度脂蛋 白胆固醇+0.643×是否有心血管疾病家族史+0.015×收缩压+0.309×是否服用降压 药。具体为:
Z=-8.558+0.126×0+0.159×1+0.297×0+0.256×0+(-0.273)×1+0.056×73+ 0.035×28+0.19×0+(-0.475)×0+0.358×1+0.006×299+(-0.028)×48+0.643×0+ 0.015×135+0.309×0=-0.771.心血管疾病发病风险=1/(1+exp(-Z))=0.31。
王某心血管疾病发病风险为0.31,即31%。
(三)对王某进行高血压和心血管疾病发病风险评估:
通过检测结果的分析处理,王某高血压发病风险为87%。
按照Framingham研究对心血管疾病发生风险分类(0-10%之间为低危险,10-20%之 间为中度危险,大于20%为高危人群),王某心血管疾病发病风险为31%,属于高危人 群。
通过遗传和环境因素预测确定王某的高血压和心血管疾病发生风险较高,建议其除 采取健康生活方式外,注意控制血糖、血脂,定期进行健康体检,如有异常及时就医。 本发明提供了一种根据多个单核苷酸多态性多态性预测个体高血压和/或心血管疾病发 病风险的模型,能够很好的识别高血压和心血管疾病高危人群,从而针对性的进行干预, 达到早期发现、早期预防高血压和/或心血管疾病发生的目的。利用研究对象基因型结果 计算遗传风险评分,在传统危险因素模型中加入遗传风险评分,完成待测个体基因型检 测报告和个体化健康指导报告,并报告其发生高血压和/或心血管疾病风险的高低。