《一种用于代谢组学数据处理中消除外源性成分干扰的分析方法.pdf》由会员分享,可在线阅读,更多相关《一种用于代谢组学数据处理中消除外源性成分干扰的分析方法.pdf(14页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102930182 A(43)申请公布日 2013.02.13CN102930182A*CN102930182A*(21)申请号 201110230853.0(22)申请日 2011.08.12G06F 19/18(2011.01)(71)申请人刘树民地址 150040 黑龙江省哈尔滨市香坊区和平路24号黑龙江中医药大学(72)发明人刘树民 闫广利 柳长凤 卢芳(54) 发明名称一种用于代谢组学数据处理中消除外源性成分干扰的分析方法(57) 摘要本发明提供一种从海量的代谢组学数据中剔除外源性成分数据的分析方法。该方法特征在于将各实验组合并分为两组,一组包含所有不给药的。
2、组,通常包括空白组和模型组,另一组只包含给药组,然后利用多变量统计方法进行处理,抽提只有在给药组中存在,而在其它组中均不存在的标志物,即为外源性成分,然后将其数据剔除,数据更新后再进行下一步的模式识别分析。该方法能够简单、快速、完全地排除外源性成分数据的干扰,从而使反映药物(尤其是中药)整体生物效应的机体内源性代谢组的整体变化获得真实展现和科学评价。(51)Int.Cl.权利要求书1页 说明书6页 附图6页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书 1 页 说明书 6 页 附图 6 页1/1页21.代谢组学方法评价药物整体生物效应时,一种清除外源性成分数据干扰的方法,所。
3、述方法包括步骤:(1)数据分组,即将空白组和动物模型组合并为一组,将给药组单独组成一组。(2)数据处理,即应用化学计量学的正交偏最小二乘判别分析法(OPLS-DA)对(1)中分成的两组数据进行处理,给出S-Plot图,或者应用化学计量学的偏最小二乘判别分析法(PLS-DA)进行处理,给出Loadings Plot图,再或者应用化学计量学的主成分分析法(PCA)进行处理,给出Loadings Plot图。(3)数据剔除,即结合Trend Plot图,在OPLS-DA分析的S-Plot图中,或者是在PLS-DA分析的Loadings Plot图中,再或者是PCA分析的Loadings Plot图中。
4、,选择只有在给药组存在而在另一组中不存在的数据点,即为外源性成分数据,将这部分数据剔除。2.一种如权利要求1(1)所述的数据分组方法,其特征在于将不含外源性成分(如药物及其代谢物)数据的所有组合并为一组,将含有外源性成分(如药物及其代谢物)数据的所有组合并为另一组。3.一种如权利要求1(2)所述的数据处理方法,其特征在于应用化学计量学的正交偏最小二乘判别分析法(OPLS-DA)或者偏最小二乘判别分析法(PLS-DA)再或者主成分分析法(PCA)进行处理。4.一种如权利要求1(3)所述的数据剔除方法,其特征在于外源性成分数据点集中分布于S-Plot图中的一端,或者是Loadings Plot图中。
5、的一个区域,并且Trend Plot图中显示这些数据点只存在于给药组中,而在另一组中不存在,这些数据点即为要剔除的外源性数据点。5.权利要求1中的代谢组学数据,是指利用液相色谱-飞行时间质谱采集的数据,生物样本包括血液、尿液、脑脊液、唾液、组织匀浆液、细胞培养液。6.权利要求1中的药物包括化学药物、中药、中药复方。权 利 要 求 书CN 102930182 A1/6页3一种用于代谢组学数据处理中消除外源性成分干扰的分析方法 技术领域0001 本发明涉及药物代谢学的数据处理方法,具体涉及一种药物代谢学数据处理中如何剔除外源性成分数据的分析方法,经消除外源性数据干扰后能真实展现和评价药物的整体生物。
6、效应。 背景技术0002 代谢组学是“后基因组学”时期新兴的一门“组学”技术,也是系统生物学的重要组成部分,它是关于生物体系受刺激或扰动后(如将某个特定的基因变异或环境变化后)其代谢产物(内源代谢物质)种类、数量及其变化规律的科学。它研究的是生物整体、系统或器官的内源性代谢物质的代谢途径及其所受内在或外在因素的影响。常用的方法是检测和量化一个生物整体代谢组随时间变化的规律;建立内在和外在因素影响下,代谢组整体的变化轨迹,来反映某种病理(生理)过程中所发生的一系列生物事件。 0003 目前,代谢组学方法已被应用于评价药物(尤其是中药)的治疗作用。中药的化学成分复杂,其在治疗疾病时主要是药效组分在。
7、多靶点或多器官上发挥整体综合调节作用,而代谢组学是研究机体内所有小分子代谢物在受外界因素干扰后的整体变化,恰恰能表征中药多成分所产生的整体生物效应。然而,进行代谢组学研究时,要求所采用的分析技术如液相色谱质谱联用(LC-MS)技术和核磁共振光谱(NMR)技术对生物样品中所有小分子代谢物进行全扫描的检测,这其中包括外源性的药物原型成分及其代谢物。在随后的模式识别分析中,这些外源性成分数据的存在必定干扰对内源性代谢组的建模,将使对药物整体生物效应的评价发生偏离。因此,在代谢组学数据处理时,必须将外源性成分的数据彻底剔除,使正确评价药物的整体生物效应。 0004 以往剔除外源性成分数据的方法主要有:。
8、(1)对采集的全扫描数据进行多变量统计分析,如PCA、PLS-DA、OPLS-DA,抽提引起组间分离的标志物,然后进行鉴定,如果是外源性成分,则从数据中剔除,然后再次进行多变量统计分析,如此循环操作,直到抽提的标志物均为内源性代谢物,这时才能进行药物生物效应的整体评价;(2)首先比较给药组和空白组的图谱,找出药物的原型成分和代 谢物,然后在代谢组学数据中将这些外源性的成分数据逐一剔除,最后进行多变量统计分析,评价药物的整体生物效应。 0005 上述方法繁琐费时,而且不能完全剔除外源性成分数据的干扰。本发明提供了一种在代谢组学数据处理过程中,通过有效分组,直接将外源性成分数据剔除的分析方法。该方。
9、法简单、快速、彻底,能使药物的整体生物效应得到真正展现和科学评价。 发明内容0006 本发明所要解决的技术问题是:将各实验组进行重新合并分成两组,一组只包含给药组,另一组包含所有不给药的组,通常是空白组和模型组,然后进行多变量统计分析,抽提只有在给药组在存在,而在其它不给药组中响应值为零的标志物,即为外源性代谢物,说 明 书CN 102930182 A2/6页4将其剔除,从而解决利用代谢组学方法评价药物整体生物效应时如何排除外源性成分数据干扰的问题。 0007 为解决上述问题,本发明提供如下技术方案,步骤包括: 0008 数据分组:将各实验组合并分为两组,一组只包含给药组,另一组包含所有不给药。
10、的组,通常有空白组、动物模型组。 0009 数据处理:应用化学计量学的正交偏最小二乘判别分析法(OPLS-DA)对两组数据进行处理,给出S-Plot图,或者应用化学计量学的偏最小二乘判别分析法(PLS-DA)进行处理,给出Loadings Plot图,再或者应用化学计量学的主成分分析法(PCA)进行处理,给出Loadings Plot图。 0010 数据剔除:结合Trend Plot图,在OPLS-DA分析的S-Plot图中,或者是在PLS-DA分析的Loadings Plot图中,再或者是PCA分析的Loadings Plot图中,选择只有在给药组存在而在另一组中不存在的数据点,即为外源性成。
11、分数据,将这部分数据剔除。 0011 数据更新和建模:剔除外源性成分数据点后,更新数据组,再进行模式识别的PCA分析,在Scores Plot图中描绘了内源性代谢组在药物治疗前后的变化轨迹,从而在整体上评价药物的整体生物效应。 0012 本发明的突出优点是,不需要预先获知药物组成及其代谢物的信息,通过本发明的分组设计,外源性成分将直接暴露在S-Plot图的一侧或Loadings Plot图的一个集中区域内,再根据外源性成分只有在给药组存在而在另一组中响应值为零 的分布特点,能够将其直接抽提出来,然后剔除掉,数据更新后可直接进行下一步的内源性代谢组变化轨迹的分析。这一点对于化学组成复杂的中药尤为。
12、重要。 附图说明0013 图1.黄芩干预酵母诱导大鼠发热证候模型前后尿液UPLC/TOF-MS数据直接经PCA处理后给出的Scores Plot图。由于尿液UPLC/TOF-MS数据中不仅包含了内源性小分子代谢物,还包含了来源于黄芩的外源性代谢物,结果导致代谢组的整体变化轨迹没有表现明显的回归趋势,不能说明黄芩的解热作用。K:空白组;M-10:模型组;QD-10h:黄芩低剂量组;QG-10h:黄芩高剂量组。 0014 图2.黄芩干预酵母诱导大鼠发热证候模型前后尿液UPLC/TOF-MS数据经图3-8中方法剔除外源性成分数据后,再经PCA处理后给出的Scores Plot图。图中的代谢组变化轨迹。
13、真正体现了内源性代谢组的整体变化,图中显示黄芩干预后机体内源性代谢组表现明显的回归趋势,高剂量组最为明显,从而证明了黄芩具有解热作用。K:空白组;M-10:模型组;QD-10h:黄芩低剂量组;QG-10h:黄芩高剂量组。 0015 图3.OPLS-DA分析的S-Plot图,图中标有红色方框的点为要剔除的外源性成分数据点。 0016 图4.图3中标有红色方框的数据点对于的Trend Plot图,图中显示这些数据点只有在黄芩给药组中存在,而在空白组和模型组中响应值为零。K:空白组;M-10:模型组;QD-10h:黄芩低剂量组;QG-10h:黄芩高剂量组。 0017 图5.PLS-DA分析的Load。
14、ings Plot图,图中标有红色方框的点为要剔除的外源性成分数据点。 说 明 书CN 102930182 A3/6页50018 图6.图5中标有红色方框的数据点对于的Trend Plot图,图中显示这些数据点只有在黄芩给药组中存在,而在空白组和模型组中响应值为零。K:空白组;M-10:模型组;QD-10h:黄芩低剂量组;QG-10h:黄芩高剂量组。 0019 图7.PCA分析的Loadings Plot图,图中标有红色方框的点为要剔除的外源性成分数据点。 0020 图8.图7中标有红色方框的数据点对于的Trend Plot图,图中显示这些数据点只有在黄芩给药组中存在,而在空白组和模型组中响应。
15、值为零。K:空白组;M-10:模型组;QD-10h:黄芩低剂量组;QG-10h:黄芩高剂量组。 具体实施方式0021 本发明通过下面的实施例进行详细的解释,但并不意味着本发明仅限于此。 0022 实施实例 0023 黄芩干预酵母诱导大鼠发热证候模型的代谢组学评价 0024 1.实验方案与样品采集 0025 40只Wistar大鼠,随机分为空白组、模型组、黄芩高剂量组(12g生药/kg体重)、黄芩低剂量组(3g生药/kg体重);模型组、黄芩高剂量组、黄芩低剂量组应用干酵母造模,皮下注射干酵母(10ml/kg体重),空白组皮下注射等体积的无菌生理盐水;黄芩高、低剂量组分别于造模后4h、8h灌胃给予。
16、黄芩水煎液,空白组和模型组给予同体积的蒸馏水; 0026 造模前三天用代谢笼收集24h尿液,每日上午8点收集1次,连续3d,尿液于冰水浴中收集;于干酵母造模后6h、10h、18h、24h、30h、36h各时间点的分别收集尿液1次,尿液于冰水浴中收集。收集的尿液置于超低温(-70)冰箱中保存。 0027 2.样品处理 0028 取冷冻保存的尿液,自然融化,用蒸馏水稀释5倍后于13000rpm离心15分钟,吸取上清液供UPLC/TOF-MS检测。 0029 3.样品测定 0030 仪器:超高效液相色谱-飞行时间质谱(UPLC/TOF-MS)检测系统(美国Waters AcquityTMUPLC液相。
17、色谱仪,配备四元梯度泵-在线真空脱气机-自动进样器-柱温箱-二极管阵列检测器;美国Waters LCT Premier飞行时间质谱仪,配备电喷雾离子源-正负离子扫描方法-Lockspray) 0031 色谱条件:色谱柱:ACQUITY UPLCTMBEH C18column(50mm2.1mmi.d.,1.7um,Waters Corp,Milford,USA);流速0.40ml/min;柱温:45:流动相:A:0.1甲酸水溶液,B:0.1甲酸乙腈溶液,梯度洗脱程序(表1)。柱后流出液不经分流直接导入质谱系统检测。 0032 质谱条件:电喷雾离子源(ESI),采用正离子扫描检测;毛细管电压为1。
18、500V;样本锥孔电压为60V;离子源温度为110;脱溶剂温度为350;脱溶剂气流量为700L/h;锥孔气流量为20L/h;微通道板电压为2450V;每0.2s采 集一次谱图;准确质量校正采用亮氨酸-脑啡肽(leucine-enkephalin,M+H+556.2771)溶液;扫描方式为全扫描,质量扫描范围m/z 50-1000。 0033 表1梯度洗脱程序表 说 明 书CN 102930182 A4/6页60034 0035 4.数据处理 0036 采用Waters Masslynx V4.1工作站中的Markerlynx XS软件进行数据处理。首先将空白组和模型组合并为一组(group 1。
19、),将黄芩高剂量组和黄芩低剂量组合并为另一组(group 2),应用OPLS-DA或PLS-DA或PCA进行处理,给出S-Plot图或Loadings Plot图,在图中选择只有在黄芩高剂量组和低剂量组中存在,而在空白组和模型组中不存在(响应值为零或几乎为零)的数据点,将其剔除后,更新数据,再进行PCA分析,在Scores Plot图中描绘内源性代谢组的代谢轨迹。 0037 5.结果 0038 各组样品经UPLC/TOF-MS检测获得包含尿液中所有小分子代谢物的数据矩阵,选择给药后10小时的尿液样品数据直接经PCA分析后,得图1所示的Scores Plot图,图中没有显示黄芩具有明显的解热作用。
20、。 0039 将空白组和模型组合并为一组(group 1),将黄芩高剂量组和黄芩低剂量组合并为另一组(group 2),应用OPLS-DA进行处理,给出S-Plot图(图3),在图中一侧选择只有在黄芩高、低剂量组中存在,而在空白组和模型组中响应值为零(图4)的数据点,将其剔除,更新数据后,再进行PCA分析,得图2所示的Scores Plot图,图中显示黄芩干预后大鼠的代谢组明显由模型组向空白组回归,证明黄芩具有一定的解热作用。 0040 将空白组和模型组合并为一组(group 1),将黄芩高剂量组和黄芩低剂量组合并为另一组(group 2),应用PLS-DA进行处理,给出Loadings Pl。
21、ot图(图5),在图中一侧选择只有在黄芩高、低剂量组中存在,而在空白组和模型组中响应值为零(图6)的数据点,将其剔除,更新数据后,再进行PCA分析,得图2所示的Scores Plot图,图中显示黄芩干预后大鼠的代谢组明显由模型组向空白组回 归,证明黄芩具有一定的解热作用。 0041 将空白组和模型组合并为一组(group 1),将黄芩高剂量组和黄芩低剂量组合并为另一组(group 2),应用PCA进行处理,给出Loadings Plot图(图7),在图中一集中区域选择只有在黄芩高、低剂量组中存在,而在空白组和模型组中响应值为零(图8)的数据点,将其剔除,更新数据后,再进行PCA分析,得图2所示。
22、的Scores Plot图,图中显示黄芩干预后大鼠的代谢组明显由模型组向空白组回归,证明黄芩具有一定的解热作用。 0042 剔除的成分经鉴定除个别未鉴定外其它均为黄芩原型成分或其代谢产物,结果见表2,证明剔除的标志物确实是外源性的成分。另外需要说明的是,应用这种方法可能会剔除个别药物治疗后新出现的内源性成分,但由于这几个成分在空白组和模型组均不存在,说明它们不是于待评价药效相关的标志物,应当作为干扰的成分剔除。这也可以认为是本发明方法的另一个优点。 0043 6.结论 说 明 书CN 102930182 A5/6页70044 通过科学的分组,应用OPLS-DA或PLS-DA或PCA方法,能够快速有效地消除外源性成分数据的干扰,使机体内源性代谢组的变化轨迹获得真实展现,从而能够正确地评价药物的整体生物效应。 0045 0046 说 明 书CN 102930182 A6/6页8说 明 书CN 102930182 A1/6页9图1图2说 明 书 附 图CN 102930182 A2/6页10图3说 明 书 附 图CN 102930182 A10。