蛋白质O-GalNAc修饰快速搜库和深度覆盖新方法.pdf

上传人:汲墨****o 文档编号:11127479 上传时间:2021-09-05 格式:PDF 页数:13 大小:810.89KB
收藏 版权申诉 举报 下载
蛋白质O-GalNAc修饰快速搜库和深度覆盖新方法.pdf_第1页
第1页 / 共13页
蛋白质O-GalNAc修饰快速搜库和深度覆盖新方法.pdf_第2页
第2页 / 共13页
蛋白质O-GalNAc修饰快速搜库和深度覆盖新方法.pdf_第3页
第3页 / 共13页
文档描述:

《蛋白质O-GalNAc修饰快速搜库和深度覆盖新方法.pdf》由会员分享,可在线阅读,更多相关《蛋白质O-GalNAc修饰快速搜库和深度覆盖新方法.pdf(13页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910851014.7 (22)申请日 2019.09.10 (71)申请人 北京蛋白质组研究中心 地址 102206 北京市昌平区中关村生命科 学园生命园路38号 (72)发明人 秦伟捷张万军赵新元李圆圆 焦丰龙 (74)专利代理机构 北京纪凯知识产权代理有限 公司 11245 代理人 张立娜 (51)Int.Cl. G01N 33/68(2006.01) G06F 16/903(2019.01) G06F 16/906(2019.01) G16B 50/30(2019.。

2、01) (54)发明名称 一种蛋白质O-GalNAc修饰快速搜库和深度 覆盖新方法 (57)摘要 本发明公开了一种蛋白质O-GalNAc修饰快 速搜库和深度覆盖新方法。 本发明一方面, 通过 对O-GalNAc糖肽谱图中氧鎓离子和唾液酸碎片 的谱图提取和分类的策略, 针对不同类型的谱图 进行相应匹配的O-糖糖型数据库检索, 大幅减少 数据库检索空间, 缩短搜库耗时; 另一方面, 针对 完整O-GalNAc糖肽在质谱DDA扫描模式下的多样 本检测中存在大量缺失值的问题, 依据多样本实 验中已鉴定的完整O-GalNAc糖肽, 利用校正保留 时间及质谱一级质量数匹配的方式, 进行不同样 本间完整O-。

3、GalNAc糖肽定量缺失值的补充, 大幅 提高了多样本检测时O-GalNAc糖肽的鉴定覆盖 度, 改善了定量重现性。 权利要求书2页 说明书8页 附图2页 CN 110632323 A 2019.12.31 CN 110632323 A 1.一种蛋白质O-GalNAc修饰搜库方法, 包括如下步骤: (A1)从O-GalNAc修饰肽段的质谱谱图中提取糖肽谱图; (A2)根据是否含有唾液酸碎片, 对步骤(A1)中所得的所述糖肽谱图进行分类, 分为含 有唾液酸碎片的谱图和不含有唾液酸碎片的谱图; (A3)对所述含有唾液酸碎片的谱图进行含唾液酸O-GalNAc糖型的数据库检索, 对所述 不含唾液酸碎片。

4、的谱图进行不含唾液酸O-GalNAc糖型的数据库检索。 2.根据权利要求1所述的方法, 其特征在于: 步骤(A1)中, 所述从O-GalNAc修饰肽段的 质谱谱图中提取糖肽谱图是从所述O-GalNAc修饰肽段的质谱谱图中提取含有氧鎓离子碎 片的谱图。 3.根据权利要求2所述的方法, 其特征在于: 所述氧鎓离子碎片大小为126Da、 138Da、 168Da、 186Da和204Da。 4.根据权利要求1-3中任一所述的方法, 其特征在于: 步骤(A2)中, 所述唾液酸碎片大 小为274Da和292Da。 5.根据权利要求1-4中任一所述的方法, 其特征在于: 步骤(A2)中, 是使用Byoni。

5、c软件 并使用软件自带的O-GalNAc数据库对所述含有唾液酸碎片的谱图进行含唾液酸O-GalNAc 糖型的数据库检索, 对所述不含唾液酸碎片的谱图进行不含唾液酸O-GalNAc糖型的数据库 检索。 6.根据权利要求1-5中任一所述的方法, 其特征在于: 步骤(A3)中, 检索结果为含唾液 酸O-GalNAc糖型的数据库检索结果和不含唾液酸O-GalNAc糖型的数据库检索合并所得。 7.根据权利要求1-6中任一所述的方法, 其特征在于: 所述方法还包括在多样本检测时 对不同样本中缺失的O-GalNAc糖肽信息进行填充和/或定量分析的步骤, 如下: 先利用多样 本中的已鉴定到的完整O-GalNA。

6、c糖肽的实际保留时间计算得到待补充的对应目标缺失O- GalNAc糖肽的参考保留时间; 再对所述待补充的对应目标缺失O-GalNAc糖肽的参考保留时 间进行校正, 得到对应的校正保留时间; 最后通过所述校正保留时间和质谱一级质量数进 行一级质谱峰匹配和峰面积提取。 8.根据权利要求7所述的方法, 其特征在于: 假定一组待进行蛋白质O-GalNAc修饰鉴定 的样本, 样本数共计X个; 每个样本进行一次质谱分析; 统计在至少N次质谱分析中均鉴定到 的完整O-GalNAc糖肽的数据; 将所述至少N次的实际次数记为n, 对应n个样本; 补充在另外 (X-n)个样本中缺失的与所述n个样本中均鉴定到的完整。

7、O-GalNAc糖肽相对应的O-GalNAc 糖肽的信息; 将来自于所述(X-n)个样本中某一样本A的某条待补充的目标缺失O-GalNAc糖肽记为 O-GalNAc糖肽1; 所述样本A中所述O-GalNAc糖肽1的校正保留时间是 “所述O-GalNAc糖肽1的参考保留 时间” 加上 “在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时间前后5 分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的平均保留时间偏移” ; 进一步地, 所述O-GalNAc糖肽1的参考保留时间是在所述n次质谱分析中所述O-GalNAc 糖肽1的实际保留时间的中位数; 和/或 进一步地, 所述 。

8、“在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时 间前后5分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的平均保留时间偏移” 是在所述样 权利要求书 1/2 页 2 CN 110632323 A 2 本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时间前后5分钟范围内, 所鉴定到 的所有完整O-GalNAc糖肽的实际保留时间和参考保留时间的平均差值。 9.根据权利要求8所述的方法, 其特征在于: 在所述方法中, 所述样本A中所述O-GalNAc 糖肽1的校正保留时间, 按照如下步骤计算: (a1)利用公式I计算得到所述O-GalNAc糖肽1在所述n。

9、次质谱分析中的实际保留时间中 位数, 得到所述O-GalNAc糖肽1的参考保留时间。 mRTOGmedian(RTOG,run1,RTOG,run2,RTOG,runn) 公式I 式中, mRTOG为所述O-GalNAc糖肽1的参考保留时间, RTOG,runn为第n次实验时得到的所述 O-GalNAc糖肽1的实际保留时间; (a2)通过公式II计算, 所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保 留时间前后5分钟范围内, 所鉴定到的每一条完整O-GalNAc糖肽的实际保留时间和参考保 留时间的差值; 即保留时间偏移; RTOGRTOG-mRTOG 公式II 式中, RT。

10、OG为在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时间 前后5分钟范围内, 成功鉴定的某一完整O-GalNAc糖肽A的保留时间偏移; RTOG为在所述样本 A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时间前后5分钟范围内, 成功鉴定的 所述完整O-GalNAc糖肽A的实际保留时间; mRTOG为所述完整O-GalNAc糖肽A的参考保留时 间; (a3)利用公式III计算, 在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考 保留时间前后5分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的实际保留时间和参考保 留时间的平均差值, 即平。

11、均保留时间偏移; aRTOG1average(RTOG2,RTOGa) 公式III 式中, aRTOG1为在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时 间前后5分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的平均保留时间偏移; RTOGa为在 所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时间前后5分钟范围内, 所 鉴定到的完整O-GalNAc糖肽a的保留时间偏移; (a4)通过公式IV计算获得所述样本A中所述O-GalNAc糖肽1的校正保留时间; sRTOG1mRTOG1+aRTOG1 公式IV 式中, sRTOG1为所述样本A中所述O。

12、-GalNAc糖肽1的校正保留时间; mRTOG1为所述O- GalNAc糖肽1的参考保留时间; aRTOG1为在所述样本A的质谱鉴定数据中, 在所述O-GalNAc 糖肽1的参考保留时间前后5分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的平均保留时 间偏移。 10.权利要求1-9中任一所述方法在鉴定蛋白质O-GalNAc修饰中的应用。 权利要求书 2/2 页 3 CN 110632323 A 3 一种蛋白质O-GalNAc修饰快速搜库和深度覆盖新方法 技术领域 0001 本发明涉及生物信息学领域, 具体涉及一种蛋白质O-GalNAc修饰快速搜库和深度 覆盖新方法。 背景技术 0002。

13、 O-乙酰氨基葡萄糖(O-GlcNAc)修饰系发生在蛋白质丝氨酸、 苏氨酸羟基末端连接 的乙酰氨基葡萄糖上的单糖基修饰。 O-GalNAc修饰是一种重要的蛋白质翻译后修饰, 其在 多种生物学过程以及疾病的发生发展中发挥重要的作用。 因此, 对于蛋白质O-GalNAc修饰 的解析对于深入了解生命活动的本质以及疾病的诊断和预后分析具有重要意义。 目前, 基 于生物质谱的蛋白质翻译后修饰研究是O-GalNAc修饰最常用的解析手段, 然而目前对于O- GalNAc修饰的完整糖肽的分析在质谱数据解析方面存在重大的挑战。 由于O-GalNAc修饰发 生在肽段的任意丝氨酸或苏氨酸残基上, 并且O-GalNA。

14、c组成复杂, 糖型繁多(几十种), 因此 导致数据检索时, 检索空间大, 检索时间冗长等困难。 目前O-GalNAc的研究通常采用减少候 选糖型的方法缩短搜库时间, 然而该策略下, 会损失部分糖型信息, 导致鉴定的结果不准 确。 0003 除了检索困难以外, 基于质谱的O-GalNAc修饰鉴定由于母离子选择的随机性以及 实际样本中O-GalNAc肽段丰度低, 现有富集策略有限, 并且完整的O-GalNAc糖肽质谱响应 差等原因, 众多低丰度的O-GalNAc糖肽无法有效触发二级碎裂, 导致相应的二级谱图缺失, 或者二级谱图中碎片离子过少, 难以通过传统的数据库检索方法解析。 从而在多组样本分 。

15、析时, O-GalNAc糖肽鉴定存在明显的随机性和广泛的定量缺失值。 发明内容 0004 本发明所要解决的技术问题是如何缩短蛋白质O-GalNAc修饰搜库时间和提高覆 盖深度。 0005 第一方面, 本发明要求保护一种蛋白质O-GalNAc修饰搜库方法。 0006 本发明所要求保护的蛋白质O-GalNAc修饰搜库方法, 可包括如下步骤: 0007 (A1)从O-GalNAc修饰肽段的质谱谱图中提取糖肽谱图, 排除非糖肽谱图对检索的 干扰; 0008 (A2)根据是否含有唾液酸碎片, 对步骤(A1)中所得的所述糖肽谱图进行分类, 分 为含有唾液酸碎片的谱图和不含有唾液酸碎片的谱图; 0009 (。

16、A3)对所述含有唾液酸碎片的谱图进行含唾液酸O-GalNAc糖型的数据库检索, 对 所述不含唾液酸碎片的谱图进行不含唾液酸O-GalNAc糖型的数据库检索。 0010 在步骤(A1)中, 所述从O-GalNAc修饰肽段的质谱谱图中提取糖肽谱图是从所述O- GalNAc修饰肽段的质谱谱图中提取含有氧鎓离子碎片的谱图。 0011 进一步地, 所述氧鎓离子碎片大小为126Da、 138Da、 168Da、 186Da和204Da(当谱图 里同时含有这5种大小的氧鎓离子碎片则说明这个谱图对应的肽段是糖肽, 该图谱为糖肽 说明书 1/8 页 4 CN 110632323 A 4 谱图; 否则视为非糖肽图。

17、谱)。 0012 在步骤(A2)中, 所述唾液酸碎片大小为274Da和292Da(当谱图里同时含有这两种 大小的唾液酸碎片则说明该图谱为所述含有唾液酸碎片的谱图; 反之, 则视为所述不含有 唾液酸碎片的谱图)。 0013 更进一步地, 步骤(A1)和(A2)中, 所述从O-GalNAc修饰肽段的质谱谱图中提取糖 肽谱图, 以及根据是否含有唾液酸碎片, 对步骤(A1)中所得的所述糖肽谱图进行分类, 具体 可按照包括如下步骤的方法进行: 首先, 利用ProteinWizard软件将质谱raw文件转换成包 括有O-GalNAc糖肽和非O-GalNAc糖肽的二级谱图信息的mgf文件; 然后根据所述氧鎓。

18、离子 碎片(126Da、 138Da、 168Da、 186Da和204Da)提取得到相应的糖肽谱图; 再根据是否含有所述 唾液酸碎片(274Da和292Da)将所得糖肽图谱分为含有唾液酸碎片的谱图和不含有唾液酸 碎片的谱图。 0014 在步骤(A3)中, 可使用商业化的Byonic软件并使用软件自带的O-GalNAc数据库对 所述含有唾液酸碎片的谱图进行含唾液酸O-GalNAc糖型的数据库检索, 对所述不含唾液酸 碎片的谱图进行不含唾液酸O-GalNAc糖型的数据库检索。 0015 所述Byonic软件自带的O-GalNAc数据库具有70种糖型, 包括43种不含唾液酸糖型 和27种含唾液酸糖。

19、型。 0016 进一步地, 在利用所述Byonic软件进行数据库检索时, 参数设置如下: 最大漏切位 点设为2, 固定修饰为Cysteine carbamidomethylation(半胱氨酸的脲甲基化), 可变修饰 为N-terminal acylation(N-末端酰化)、 methionine oxidation(蛋氨酸氧化), 一级质量 范围设为10ppm, 二级质量范围设为0.02Da。 针对不同的谱图, 选用相应的糖型数据库, 其 中, 含唾液酸碎片的谱图, 搜库时采用含唾液酸的糖型数据库, 共27种O-GalNAc糖型, 不含 唾液酸碎片的谱图, 搜库时采用不含唾液酸的糖型数据库。

20、, 共43种糖型。 搜库结果中Byonic score设为最低300分, protein FDR设为1。 对搜库产生的excel文件中spectra列表进行 鉴定结果筛选, 规则为: 对所有spectra信息分条目进行提取, 其中对数据提取限制规则为 Byonic score300分; 去除反库结果; 存在糖基化修饰。 对提取到的条目进行数据整理, 包 括保留时间数值、 肽段序列、 糖型组成。 0017 在步骤(A3)中, 检索结果为含唾液酸O-GalNAc糖型的数据库检索结果和不含唾液 酸O-GalNAc糖型的数据库检索合并所得。 0018 上述方法还可包括利用步骤(A3)中得到的检索结果得。

21、到的信息进行一级峰面积 提取, 实现O-GalNAc完整糖肽(有MS/MS信息)定量的过程。 过程如下: 通过ProteinWizard软 件将质谱原始数据转换成包含一级及二级所有荷质比信息及信号强度信息的mzXML格式文 件, 进一步利用R语言程序包readmzXML读取mzXML文件中所有一级图谱信息, 将一级图谱按 时间顺序排列写入文本。 对由上述Byonic搜库提取的信息文件(即步骤(A3)中得到的检索 结果)进行整合, 去除冗余项, 提取保留时间及准确质量数信息, 计算此质量数下第一、 第二 和第三同位素峰信息, 与mzXML中提取到的一级信息进行匹配, 匹配误差为10个ppm, 匹。

22、配限 定三个同位素峰必须同时被检测并在匹配误差范围内, 将峰提取结果输出到文本文件中, 并对提取到的峰强度信息进行峰面积提取。 提取原则为3个连续出现的谱图中, 至少有2个 匹配到的质量数。 用两张谱图相差的保留时间乘以两张谱图中峰强的平均值计算峰面积。 0019 进一步地, 所述方法针对完整O-GalNAc糖肽在质谱DDA扫描模式下的多样本检测 说明书 2/8 页 5 CN 110632323 A 5 中存在大量缺失值的问题, 还可包括在多样本检测时对不同样本中缺失的O-GalNAc糖肽信 息进行填充和/或定量分析的步骤, 具体如下: 先利用多样本中的已鉴定到的完整O-GalNAc 糖肽(有。

23、MS/MS信息)的实际保留时间计算得到待补充的对应目标缺失O-GalNAc糖肽的参考 保留时间; 再对所述待补充的对应目标缺失O-GalNAc糖肽的参考保留时间进行校正, 得到 对应的校正保留时间; 最后通过所述校正保留时间和准确的质谱一级质量数进行一级质谱 峰匹配和峰面积提取(在缺失样本的raw文件中提取目标O-GalNAc糖肽的定量信息)。 0020 假定一组待进行蛋白质O-GalNAc修饰鉴定的样本, 样本数共计X个。 每个样本进行 一次质谱分析。 统计在至少N次质谱分析(将所述至少N次的实际次数记为n, 对应n个样本) 中均鉴定到的完整O-GalNAc糖肽的数据, 共得到m条完整O-G。

24、alNAc糖肽的数据。 其中, X、 N和 m均为正整数。 n小于X, 且N/X大于1/12。 本发明中所述在多样本检测时对不同样本中缺失的 O-GalNAc糖肽信息进行填充指的是根据在所述n次质谱分析中均鉴定到的完整O-GalNAc糖 肽的数据补充在另外(X-n)个样本中缺失的对应O-GalNAc糖肽的数据。 所述 “在另外(X-n) 个样本中缺失的对应O-GalNAc糖肽” 即为所述目标缺失O-GalNAc糖肽。 在所述另外(X-n)个 样本中缺失的每一条所述目标缺失O-GalNAc糖肽在n次质谱分析(对应n个样本)中均对应 有已鉴定到的相应完整O-GalNAc糖肽数据。 0021 将来自。

25、于所述另外(X-n)个样本中某一样本A的某条待补充的所述目标缺失O- GalNAc糖肽记为O-GalNAc糖肽1。 0022 所述样本A中所述O-GalNAc糖肽1的校正保留时间是 “所述O-GalNAc糖肽1的参考 保留时间” 加上 “在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时间前 后5分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的平均保留时间偏移” 。 0023 其中, 所述O-GalNAc糖肽1的参考保留时间是在所述n次质谱分析中所述O-GalNAc 糖肽1的实际保留时间的中位数。 所述 “在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖 肽。

26、1的参考保留时间前后5分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的平均保留时间 偏移” 是在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时间前后5分钟 范围内, 所鉴定到的所有完整O-GalNAc糖肽的实际保留时间和参考保留时间的平均差值。 0024 更加具体地, 在所述方法中, 所述样本A中所述O-GalNAc糖肽1肽的校正保留时间, 具体可按照如下步骤计算: 0025 (a1)利用公式I计算得到前文所述 “m条完整O-GalNAc糖肽” 中每一条在所述n次质 谱分析中的实际保留时间中位数, 得到所述 “m条完整O-GalNAc糖肽” 中每一条的参考保留 时。

27、间。 0026 mRTOGmedian(RTOG,run1,RTOG,run2,RTOG,runn) 公式I 0027 式中, mRTOG为某条O-GalNAc糖肽的参考保留时间, RTOG,runn为第n次实验时得到的 该条O-GalNAc糖肽的实际保留时间。 0028 通过该步骤可以获得待补充的那条所述目标缺失O-GalNAc糖肽(记为O-GalNAc糖 肽1)的参考保留时间。 0029 (a2)通过公式II计算, 所述(X-n)个样本中某一样本A的质谱鉴定数据中, 在所述 O-GalNAc糖肽1的参考保留时间前后5分钟范围内, 所鉴定到的每一条完整O-GalNAc糖肽的 实际保留时间和参。

28、考保留时间的差值; 即保留时间偏移。 0030 RTOGRTOG-mRTOG 公式II 说明书 3/8 页 6 CN 110632323 A 6 0031 式中, RTOG为在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留 时间前后5分钟范围内, 成功鉴定的某一完整O-GalNAc糖肽A的保留时间偏移; RTOG为在所述 样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时间前后5分钟范围内, 成功鉴 定的所述完整O-GalNAc糖肽A的实际保留时间; mRTOG为所述完整O-GalNAc糖肽A的参考保留 时间。 0032 (a3)利用公式III计算, 在所。

29、述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的 参考保留时间前后5分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的实际保留时间和参 考保留时间的平均差值, 即平均保留时间偏移。 0033 aRTOG1average(RTOG2,RTOGa) 公式III 0034 式中, aRTOG1为在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保 留时间前后5分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的平均保留时间偏移; RTOG a为在所述样本A的质谱鉴定数据中, 在所述O-GalNAc糖肽1的参考保留时间前后5分钟范围 内, 所鉴定到的完整O-GalNAc。

30、糖肽a的保留时间偏移。 0035 (a4)通过公式IV计算获得所述样本A中所述O-GalNAc糖肽1的校正保留时间。 0036 sRTOG1mRTOG1+aRTOG1 公式IV 0037 式中, sRTOG1为所述样本A中所述O-GalNAc糖肽1的校正保留时间; mRTOG1为所述 O-GalNAc糖肽1的参考保留时间; aRTOG1为在所述样本A的质谱鉴定数据中, 在所述O- GalNAc糖肽1的参考保留时间前后5分钟范围内, 所鉴定到的所有完整O-GalNAc糖肽的平均 保留时间偏移。 0038 步骤(A1)中, 所述O-GalNAc修饰肽段的质谱谱图可按照包括如下步骤的方法获 得: (。

31、b1)将待研究的蛋白质(如尿蛋白)酶解(如胰蛋白酶); (b2)将酶解肽段进行亲水相互 作用色谱以富集糖肽, 然后去除N糖基化肽段上的糖链(如使用PNGase F酶酶切过夜), 得到 待上样蛋白样品; (b3)将所述待上样蛋白样品使用C18反相色谱柱分离, 然后进行质谱检 测, 从而得到所述O-GalNAc修饰肽段的质谱谱图。 0039 在本发明的具体实施方式中, 将蛋白样品的胰蛋白酶酶解肽段, 经HILIC富集后的 糖肽产物使用C18反相色谱柱分离时的色谱条件具体为: C18预柱; C18反相分析柱; 以 600nL/min的流速进行梯度洗脱(流动相A为0.1甲酸水溶液, 流动相B为0.1甲。

32、酸- 99.9乙腈, 均表示体积百分含量; 流动相由所述流动相A和所述流动相B混合而成); 梯 度洗脱为: 0min, 6B; 0-8min(不含端点0), 6-9B; 8-24min(不含端点8), 9-14B; 24- 60min(不含端点24), 14-30B; 60-75min(不含端点75), 30-40B; 75-78min(不含端点 78), 40-95B(解释说明:“0-8min(不含端点0), 6-9B” 表示从0到8分钟, 所述流动相B在 所述流动相中的比例从6线性递增到9; 其后类似, 所述流动相B的含量范围均表示相应 时间内从低值线性递增到高值)。 进行所述质谱检测为分。

33、离样品经ESI喷雾离子源进入质谱 分析, ESI源喷雾电压为2.3kV, 离子传输管温度为320, 质谱数据采集在数据依赖模式下 (Data-dependent acquisition,DDA)模式下进行, 设置300-1400Da范围一级质谱全扫描, 扫描分辨率120,000, 选择一级质谱中的信号最高的20个母离子经高能碰撞诱导解离模式 (Higher-Energy Collisional Dissociation,HCD)后进行二级质谱分析, 分辨率为15, 000, 离子注入时间为35ms, 碰撞能量为35。 0040 具体地, 将所述待上样蛋白样品使用C18反相色谱柱分离, 然后进行。

34、质谱检测, 具 说明书 4/8 页 7 CN 110632323 A 7 体是利用Easy nLC-1000纳升级液相色谱系统串联Q Exactive HF质谱仪(Thermo Fisher Scientific,USA)完成的。 0041 第二方面, 本发明要求保护前文第一方面中所述方法在鉴定蛋白质O-GalNAc修饰 中的应用。 0042 在本发明中, 所述蛋白质为含有O-GalNAc修饰的蛋白, 包括组织中提取的蛋白如 肝脏蛋白、 脑组织蛋白、 肾组织蛋白等, 体液中提取的蛋白如尿液蛋白、 血清/浆蛋白、 唾液 蛋白等, 人工培养的细胞中提取的蛋白如肾上皮细胞(293T细胞系)蛋白, 宫。

35、颈癌细胞(HeLa 细胞系)蛋白质等。 0043 本发明特点: 利用完整O-GalNAc糖肽谱图中氧鎓离子碎片及唾液酸碎片进行谱图 提取分类, 针对不同类型谱图进行对应的O-GalNAc糖型数据库检索, 可大幅度缩小检索空 间, 提高搜库速度; 利用从多组样本中的到的O-GalNAc糖肽校正色谱保留时间和质谱一级 质量数, 对缺失的O-GalNAc糖肽信息进行填充, 大幅度的改善了定量重现性, 提高了O- GalNAc糖肽的鉴定覆盖度。 0044 实验证明, 本发明的蛋白质O-GalNAc修饰快速搜库和深度覆盖新方法, 可大幅减 少数据库检索空间, 相比传统搜库方法, 耗时缩短20倍, 能有效。

36、填充多样本检测中完整O- GalNAc糖肽在质谱DDA扫描模式下的存在大量缺失值, 大幅改善了定量重现性。 0045 本发明具有如下有益效果: 0046 1、 通过对O-GalNAc糖肽谱图中氧鎓离子和唾液酸碎片的谱图提取和分类的策略, 针对不同类型的谱图进行相应匹配的O-糖糖型数据库检索, 大幅减少了数据库检索空间, 缩短了搜库耗时。 0047 2、 针对完整O-GalNAc糖肽在质谱DDA扫描模式下的多样本检测中存在大量缺失值 的问题, 依据多样本实验中已鉴定的完整O-GalNAc糖肽(有MS/MS鉴定), 利用校正的色谱保 留时间及质谱一级质量数匹配的方式, 进行不同样本间完整O-Gal。

37、NAc糖肽定量缺失值的补 充, 大幅提高了多样本检测时O-GalNAc糖肽的鉴定覆盖度, 改善了定量重现性。 附图说明 0048 图1为不同数据库检索策略下完整O-GalNAc糖肽搜库时间统计。 每组中四个柱形 从左到右的顺序与图例从上到下的顺序一致。 0049 图2为36例健康人尿样中O-GalNAc糖肽定量缺失值填充前后对比图。 a为填充前; b 为填充后。 灰色的是能鉴定到的, 白色部分是空缺, 经过填充, 明显图b里灰色部分比例上 升。 0050 图3为同一例样品连续5次质谱鉴定正常搜库鉴定到的O-GalNAc糖肽和人为屏蔽 质谱二级信息, 用所述的保留时间结合一级质谱质量数匹配的方法。

38、鉴定得到的O-GalNAc糖 肽。 具体实施方式 0051 下述实施例中所使用的实验方法如无特殊说明, 均为常规方法。 0052 下述实施例中所用的材料、 试剂等, 如无特殊说明, 均可从商业途径得到。 0053 实施例1、 尿蛋白O-GalNAc谱图分类搜索 说明书 5/8 页 8 CN 110632323 A 8 0054 步骤1、 尿蛋白提取与酶切 0055 取10mL健康人晨尿中段, 12000g离心15分钟, 去除杂质, 取上清部分, 转移至50mL 离心管, 加入3倍体积预冷丙酮, 混合均匀后于-20静置2-4小时进行尿蛋白沉淀。 沉淀结 束后, 12000g离心15分钟, 收集沉。

39、淀部分, 干燥后加入裂解液(8M尿素, 0.1M Tris-HCl, pH 8.5), 利用超声破碎机进行尿蛋白超声助溶(30功率, 每次超声2秒, 重复10次), 超声结束 后, 16000g离心15分钟, 取上清部分, 即尿蛋白提取液。 酶切采用超滤管辅助法, 首先向所得 尿蛋白提取液中加入二硫苏糖醇使其浓度为10mM(二硫苏糖醇的作用是打开蛋白质的二硫 键, 让其空间结构变简单, 有利于质谱鉴定), 37孵育4小时后14000g离心15分钟, 将溶剂 置换为200 L 8M尿素, 加入200 L 50mM碘乙酰胺, 避光反应40分钟, 14000g离心15分钟置换 溶剂为200 L 50。

40、mM碳酸氢铵, 重复3次。 按蛋白: 胰蛋白酶质量比(100:1)加入胰蛋白酶 (PromegaTM Sequencing Grade Modified Trypsin,Lyophilized, 货号PRV5111), 37孵育 12小时。 酶切结束后, 14000g离心15分钟, 加入200 L水, 14000g离心15分钟, 收集肽段溶液, 冻干备用。 0056 步骤2、 亲水相互作用色谱用于糖肽富集 0057 称取亲水填料, 比例为肽段: 填料(1: 50)(质量比), 重悬于100 L 0.1(体积百 分含量)甲酸(TFA)水溶液中, 涡旋混合15分钟, 离心后弃去上清, 加入100 。

41、L binding buffer(80乙腈, 5甲酸, 15水, 均表示体积百分含量), 涡旋混合15分钟, 离心后弃 去上清, 重复一次。 将待富集的尿蛋白酶解肽段溶于100 L binding buffer后, 加入到活化 后的填料中, 涡旋混合孵育2小时, 取200 L移液枪头, 在下层垫入一层C8膜, 作为筛板, 将肽 段和填料悬浮混合液转移至枪头中, 通过离心将液体与填料分离。 用100L binding buffer清洗填料3次, 最后用100 L eluting buffer(0.5甲酸水溶液, 表示体积百分含 量)洗脱肽段, 重复两次, 收集洗脱液, 浓缩干燥后重溶于20 L 。

42、50mM碳酸氢铵水溶液中, 加 入100U PNGase F酶(New England BioLabs公司, 货号P0705S, 1U的定义是在37下在10微 升的总反应体积中在1小时内从10微克的RNase B(一种糖蛋白)中除去95的糖链所需的 酶量)酶切过夜, 去除N糖基化肽段上的糖链, 酶切结束后, 脱盐热干, 重溶于0.1(体积百 分含量)甲酸水溶液中, 质谱分析。 0058 步骤3、 液相色谱串联质谱分析 0059 Nano LC-MS/MS质谱鉴定在Easy nLC-1000纳升级液相色谱系统串联Q Exactive HF质谱仪(Thermo Fisher Scientific,。

43、USA)上完成, 将酶切产物热干后重溶于0.1(体积 百分含量)甲酸(TFA)水溶液中, 14,000g离心10min后取上清进样分析, 色谱条件为: C18预 柱; C18反相分析柱; 以600nL/min的流速进行梯度洗脱(流动相A为0.1FA水溶液,流动相B 为0.1FA-99.9ACN, 均表示体积百分含量; 流动相由所述流动相A和所述流动相B混合 而成), 梯度洗脱为: 0min, 6B; 0-8min(不含端点0), 6-9B; 8-24min(不含端点8), 9-14 B; 24-60min(不含端点24), 14-30B; 60-75min(不含端点75), 30-40B; 7。

44、5-78min(不含端 点78), 40-95B(解释说明:“0-8min(不含端点0), 6-9B” 表示从0到8分钟, 所述流动相B 在所述流动相中的比例从6线性递增到9; 其后类似, 所述流动相B的含量范围均表示相 应时间内从低值线性递增到高值)。 分离的样品经ESI喷雾离子源进入质谱分析, ESI源喷雾 电压为2.3kV, 离子传输管温度为320, 质谱数据采集在数据依赖模式下(Data-dependent acquisition,DDA)模式下进行, 设置300-1400Da范围一级质谱全扫描, 扫描分辨率120, 说明书 6/8 页 9 CN 110632323 A 9 000, 。

45、选择一级质谱中的信号最高的20个母离子经高能碰撞诱导解离模式(Higher-Energy Collisional Dissociation,HCD)后进行二级质谱分析, 分辨率为15,000, 离子注入时间为 35ms, 碰撞能量为35。 0060 步骤4、 完整O-GalNAc糖肽数据库检索 0061 首先利用ProteinWizard软件将得到的质谱raw文件转换成mgf文件, 此文件中包 含有所有O-GalNAc糖肽及非糖肽的二级谱图信息, 利用氧鎓离子碎片126Da、 138Da、 168Da、 186Da和204Da进行O-GalNAc谱图筛选(当谱图里同时含有这5种大小的氧鎓离子碎。

46、片则说 明这个谱图对应的肽段是糖肽, 该图谱为糖肽谱图; 否则视为非糖肽图谱)。 另外, 根据谱图 中是否含有唾液酸碎片274Da和292Da, 将谱图进一步分成含有唾液酸碎片谱图和非不含唾 液酸碎片谱图(当谱图里同时含有这两种大小的唾液酸碎片则说明该图谱为所述含有唾液 酸碎片的谱图; 反之, 则视为所述不含有唾液酸碎片的谱图), 利用Byonic软件进行数据库 检索, 参数设置如下: 最大漏切位点设为2, 固定修饰为Cysteine carbamidomethylation (半胱氨酸脲甲基化), 可变修饰为N-terminal acylation(N-端酰化)、 methionine ox。

47、idation(蛋氨酸氧化), 一级质量范围设为10ppm, 二级质量范围设为0.02Da, 针对不同的 谱图, 选用相应的糖型数据库, 其中, 含唾液酸碎片的谱图, 搜库时采用含唾液酸的糖型数 据库, 共27种O-GalNAc糖型, 不含唾液酸碎片的谱图, 搜库时采用不含唾液酸的糖型数据 库, 共43种糖型。 搜库结果中Byonic score设为最低300分, protein FDR设为1。 对搜库产 生的excel文件中spectra列表进行鉴定结果筛选, 规则为: 对所有spectra信息分条目进行 提取, 其中对数据提取限制规则为Byonic score300分; 去除反库结果; 存。

48、在糖基化修饰。 对提取到的条目进行数据整理, 包括保留时间数值、 肽段序列、 糖型组成。 将含唾液酸谱图 得到的搜库提取结果与非含唾液酸谱图得到的结果进行整合。 0062 选取3个样本评价发展的搜库方法, 结果如图1所示, 3个样本数据检索时间趋于一 致, 由最初单个样本需要大约120小时(没有进行谱图筛选, 用商品化的Byonic软件直接对 生成的质谱文件进行搜库)缩短至单个样本需要大约6小时。 因此, 通过此谱图分类检索策 略, 可以使数据检索时间缩短20倍, 大大的增加了数据检索的时效性。 0063 比对3个样本的搜库结果, 样本1直接搜库结果鉴定到332条O糖肽, 提取含有氧鎓 离子的。

49、谱图搜库结果鉴定到332条O糖肽, 含有唾液酸的谱图搜库结果鉴定到312条O糖肽, 不含有唾液酸的谱图搜库结果鉴定到3条O糖肽; 样本2直接搜库结果鉴定到409条O糖肽, 提 取含有氧鎓离子的谱图搜库结果鉴定到409条O糖肽, 含有唾液酸的谱图搜库结果鉴定到 361条O-糖肽, 不含有唾液酸的谱图搜库结果鉴定到4条O糖肽; 样本3直接搜库结果鉴定到 462条O糖肽, 提取含有氧鎓离子的谱图搜库结果鉴定到462条O糖肽, 含有唾液酸的谱图搜 库结果鉴定到392条O-糖肽, 不含有唾液酸的谱图搜库结果鉴定到2条O糖肽。 由结果可知, 提取含有氧鎓离子的谱图进行搜库结果与原始文件搜库结果几乎一致, 。

50、而进一步提取含有 唾液酸和不含有唾液酸的谱图进行搜库的整合鉴定数比提取含有氧鎓离子的谱图进行搜 库结果与原始文件搜库结果仅有略微下降, 但是搜库时间大幅缩短。 0064 实施例2、 利用色谱保留时间校正和精确荷质比进行O-GalNAc糖肽匹配及定量缺 失值填充 0065 步骤1-步骤4同实施例1。 0066 步骤5、 色谱保留时间校正和定量缺失值填充 说明书 7/8 页 10 CN 110632323 A 10 0067 对16例健康男性样本和20例健康女性样本raw文件进行Byonic数据库检索并提取 信息后, 进行36例样本中鉴定结果的保留时间预测。 校正方法如下: 首先, 对36个文件中。

展开阅读全文
内容关键字: 蛋白质 GalNAc 修饰 快速 深度 覆盖 新方法
关于本文
本文标题:蛋白质O-GalNAc修饰快速搜库和深度覆盖新方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11127479.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1