本申请是申请日为2011年07月14日,申请号为201180034158.5,发明名称为“结肠 直肠癌的诊断”的申请的分案申请。
技术领域
本发明涉及测定用于检测或诊断结肠直肠癌的生物标志物的存在和/或水平。本 发明还涉及包括用于测定这些生物标志物的存在和/或水平的试剂的诊断试剂盒和检测或 诊断结肠直肠癌的方法。
发明背景
结肠直肠癌(又称为结肠癌或肠癌)是世界范围内第二大最常见的癌症病因。存在 近百万结肠直肠癌病例的年发病率,其中年死亡率约500,000(澳大利亚的癌症:概述,2008 (CancerinAustralia:anoverview,2008))。不幸的是,30%至50%的患者在就诊时具有 隐性或显性转移并且一旦肿瘤已经转移预后是非常不良的,具有小于10%的五年存活率 (Etzioni等人,2003)。相比之下,当该肿瘤仍是局部性时就诊的患者中的大于90%将在5年 之后仍然活着并且被认为是可以治愈的。结肠直肠病变的早期检测将因此显著减少结肠癌 的影响(Etzioni等人,2003)。
目前用于诊断结肠直肠癌广泛使用的筛选测定是排泄物隐血试验(FOBT)、柔性乙 状结肠镜检查和结肠镜检查(Lieberman,2010)。FOBT具有相对低的特异性而导致高假阳性 率。所有阳性FOBT因此必须接着用结肠镜检查。采样由个体在家完成并且要求至少两个连 续排泄物样品待分析以便达到最佳灵敏度。该FOBT的一些变体还要求在采样之前饮食限 制。FOBT对于未渗透进肠的早期癌性病变也缺乏灵敏度并且如上所述,这些是治疗最成功 的病变。
虽然FOBT筛选确实引起由于结肠直肠癌的死亡率的降低,但是它受制于低依从率 (30%-40%),该低依从率最可能是由于该试验的令人不快的性质,这限制了它作为筛选工 具的有用性。结肠镜检查是现行金标准并且具有大于90%的特异性,但是它是侵入性的并 且昂贵的且具有小但有限的并发症风险(每1000程序2.1)(Levin,2004)。研制快速、特异、 便宜的基于血液的测定将克服其它筛选试验中常见的依从性问题(Tonus,2006;Hundt等 人,2007)并且将更容易被接受作为大的筛选测定的部分。
发明概述
诸位发明人研究了超过60种与结肠直肠癌有关的生物标志物,但是发现这些生物 标志物没有一个能单独适合作为一种诊断试验。出人意料地,据发现测定受试者的样品中 至少两种与结肠直肠癌有关的生物标志物的存在和/或水平允许检测或诊断在任何疾病阶 段的结肠直肠癌。测定至少两种生物标志物的存在和/或水平有利地提供一种至少在灵敏 度和特异性方面与该FOBT相媲美的诊断试验。
因此,在一个方面中,本发明提供一种用于诊断或检测受试者体内的结肠直肠癌 的方法,该方法包括:
i)测定该受试者的样品中的选自IL-8、IGFBP2、MAC2BP、M2PK、IL-13、DKK-3、 EpCam、MIP1β、TGFβ1以及TIMP-1的至少两种生物标志物的存在和/或水平,
其中这两种生物标志物的存在和/或水平指示了结肠直肠癌。
在一个实施方案中,该方法包括测定选自M2PK、EpCam、IL-13、DKK-3、IL-8以及 IGFBP2的两种生物标志物的存在和/或水平。
在另一个实施方案中,该方法包括测定这些生物标志物中的至少三种的存在和/ 或表达水平。
在一个实施方案中,这三个生物标志物是选自M2PK、EpCam、IL-13、DKK-3、IL-8、 IGFBP2、MIP1β、TGFβ1以及MAC2BP。
在一个具体的实施方案中,该方法包括测定三种生物标志物的存在和/或水平,其 中这三种生物标志物是:
i)DKK-3、M2PK以及IGFBP2;
ii)M2PK、IGFBP2以及EpCAM;
iii)M2PK、MIP-1β以及TGFβ1;或
iv)IL-8、IL-13和MAC2BP。
在另一个实施方案中,该方法包括测定这些生物标志物中的至少四种的存在和/ 或表达水平。
在一个具体的实施方案中,该方法包括测定四种生物标志物的存在和/或水平,其 中这四种生物标志物是:
i)DKK-3、M2PK、MAC2BP以及IGFBP2;
ii)IL-8、IL-13、MAC2BP以及EpCam;
iii)DKK3、M2PK、TGFβ1以及TIMP-1;
iv)M2PK、MIP-1β、IL-13以及TIMP-1;或
v)IL-8、MAC2BP、IGFBP2以及EpCam。
在又一个实施方案中,该方法包括测定这些生物标志物中的至少五种的存在和/ 或水平。
在一个具体的实施方案中,这五种生物标志物是IL-8、IGFBP2、MAC2BP、M2PK以及 IL-13。
在另一个实施方案中,该方法包括测定这些生物标志物中的至少六种的存在和/ 或水平。
在另一个实施方案中,该方法包括测定这些生物标志物中的至少七种的存在和/ 或水平。
在一个具体的实施方案中,这七种生物标志物是:
i)IL-8、IGFBP2、MAC2BP、M2PK、IL-13、DKK-3以及TGFβ1;或
ii)IL-8、IGFBP2、MAC2BP、M2PK、IL-13、EpCam以及MIP-1β。
在又一个实施方案中,该方法包括测定这些生物标志物中的至少八种的存在和/ 或水平。
在一个实施方案中,该方法包括测定这些生物标志物中的至少九种的存在和/或 水平。
在又一个实施方案中,该方法包括测定这些生物标志物中的至少十种的存在和/ 或水平。
在另一个实施方案中,该方法包括测定如在表7至18的任一者中提供的生物标志 物的组合的存在和/或水平。
在另一个实施方案中,该方法包括检测选自以下的至少一种另外的生物标志物的 存在和/或水平:IGF-I、IGF-II、IGF-BP2、双调蛋白、VEGFA、VEGFD、MMP-1、MMP-2、MMP-3、 MMP-7、MMP-9、TIMP-1、TIMP-2、ENA-78、MCP-1、MIP-1β、IFN-γ、IL-10、IL-13、IL-1β、IL-4、 IL-8、IL-6、MAC2BP、肿瘤M2丙酮酸激酶、M65、OPN、DKK-3、EpCam、TGFβ-1以及VEGFpan。
在一个实施方案中,该方法以至少50%的灵敏度诊断或检测结肠直肠癌。
在另一个实施方案中,该方法以至少66%的灵敏度诊断或检测结肠直肠癌。
在又一个实施方案中,该方法以至少77%的灵敏度诊断或检测结肠直肠癌。
在一个实施方案中,该方法以至少75%的特异性诊断或检测结肠直肠癌。
在一个实施方案中,该方法以至少80%的特异性诊断或检测结肠直肠癌。
在另一个实施方案中,该方法以至少90%的特异性诊断或检测结肠直肠癌。
在又一个实施方案中,该方法以至少95%的特异性诊断或检测结肠直肠癌。
在另一个实施方案中,该方法以至少50%的灵敏度和至少95%的特异性诊断或检 测杜克斯A期结肠直肠癌。
在又一个实施方案中,该方法以至少60%的灵敏度和至少80%的特异性诊断或检 测杜克斯A期结肠直肠癌。
在另一个实施方案中,该方法以至少50%的灵敏度和至少90%的特异性诊断或检 测杜克斯A期结肠直肠癌。
技术人员将会理解杜克斯A期对应于TNM分类T1、N0、M0和T2、N0、M0。
因此在一个实施方案中,该方法以至少50%的灵敏度和至少95%的特异性诊断或 检测TNM分类T1、N0、M0或T2、N0、M0结肠直肠癌。
在又另一个实施方案中,该方法以至少60%的灵敏度和至少80%的特异性诊断或 检测TNM分类T1、N0、M0或T2、N0、M0结肠直肠癌。
在另一个实施方案中,该方法以至少50%的灵敏度和至少90%的特异性诊断或检 测TNM分类T1、N0、M0或T2、N0、M0结肠直肠癌。
用于检测多肽的任何适合的技术可以用于本发明的方法中。在一个实施方案中, 该方法包括使该样品与结合一种生物标志物多肽的至少一种化合物接触。可替代地,该方 法包括通过质谱分析法检测这些多肽。
在一个具体实施方案中,该化合物被可检测地标记。
在另一个实施方案中,该化合物是一种抗体。
在一个实施方案中,该化合物被结合至固相支持体。
在本发明的方法中,测定该生物标志物的存在和/或水平可以包括测定编码该生 物标志物的一种多核苷酸(如一种生物标志物基因转录物)的存在和/或水平。因此,在一个 实施方案中,这些生物标志物是多核苷酸。
在本发明的方法的又另一实施方案中,该方法包括:
i)测定该受试者的样品中的这些生物标志物的存在和/或水平;以及
ii)将这些生物标志物的存在和/或水平与一种对照进行比较,其中该样品中与该 对照不同的一种存在和/或水平指示了结肠直肠癌。
在一个实施方案中,该样品包括血液、血浆、血清、尿液、血小板、巨核细胞 (megakaryocytes)或排泄物。
在另一个方面中,本发明提供一种治疗方法,该方法包括:
(i)根据本发明的方法诊断或检测结肠直肠癌;以及
(ii)给予或推荐一种用于治疗结肠直肠癌的治疗剂。
在又另一个方面中,本发明提供一种用于监测受试者体内的结肠直肠癌的治疗功 效的方法,该方法包括针对结肠直肠癌治疗该受试者并且然后检测该受试者的样品中的选 自IL-8、IGFBP2、MAC2BP、M2PK、IL-13、DKK-3、EpCam、MIP1β、TGFβ1以及TIMP-1的至少两种生 物标志物的存在和/或水平,其中当与治疗之前相比在治疗之后这些多肽的缺乏和/或表达 水平的减少指示了有效治疗。
在另一个方面中,本发明提供一种用于诊断或检测结肠直肠癌的至少两种化合物 的阵列,其中这些化合物各自结合选自IL-8、IGFBP2、MAC2BP、M2PK、IL-13、DKK-3、EpCam、 MIP1β、TGFβ1以及TIMP-1的一种不同的生物标志物多肽。
在又另一个方面中,本发明提供一种用于诊断或检测受试者体内的结肠直肠癌的 试剂盒,该试剂盒包括各自结合选自IL-8、IGFBP2、MAC2BP、M2PK、IL-13、DKK-3、EpCam、MIP1 β、TGFβ1以及TIMP-1的一种不同生物标志物多肽的两种化合物。
贯穿本说明书,“包含(comprise)”一词或其变化形式(例如“包含了(comprises)” 或“包含着(comprising)”)应被理解为意指包括所陈述的要素、完整的事物或步骤、或者多 个要素、多个完整的事物或多个步骤的群组,但不排除任何其他要素、完整的事物或步骤、 或者多个要素、多个完整的事物或多个步骤的群组。
如将是显而易见的,本发明的一个方面的优选特点和特征可以应用于本发明的许 多其他方面。
通过以下非限制性实例并且参考这些附图在下文中描述本发明。
附图说明
图1.在研究3中使用逻辑回归模型发现46种潜在蛋白质生物标志物的一种最优组 合,从而产生一组七个生物标志物并且被图解为一个ROC曲线(黑色曲线)。使用“逐一剔除 法”交叉验证评估这个“组”在独立数据上的性能(灰色曲线)。在筛选试验中关注的80%和 90%特异性工作点绘制垂直线。在表5中给出性能统计。
图2.通过每个阶段的ROC曲线图解一种七个生物标志物的模型从正常受试者中鉴 定处于每个杜克斯分期(DukesStage)的结肠直肠癌患者的性能。研究3a.的A(红色)-A期、 B(绿色)-B期、C(蓝色)-C期和D(黑色)D期。在表6中给出性能特征。
图3.当对来自研究4(又称为重新测量的研究3)的生物标志物结果进行成对建模 时,共有5对(选自以上10种生物标志物的清单的可能的45种组合中)可以显示在处于95% 的特异性时产生高于52%的灵敏度。这些成对生物标志物组合的性能被图解为ROC曲线(n =5曲线)。在表7中给出性能特征。
图4.从研究4数据生成的在处于95%特异性时具有至少50%的灵敏度的3个生物 标志物的模型的一个实例。存在968种可能的3至10个生物标志物的组合并且那些组合的近 似一半显示出在处于90%特异性时至少50%灵敏度的性能。
图5.图解从研究4数据生成的在处于95%特异性时具有至少50%的灵敏度的3至 10个生物标志物的所有组合的ROC曲线(n=来自可能的968个模型中的485个交叉验证曲 线)。
图6.最佳的485个模型中每个生物标志物的频率。这些BM表示在处于95%特异性 时给出至少50%的灵敏度的所有血清模型。所有10个生物标志物在这些有用模型中的高表 现度证实了我们选择的这10个生物标志物的一致性。
图7.从研究4数据生成的一种5个生物标志物的模型被图解为ROC曲线(黑色)和交 叉验证ROC曲线(灰色)。当包括疾病的所有阶段并且当交叉验证给出64%的灵敏度时这个 模型显示在处于95%特异性时68%的灵敏度。包括的生物标志物是[IL-8、IGFBP2、Mac2BP、 DKK-3和M2PK]。
图8.从研究4数据生成的一种6个生物标志物的模型被图解为ROC曲线(黑色)和交 叉验证ROC曲线(灰色)。当包括疾病的所有阶段并且当交叉验证给出67%的灵敏度时这个 模型显示在处于95%的特异性时77%的灵敏度。包括的生物标志物是[IL-8、IGFBP2、 Mac2BP、DKK-3、TGFβ1&M2PK]。
图9.示出从研究3a数据生成的两个可替代的七个生物标志物的模型。一个针对高 特异性进行了优化(黑色/新)并且示出针对曲线下面积进行了优化的一个替代方案或模型 (灰色/旧)。处于90%特异性时该新模型的灵敏度是72%并且该较旧模型的灵敏度是77%。 包括的生物标志物是如下:
新:IL8、IGFBP2、s90MAC2BP、M2PK、DKK-3、IL-13&TGFβ,
旧:IL8、IGFBP2、s90MAC2BP、M2PK、EpCAM、IL13&MIP-lb。
图10.从研究4数据生成的一种七个生物标志物的模型被图解为ROC曲线(黑色)和 交叉验证ROC曲线(灰色)。这种模型显示在处于95%的特异性时84%的灵敏度。包括的生物 标志物是[M2PK血清、IL8血浆、TGFβ1血清、IGFBP2血浆、Mac2BP血清、TIMP1血浆和Dkk3血 浆]。
图11.图解了示出针对每个杜克斯分期的一种3个生物标志物的模型的性能的交 叉验证ROC曲线。这一数据证实了用于检测在疾病进展的不同阶段的癌症的三个生物标志 物(DKK-3、M2PK和IGFBP2)的选择的有效性。该数据表明如果在A期使用这三个生物标志物, 该试验仍将实现在处于95%特异性时64%的显著灵敏度,这可与在晚期疾病时实现的灵敏 度(79%)相匹敌。换言之该三生物标志物组将发现允许早期检测的早期疾病状态。包括的 生物标志物是Dkk3、M2PK和、IGFBP2。
序列表的略语表
SEQIDNO:1-IL-8的氨基酸序列
SEQIDNO:2-IGFBP2的氨基酸序列
SEQIDNO:3-MAC2BP的氨基酸序列
SEQIDNO:4-M2PK变体1的氨基酸序列
SEQIDNO:5-M2PK变体2的氨基酸序列
SEQIDNO:6-M2PK变体3的氨基酸序列
SEQIDNO:7-IL-13的氨基酸序列
SEQIDNO:8-DKK-3变体1的氨基酸序列
SEQIDNO:9-DKK-3变体2的氨基酸序列
SEQIDNO:10-DKK-3变体3的氨基酸序列
SEQIDNO:l1-EpCam的氨基酸序列
SEQIDNO:12-MIP-1β的氨基酸序列
SEQIDNO:13-TGFβ1的氨基酸序列
SEQIDNO:14-TIMP-1的氨基酸序列
具体实施方式
一般技术和定义
除非另外确切地定义,否则在此所用的所有技术和科学术语应当被认为具有如由 本领域(例如在细胞培养、分子遗传学、免疫学、免疫组织化学、蛋白质化学和生物化学中) 的普通技术人员普遍理解的相同意义。
除非另外指明,否则本发明中使用的重组蛋白、细胞培养和免疫技术是本领域的 普通技术人员熟知的标准程序。在以下来源中的文献中描述和解释这类技术,如J.Perbal, 分子克隆的实用指南,约翰威利父子出版社(1984)(J.Perbal,APracticalGuideto MolecularCloning,JohnWileyandSons(1984)),J.Sambrook等人,分子克隆:实验室手 册,第三版,冷泉港实验室出版社(2001)(J.Sambrooketal.,MolecularCloning:A LaboratoryManual,3rdedn,ColdSpringHarbourLaboratoryPress(2001)), R.Scopes,蛋白质纯化-原理和实践,第三版,施普林格出版社(1994)(R.Scopes,Protein Purification-PrincipalsandPractice,3rdedn,Springer(1994)),T.A.Brown(编辑), 分子生物学精要:实用方法,卷1和卷2,IRL出版社(1991)(T.A.Brown(editor),Essential MolecularBiology:APracticalApproach,Volumes1and2,IRLPress(1991)), D.M.Glover和B.D.Hames(编辑),DNA克隆:实用方法,卷1至卷4,IRL出版社(1995和1996) (D.M.GloverandB.D.Hames(editors),DNACloning:APracticalApproach,Volumes 1-4,IRLPress(1995and1996))和F.M.Ausubel等人(编辑),分子生物学实验指南,Greene Pub.联合公司和威立-国际科学出版社(1988,包括直到目前的所有更新)(F.M.Ausubelet al.(editors),CurrentProtocolsinMolecularBiology,GreenePub.Associatesand Wiley-Interscience),EdHarlow和DavidLane(编辑)抗体:实验室手册,冷泉港实验室出 版社(1988)(EdHarlowandDavidLane(editors)Antibodies:ALaboratoryManual, ColdSpringHarbourLaboratory,(1988))以及J.E.Coligan等人(编辑)免疫学实验室指 南,约翰威利父子出版社(包括直到目前的所有更新)(J.E.Coliganetal.(editors) CurrentProtocolsinImmunology,JohnWiley&Sons)。
如在此所使用的术语“结肠直肠癌”(还可以称为“结肠癌”、“肠癌”或“直肠癌”)是 指起源于内衬大肠和/或直肠的上皮细胞的所有形式的癌症。
如在此所使用的“生物标志物”是指由受试者产生的有用于将患有结肠直肠癌的 受试者与正常或健康的受试者进行区分的任何分子,如一个基因、基因转录物(例如mRNA)、 肽或蛋白质或其片段。
如在此所使用的术语“诊断(diagnosis)”及其变体(如,但不限于,“进行诊断 (diagnose)”“被诊断(diagnosed)”或“诊断的(diagnosing)”)不应当被限于临床状态的初 步诊断,而应当被认为包括复发性疾病的诊断。
如在此所使用的术语“受试者”是指可能患结肠直肠癌的任何动物并且包括动物 如哺乳动物(例如人)或非人哺乳动物(如猫和狗)、实验室动物(如小鼠、大鼠、兔或豚鼠)和 家畜动物。在一个优选实施方案中,该受试者是人类。
该“样品”可以是任何适合的类型并且可以是指(例如)其中可以检测生物标志物 的存在或水平的一种材料。优选地,从该受试者得到该样品这样使得可以在体外进行生物 标志物的存在和/或水平的检测。可替代地,可以在体内检测生物标志物的存在和/或水平。 可以如直接从该源得到的使用该样品或在至少一步的(部分)纯化之后使用。可以在不会干 扰本发明的方法的任何方便的培养基中制备该样品。典型地,该样品是一种水溶液、生物流 体、细胞或组织。优选地,该样品是血液、血浆、血清、尿液、血小板、巨核细胞或排泄物。预处 理可以涉及(例如)从血液制备血浆、稀释黏性流体等等。处理的方法可以涉及过滤、蒸馏、 分离、浓缩、干扰组分的失活和试剂的添加。在试验之前生物样品的选择和预处理是本领域 熟知的并且不需要进一步描述。
如在此所使用的术语“治疗的(treating)”、“进行治疗(treat)”或“治疗 (treatment)”包括给予足以减少或延迟结肠直肠癌的发病或进展或足以减少或消除结肠 直肠癌的至少一种症状的治疗有效量的一种化合物。
生物标志物
本发明人显示了测定受试者的样品中的至少两个生物标志物的存在和/或水平允 许以可比得上或大于用FOBT实现的特异性和灵敏度的特异性和灵敏度检测或诊断结肠直 肠癌,在杜克斯A期的早期检测或者在一些晚期(如杜克斯B期或C期或D期)。在本发明的这 些方法中有用的这至少两种生物标志物是选自IL-8(白细胞介素-8)、IGFBP2(胰岛素样生 长因子结合蛋白-2)、MAC2BP(MAC2-结合蛋白;血清蛋白90K)、M2PK(肌肉丙酮酸激酶2,丙酮 酸激酶3)、IL-13(白细胞介素-13)、DKK-3(dickkopf同系物,3)、EpCAM(上皮细胞黏附分 子)、MIP1β(巨噬细胞炎性蛋白1β、CCL4、MIPlβ)、TGFβ1(转化生长因子β1,TGFβ1)和TIMP-1 (金属蛋白酶1的组织抑制剂)。提及这些生物标志物的任一者包括提及所有多肽和多核苷 酸变体,如由本领域的普通技术人员已知的亚型和转录物变体。在表1中提供每个这些生物 标志物中的代表性序列的NCBI登录号。
表1.代表性生物标志物序列的NCBI登录号。
检测或诊断结肠直肠癌
从前述描述应当清楚的是本发明的诊断方法可以涉及一定程度的量化以便测定 患者样品中的生物标志物的水平。通过包括适当的对照样品来容易地提供这种量化。
在一个实施方案中,本发明的方法中包括内部对照。一种优选的内部对照是取自 一个或多个健康个体的一种或多种样品。
在本上下文中,术语“健康个体”应当被认为是指已知没有患结肠直肠癌的一个个 体,这种知识是源自该个体的临床数据,包括但不限于与在此描述的不同的一种诊断测定。
正如对本领域的普通技术人员将是已知的,当进行的每个测定中不包括内部对照 时,该对照可以源自已确定的数据集。
涉及这些对照受试者的数据优选地选自下组,该组由以下各项组成:
1.包括对已知患有结肠直肠癌的一个典型受试者群体的生物标志物的存在或表 达水平的测量的一个数据集;
2.包括对被测试的该受试者的生物标志物的存在和/或水平的测量的一个数据 集,其中已经在以前进行过所述测量,例如当已知该受试者健康时或,在患有结肠直肠癌的 受试者的情况下,当该受试者被诊断或在疾病进展的早期阶段时。
3.包括对一个健康个体或一个健康个体的群体的生物标志物的存在或水平的测 量的一个数据集;以及
4.包括对一个正常个体或一个正常个体的群体的生物标志物的存在或水平的测 量的一个数据集。
在本上下文中,关于已知患有结肠直肠癌的受试者的术语“典型群体”应当被认为 是指被诊断患有结肠直肠癌的受试者的群体或样品,该群体或样品是结肠直肠癌患者范围 的代表。这不应被认为是要求该群体中的形态学或临床病理学参数的严格正态分布,因为 在这样一种分布中一些变化是可允许的。优选地,“典型群体”将显示处于疾病进展的不同 阶段的一系列的结肠直肠癌。特别优选的是“典型群体”显示出如在此描述的一组受试者的 表达特征。
术语“正常个体”应当被认为是指在样品中未表达生物标志物或以低水平表达生 物标志物的一个个体。正如对于本领域的普通技术人员将是已知的,从该群体的一个足够 大的样品得到的数据将归一化,从而允许生成用于测定具体生物标志物的平均水平的一个 数据集。
基于在此提供的传授,本领域的普通技术人员无需过度的试验而能够容易地测定 用于在本发明的任何诊断测定中比较的基线。
结合一种生物标志物的化合物当用于诊断时可以被连接至一种诊断剂(如一种可 检测的标记物)以便允许容易地检测在体外或在体内的结合事件。适合的标记物包括放射 性同位素、染料标志物或用于检测和/或定位靶分子的其它成像试剂。连接至一种可检测的 标记物的化合物可以与适合的体内成像技术一起使用,如(例如)放射学、荧光检查、核磁共 振成像(MRI)、CAT扫描、正电子发射断层摄影术(PET)、计算机化断层摄影术等。
本发明的诊断方法能够以至少可与FOBT相匹敌或大于FOBE的灵敏度和特异性诊 断或检测结肠直肠癌。正如本领域的普通技术人员将会理解,灵敏度是指诊断测试中被正 确地鉴定为患有结肠直肠癌的实际阳性的比例。特异性测量被正确地鉴定为没有患结肠直 肠癌的阴性的比例。在一个实施方案中,本发明的这些方法能够以至少50%、60%或66%、 或至少77%、80%、83%、85%、86%、87%、88%、89%、90%、或至少93%的灵敏度诊断或检 测结肠直肠癌。在另一个实施方案中,本发明的这些方法能够以至少80%、或至少85%或至 少90%、或至少95%的灵敏度诊断或检测结肠直肠癌。
在一个实施方案中,本发明的这些方法能够以至少75%、80%、85%、90%、91%、 92%、93%、94%或至少95%的特异性诊断或检测结肠直肠癌。
有利地,本发明的这些方法能够以大于该FOBT的灵敏度检测在所有这些杜克斯分 期的结肠直肠癌。在杜克斯A期中,肿瘤已经渗透进入但没有贯穿肠壁。在杜克斯B期中,肿 瘤已经渗透贯穿肠壁但还不涉及任何淋巴结。在杜克斯C期中,癌症涉及区域淋巴结。在杜 克斯D期中,存在远处转移(例如)至肝或肺。在一个实施方案中,本发明的这些方法能够以 至少80%的灵敏度诊断或检测处于任何杜克斯分期的结肠直肠癌。
正如本领域的普通技术人员已知,存在本领域已知的用于分期癌症的其它系统。 一个实例是由美国癌症联合会使用的恶性肿瘤的TMN分类(TNM)(AJCC:结肠和直肠,Edge等 人编辑;AJCC癌症分期手册,第七版。纽约,NY:施普林格出版社,2010,143-164页(AJCC: Colonandrectum,inEdgeetal.,eds;AJCCCancerStagingManual,7thed.New York,NY:Springer,2010,pp:143-164))。另一个实例是修正的Astler-Coller分类(MAC)。
因此,本领域的普通技术人员应当认识到这些杜克斯分期对应于某些TNM分类。例 如,杜克斯A期对应于T1、T2、N0和M0;杜克斯B期对应于T3、T4a、T4b、N0以及M0;并且杜克斯C 期对应于i)T1-T2、N1/N1c、M0;ii)T1、N2a以及M0;iii)T3-T4a、N1/N1c以及M0;iv)T2-T3、 N2a以及M0;v)T1-T2、N2b以及M0;vi)T4a、N2a以及M0;vii)T3-T4a、N2b以及M0;以及viii) T4b、N1-N2以及M0。因此,本领域的普通技术人员将会理解提及如在此使用的杜克斯分期包 括提及如本领域已知的该对应TMN分类。
蛋白检测技术
在一个实施方案中,在一种患者样品中检测生物标志物多肽,其中该样品中的该 多肽的存在和/或水平指示了结肠直肠癌。例如,该方法可以包括使源自该受试者的一种生 物样品与一种能够结合至生物标志物多肽的化合物接触,并且检测该化合物与该生物标志 物多肽之间的复合物的形成。如在此所使用的术语“生物标志物多肽”包括生物标志物多肽 的片段,包括(例如)该生物标志物多肽的免疫原片段和表位。
在一个实施方案中,结合该生物标志物的化合物是一种抗体。
如在此所使用的术语“抗体”包括能够结合一种表位决定簇的完整分子和包含其 片段或由其片段组成的分子(例如,Fab、F(ab’)2、Fv和scFv)和工程化的变体(包括双抗体、 三抗体、微抗体以及单域抗体)。因此,抗体可以作为完整的免疫球蛋白存在或作为呈多种 形式的修饰存在。
在另一个实施方案中,在患者样品中检测一种针对生物标志物多肽的抗体,其中 该样品中的该抗体的存在和/或水平指示了结肠直肠癌。
在此思考的优选检测系统包括用于检测从人类受试者分离的生物样品中的蛋白 或抗体的任何已知测定,例如,SDS/PAGE、等电聚焦、2维凝胶电泳(包括SDS/PAGE和等电聚 焦)、免疫测定、流式细胞计量术(例如荧光激活的细胞分选(FACS))、使用一种抗体或非抗 体化合物(例如,一种小分子(例如该蛋白的一种化学化合物、激动剂、拮抗剂、别构调节物、 竞争性抑制剂或非竞争性抑制剂))的基于检测的系统。根据这些实施方案,可以以适合于 蛋白检测的任何标准固相或溶液相测定形式使用该抗体或小分子。本发明清楚地包括光学 或荧光检测,例如,使用质谱分析法、MALDI-TOF、生物传感器技术、渐消光纤(evanescent fiberoptics)或荧光共振能量转移。还考虑适合在大量样品的高通量筛选中使用的测定 系统,例如,高通量光谱共振法(例如,MALDI-TOF、电喷射MS或纳米电喷射MS)。另一种适合 的蛋白检测技术涉及多重反应监测(MRM)在LC-MS(LC/MRM-MS)中的使用(Anderson和 Hunter,2006)。
免疫测定形式是特别适合的,例如,选自下组的免疫测定形式,该组由以下各项组 成:免疫印迹、蛋白质印迹、斑点印迹、酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、酶 免疫测定。使用荧光共振能量转移(FRET)、同位素编码亲和标记物(ICAT)、基质辅助激光解 析/电离飞行时间(MALDI-TOF)、电喷射离子化作用(ESI)、生物传感器技术、渐消光纤技术 或蛋白质芯片技术的修改免疫测定也是有用的。
核酸检测技术
可以使用允许定性和/或定量评定样品中的生物标志物多核苷酸的水平的任何适 合的技术。如在此所使用的术语“核酸分子”或“多核苷酸”是指一种寡核苷酸、多核苷酸或 其任何片段。
可以通过参考一种标准对照或在健康组织中发现的对照水平进行比较。例如,可 以通过RNA印迹法和/或RT-PCR测定转录基因的水平。随着定量(实时)PCR的出现,可以通过 使用针对所关注基因的适当引物实现基因表达的定量分析。可以在基因阵列上对该核酸进 行标记和杂交,在这种情况下该基因浓度将与该阵列中生成的放射性或荧光信号的强度成 正比。
用于直接测序核苷酸序列的方法对于本领域的普通技术人员是熟知的并且可以 在(例如)Ausubel等人编辑,精编分子生物学实验指南,第3版,威利出版社,(1955) (Ausubeletal.,eds.,ShortProtocolsinMolecularBiology,3rded.,Wiley, (1995))和Sambrook等人,分子克隆,第3版,冷泉港实验室出版社,(2001)(Sambrooket al.,MolecularCloning,3rded.,ColdSpringHarborLaboratoryPress,(2001))中发 现。可以通过任何适合的方法进行测序,例如,双脱氧测序法、化学测序或其变化。直接测序 具有测定具体序列的任何碱基对中的变化的优点。
可以用于进行本发明的其它PCR方法包括基于杂交的PCR检测系统、TaqMan测定 (US5,962,233)和分子信标测定(US5,925,517)。
可以从用于测试的该样品分离核酸。适合的方法对于本领域的普通技术人员将是 已知的。例如,可以使用常规程序(如由QIAGEN技术公司提供的)从待分析的样品分离RNA。 然后使用逆转录酶将这种RNA逆转录成DNA并且然后可以使用特异性引物通过PCR技术将所 关注的DNA分子扩增。
还可以对患者样品直接进行诊断程序。杂交或扩增测定,例如,DNA或RNA印迹分 析、免疫组织化学、单链构象多态性分析(SSCP)和PCR分析是在这方面有用的技术。如果需 要,可以将靶核酸或探针核酸固定至一种固相支持体,如微量滴定板、薄膜、聚苯乙烯珠、玻 片或其它固相。
试剂盒
本发明提供用于诊断或检测结肠直肠癌的试剂盒。如上所讨论的,这类试剂盒可 以适合用于检测核酸种类,或可替代地可以用于检测多肽基因产物。
对于多肽的检测,抗体将最典型地被用作试剂盒的组分。然而,能够特异性地结合 至一种生物标志物基因产物的任何试剂将是在本发明的这个方面中有用的。这些试剂盒的 其它组分将典型地包括标记物、第二抗体、底物(如果该基因是一种酶)、抑制剂、辅助因子 和对照基因产物制剂以便允许使用者量化表达水平和/或评定该诊断试验是否正确地运 行。基于酶联免疫吸附测定(ELISA)的测试和竞争性ELISA测试是可以使用试剂盒组分由本 领域的普通技术人员容易地进行的特别适合的测定。
可任选地,该试剂盒进一步包括用于检测一种抗体结合至一种生物标志物多肽的 工具。这类工具包括一种报道分子,例如,一种酶(如辣根过氧化物酶或碱性磷酸酯酶)、一 种染料、一种放射性同位素、一种发光基团、一种荧光基团、生物素或一种胶体微粒(如胶体 金或硒)。优选地这样一种报道分子直接连接至该抗体。
在又另一个实施方案中,试剂盒可以另外包括一种参比样品。在一个实施方案中, 参比样品包括一种由抗体检测的多肽。优选地,该多肽具有已知浓度。这样一种多肽特别用 作为一种标准。因此,可以使用在此描述的一种诊断测定检测这样一种多肽的各种已知浓 度。
对于核酸的检测,这类试剂盒可以包括包含一种寡核苷酸探针的一个第一容器, 如一个小瓶或塑料管或微量滴定板。这些试剂盒可任选地包括装有引物的一个第二容器。 该探针可以是可与DNA杂交的,该DNA的表达的改变是与结肠直肠癌相关并且这些引物对扩 增这种DNA是有用的。还可以(例如)使用阵列研发包括一种固定于固相支持体的寡核苷酸 探针的试剂盒(参见期刊增刊21(1)自然遗传学,1999(seesupplementofissue21(1) NatureGenetics,1999))。
对于核酸的PCR扩增,与如在此描述的一种生物标志物基因的至少一个部分互补 的核酸引物可以包括于试剂盒中。这组引物典型地包括能够特异性扩增DNA的至少两种寡 核苷酸,优选地是四种寡核苷酸。可以包括将允许定量PCR测定的荧光标记的寡核苷酸(例 如,TaqMan化学,分子信标(MolecularBeacons))。还将包括用于扩增该DNA的适合的酶。
出于比较或验证的目的可以包括对照核酸。这类对照可以或者是从健康组织或从 健康个体分离的RNA/DNA,或者是mRNA水平不受结肠直肠癌影响的管家基因,如β-肌动蛋白 或GAPDH。
回归算法和统计
为了研发适合用于诊断或检测结肠直肠癌的一组生物标志物,诸位发明人在一种 统计模型中分析了众多生物标志物。一个测试的性能中的这种改善有时称为“样本内(in- sample)”性能。一个测试的公正评价要求它的评定使用样本外(out-of-sample)受试者,即 没有包括于初始预测模型的构建中的受试者。这是通过使用交叉验证评定该测试的性能实 现。
针对统计显著性的测试包括线性和非线性回归,包括ANOVA、克-瓦氏(Kruskal- Wallis)、威尔科克森(Wilcoxon)、曼-惠特尼(Mann-Whitney)和优势比、贝叶斯(Baysian) 概率算法。然而随着测量的生物标志物的数量增加,总体上可以更方便地使用一种更尖端 技术,仅举几例如随机森林(RandomForests)、简单逻辑、贝叶斯网(BayesNet)。
例如,可以采用贝叶斯概率。在这种情况下可以使用一种10-倍交叉验证来评价所 讨论的这些模型的“样本外”性能。对于在考虑中的生物标志物的每个组合,可以将该数据 随机地分成10个子样本,每个具有类似比例的健康受试者和处于疾病的每个阶段的受试 者。进而,可以排除每个子样本,并且可以使用剩余90%的受试者构建逻辑模型。然后可以 使用这种模型针对该排除的子样本来评估癌症的概率,从而提供“样本外”性能的评估。通 过针对剩余9个子样品重复这样,可以从该研究数据本身评估“样本外”性能。然后将这些样 品外预测的概率与这些受试者的实际疾病状况进行比较以便创建一种受试者操作特征 (ReceiverOperatingCharacteristic,ROC)曲线,从该曲线可以评估处于95%特异性的 交叉验证灵敏度。
使用交叉验证(或任何其它方法)的“样本外”性能的每个评估,虽然无偏差,但对 它具有一种可变性要素。因此模型的秩评定(基于生物标志物组合)可以仅指示这类模型的 相对性能。然而能够被用于大量组合中以生成如通过“样本外”性能评估证实的一种诊断试 验的一组生物标志物几乎肯定地在它本身内包括将经受重复评估的生物标志物组合。
许多不同组合可以作为诊断试验,这些试验证明是有用和有成本效益的并且对于 给定特异性具有可接受的灵敏度。作为一个实例,考虑这五个生物标志物:IL-8、IGFBP2、 MAC2BP、M2PK和DKK-3。使患有癌症的受试者与健康对照区分开的一种模型可以是如下:
这里p表示个人患有结肠直肠癌的概率。每个Ci是个人的血浆(或血清)中的浓度 生物标志物i的对数。每个beta(β)是在藉以测量这一生物标志物的这些浓度单位下施加至 该生物标志物的系数—βo是“偏置距”或“截距”。这种线性逻辑模型对于在此呈现的所有结 果是常见的,但是远非可以对一种生物标志物浓度的组合建模以预测癌症的概率的唯一方 式。
将同样可适用的其它线性或非线性逻辑算法包括随机森林(RandomForest)、 ANOVA、t检验、费舍尔分析(Fisheranalysis)、支持向量机(SupportVectorMachine)、微 阵列数据的线性模型(LIMMA)和/或微阵列数据的有效性分析(SAM)、最佳优先(Best First)、贪心分段(GreedyStepwise)、朴素贝叶斯(NaiveBayes)、线性正向选择(Linear ForwardSelection)、分散搜索(ScatterSearch)、线性判别式分析(LDA)、逐步逻辑回归 (StepwiseLogisticRegression)、受试者操作特性和分类树(CT)。
因此,根据本说明书的传授,本领域的普通技术人员将认识到可以通过选择如在 此描述的这些生物标志物的不同组合来调节用于诊断结肠直肠癌的测试的灵敏度和特异 性。
基于知识的系统
从在此的讨论将显而易见,用于实施一种算法的基于知识的计算机软件和硬件也 形成本发明的部分。这类计算机软件和/或硬件对于进行根据本发明的诊断或检测结肠直 肠癌的方法是有用的。因此,本发明还提供编程以实施一种算法的软件或硬件,该算法经由 一种多变量分析处理通过进行本发明的方法而得到的数据以便提供疾病评分并且根据与 预定值相比的疾病评分的结果来提供或允许诊断或检测结肠直肠癌和/或确定结肠直肠癌 的进展或状况或确定结肠直肠癌是否已经进展或确定受试者是否正在对结肠直肠癌的治 疗起响应。
在一个实例中,本发明的方法可以被用于与病理学服务相关的现有的基于知识的 体系结构或平台。例如,来自在此所描述的方法的结果经由一种通信网络(例如,互联网)被 传送至一种处理系统,在该处理系统中一种算法被存储并且用于生成一种预测的后概率 值,该值翻译为疾病概率或者复发或转移的风险或者对于治疗的反应性的评分,然后将这 种评分以一种诊断或预测报告的形式转发至最终用户。
因此本发明的方法可以是呈一种试剂盒或基于计算机的系统的形式,其包括检测 这些生物标志物的浓度所必需的试剂和有助于测定和传送报告至临床医师的计算机硬件 和/或软件。
本发明的测定允许整合至现有或新开发的病理学体系结构或平台系统中。例如, 本发明思考一种允许用户确定一个受试者有关结肠直肠癌的状况的方法,该方法包括:
(a)在一种容易得到的样品中接收呈至少两种选自以下的生物标志物的水平的形 式的数据:IL-8、IGFBP2、MAC2BP、M2PK、IL-13、DKK-3、EpCam、MIP1Β、TGFβ1和TIMP-1,可任 选地与结肠直肠癌的另一种标志物组合;
(b)经由多变量分析(例如,回归分析)处理该受试者数据以便提供一种疾病评分;
(c)根据与预定值比较的疾病评分的结果确定该受试者的状况;以及
(d)经由该通信网络将该受试者的状况的指示传输至该用户,提及该多变量分析 包括进行该多变量分析功能的一种算法。
在一个实施方案中,可以通过从患者取得血液样品并且测定如在此所描述的这些 生物标志物的任何一个或多个的存在和/或水平来进行本发明的用于诊断或检测结肠直肠 癌的方法。如果希望,可以(例如)在一种生物芯片上进行这些测量这样使得可以使用单一 分析来测量多个生物标志物的存在和/或水平。然后可以将这种分析的结果输入到使它们 经受线性回归分析的一种计算机程序中。该计算机还可以包括关于对照值或预期范围的信 息,或该临床医师、护士、医疗负责人或全科医师可以输入这类数据。这种分析然后将提供 患有结肠直肠癌的一种评分或可能性。如果针对该患者进行了第二测试,该回归分析可以 指示该评分的变化,从而指示该患者的疾病已经进展或恶化。
实例
材料和方法
患者样品
从正在一些医院接受治疗的一组结肠直肠癌患者(杜克斯A期至D期)取得一批血 浆和血清样品并且进行处理。
还从一组约50个65岁以上的健康志愿者和一组15个50岁以上的健康志愿者采集 血液并且进行处理。
用略有不同的生物标志物开展四个独立研究。研究1着眼于52个癌症样品和50个 对照,研究2着眼于55个癌症样品和53个对照,研究3和研究4着眼于96个癌症样品和50个对 照。在研究2、3和4中这些患者是跨杜克斯分期年龄和性别相匹配的,概要统计参见表2。
表2.在研究2、3和4中使用的正常志愿者和结肠直肠癌患者的特征。
生物标志物分析
用商用试剂盒和源抗体(DSL、R&DDuoset、Calbiotech、Millipore、Abnova、 Genway、Peviva、Schebo、Bender)以及使用ELISA或Luminex测定进行生物标志物的分析。
统计评估和组生物标志物建模
使用统计软件包Prism和“R”分析每个测定的结果。使用非参数曼-惠特尼t检验 (non-parametricMann-Whitneyt-test)评估标志物的单独性能并且生成个体受试者工 作特征(receiveroperatorcharacteristic,ROC)曲线。
使用逻辑回归和相关建模策略来发现使对照和结肠直肠癌患者最佳区分开来的 生物标志物的组合。用相同样品/等分试样进行四个独立研究。以下给出这些研究中的每一 个的结果。
研究1、2和3的结果
在表3中列出研究1和2以及3中选择的待测量的生物标志物。呈粗体的生物标志物 是那些从每个研究被鉴定为有希望的(即,与来自对照的样品相比它们在来自结肠直肠癌 患者的样品中显著不同和/或它们在使结肠直肠癌与对照区分开来的结合生物标志物的组 中被鉴定)。
表3.研究中分析的生物标志物。
统计评估和组生物标志物建模
为了发现使对照和结肠直肠癌患者最佳区分开来的生物标志物的组合,采用使用 贝叶斯信息标准(BayesianInformationCriteria)的正向变量选择以对于对数似然值进 行罚分从而防止过拟合。为了评估该组生物标志物在一个独立数据集上的可能性能,使用 “N倍(N-Fold)”或“留一法(leave-one-out)”交叉验证。在这一程序中每次排除一个观测数 据而应用整个模型拟合算法于这些剩余的观测数据。
然后使用所得到的模型来评估被排除的观测数据是一个病例的概率。针对该数据 集中的每个观测数据重复这样。以此方式每个观测数据进而作为模型构建算法的一个独立 测试。然后可以将所得到的由病例和对照(各具有一个“独立预测的”病例概率)组成的数据 集与该初始模型进行比较。从众多生物标志物选择和对它们适当加权的能力允许一种搜索 策略,该搜索策略在该ROC曲线上优化所关注区域中的性能。特异性差的代价是大量不必要 的结肠镜检查。
在研究3中,评估48个潜在生物标志物以便选择一组候选的结肠直肠癌生物标志 物,在板(plates)内使用区组随机化以便避免偏差。从这一48个的列表中只有42个显示了 可测量的水平。如由t检验评定,14个生物标志物各自显示出对照与CRC之间的显著性差异; (IGFII、IGFBP2、IL-8、IL-6、MMP-1、MMP-7、s90/Mac2BP、M2PK、EpCam、TIMP-1(血清和血浆)、 M65、OPN、TGFβ1、VEGFpan)。
正如所预期的,没有一个具有能单独用作一种生物标志物的足够的灵敏度或特异 性(未示出)。然而,使用多种建模策略(包括使用对数值),发现了一些不同组的生物标志 物,这些组超过了FOBT的性能,尤其是对于早期至晚期疾病。
图1示出了包括IL8(血清)、IL-13(血清)、EpCAM(血浆)、M2PK(血浆)、IGFBP2(血 清)和Mac2BP(血清)的一个7生物标志物组的结果,并且将该组进行交叉验证以便预测它对 独立样本的性能。
这一7生物标志物模型,该模型至少在概念上被描述为
在高特异性时提供了良好性能并且在交叉验证下是稳健的。在表4中列出了据评 估对于血浆中的这种生物标志物组合给出最佳模型的这些系数。在表5中提供性能统计。这 种性能超过了针对FOBT引用的性能(灵敏度65.8%,特异性95%)(Morikawa等人,2005)。
表4.该生物标志物组合的系数。
生物标志物 …中测量的 浓度单位 系数 截距 NA NA -37.74 IL-8 血清 pg/mL 1.07 IL-13 血清 pg/mL -0.28 EpCAM 血浆 pg/mL -0.33 M2PK 血浆 单位/mL 1.40 IGFBP2 血清 ng/mL 1.99 Mac2BP 血清 ng/mL 2.39 MIPlβ 血清 Pg/ml -1.19
表5.该7生物标志物模型的性能和交叉验证。
模型评估 交叉验证 ROC曲线下面积(AUC) 0.91 0.86 处于80%特异性时的灵敏度 0.84 0.78 处于90%特异性时的灵敏度 0.81 0.69
这种模型还被分别应用于结肠直肠癌的每个阶段的患者(杜克斯A期、B期、C期、D 期)并且在每个阶段内显示效果一样良好(图2)。这些AUC是0.88至0.93并且可以几乎一样 好地区分结肠直肠癌的所有阶段。该模型显示出对于C期处于90%特异性时的最高灵敏度 为90%并且对于B期处于90%特异性时的最低灵敏度为73%(表6)。
表6.依据杜克斯分期的模型的性能
A期 B期 C期 D期 ROC曲线下面积(AUC) 0.89 0.88 0.93 0.91 处于80%特异性时的灵敏度 0.82 0.77 0.90 0.93 处于90%特异性时的灵敏度 0.77 0.73 0.90 0.86
研究4(又称为“重新测量的研究3”)
在研究4中,重新测量了与研究3相同的组中的10个生物标志物。从96个结肠直肠 癌患者和50个正常受试者(对照)收集血液。在这个研究中重点在于10个生物标志物,即 IGFBP2、IL8、IL13、Mac2BP、M2PK、Dkk3、EpCam、TGFβ1、TIMP-1、MIP1β。如上述所描述的进行 测定。测量这些生物标志物中的每一个的血清和血浆水平并且与对照值进行比较。
当进行成对(两个生物标志物)建模时,共有5对(选自以上10个生物标志物的清单 的可能的45种组合中)可以显示在处于95%的特异性时产生高于52%的灵敏度。参见表7和 图3。
表7.通过交叉验证产生有用筛选试验的生物标志物对。
在分析这些指定的生物标志物中的三至十个的组合中,存在968个可能的组合。这 些3个与10个生物标志物之间的968个组合由以下各项组成:3个标志物的120个组合;4个标 志物的210个组合;5个标志物的252个组合;6个标志物的210个组合;7个标志物的120个组 合;8个标志物的45个组合;9个标志物的10个组合以及包括所有10个生物标志物的单一组 合。当使用一种线性逻辑模型对它们建模并且然后经由10倍交叉验证测试时,这些968个组 合的约一半处于95%特异性时具有50%的灵敏度,参见图4,其示出一个三生物标志物组合 的结果。这些组合中的一半以上将具有90%的特异性和50%的灵敏度。
图5示出基于这些生物标志物中的3个至10个的所有可能的组合的总计可能的968 个模型中的用于测试的所有485个评估的样本外(10倍交叉验证的)ROC曲线。注意这些485 个ROC曲线的许多单独部分是重合的,由于每个水平部分表示一个对照并且每个垂直部分 表示一个病例。在这种情况下这些组合中的50.1%超过了50%灵敏度,95%特异性,最佳评 估的“样本外”性能是处于95%特异性时76%的灵敏度。重复该交叉验证将选择一组不同的 模型—由于随机采样,任何一个组合的灵敏度处于95%特异性时可能以10%变化—但是产 生类似比例的有用的“有用筛选试验”。单个模型的精确验证要求重复的试验和更大的样本 量。
图6示出具有50%灵敏度,95%特异性的这485个组合中的有多少个组合包括任何 给定的生物标志物。在最顶端,所选择的“有用的”组合中的432个包括M2PK。在最低端所选 择的“有用的”组合中的227个包括MIP1β。所有10个生物标志物在“有用的”模型中的高表现 度显示了这10个生物标志物的选择的一致性和自互补性。
图7至图11展示了针对5个至7个生物标志物的组合的这一最后研究(研究4)的一 些结果,包括其中这些样品或者是来自血浆簇或者是来自血清簇的一种模型。图11展示了 在该疾病进展的不同阶段的选择三个生物标志物(DKK-3、M2PK和IGFBP2)的有效性。该数据 表明如果在A期使用这三个生物标志物,处于95%特异性时该试验仍将实现64%的显著灵 敏度,这可与处于晚期疾病时实现的灵敏度(79%)相匹敌。换言之该三生物标志物组将发 现允许早期检测的早期疾病状态。
表8至16列出不同生物标志物组集的多个组合的结果。取决于使用的线性回归和 组对照以及其它因素(如样本偏差和测定试剂盒技术),实际数字或这些标志物的顺序可能 存在变化。无论如何,这些组合中的许多处于高特异性时将实现良好的选择性以便有用于 诊断或检测处于疾病进展的任何阶段的结肠直肠癌。
表8.在血清中处于95%特异性时等于或超过50%灵敏度的三个生物标志物的组 合。
表9.在血清中处于95%特异性时等于或超过50%灵敏度的包括DKK-3的四个生物 标志物的组合。
表10.在血清中处于95%特异性时等于或超过50%灵敏度的的包括M2PK的四个生 物标志物的组合。
本领域的技术人员将了解,在不脱离概括描述的本发明的范围的情况下,可对这 些具体实施方案中所示的本发明作出众多的变化和/或修改。因此,这些现有实施方案在所 有方面都被视为是说明性的而不是限制性的。
在此讨论的和/或引用的所有出版物通过引用以其全文结合在此。
本申请要求AU2010903140的优先权,该申请的全部内容通过引用结合在此。
已包括在本说明书中的对于多个文献、行为、材料、装置、物品等的任何讨论仅出 于为本发明提供一个背景的目的。它不应被视为承认任何或所有这些内容构成现有技术基 础的一部分或是与本发明有关的领域中的常见一般知识,因为它在本申请的各项权利要求 的优先权日之前就存在。
参考文献
Anderson和Hunter(2006)分子细胞蛋白质组学,5:573-588。
澳大利亚的癌症,概述(2008)AIHW(澳大利亚健康福利机构)&AACR(澳大拉西亚癌 症登记协会),癌序列号46,Cat.No:CAN42,Canberra:AIHW。
Etzioni等人(2003)自然评论癌症,3:243-252。
Hundt等人(2007)癌症流行病学:生物标志物及预防,16:1935-1953。
Kimmel(1987)酶学方法,152:507-511。
Kwoh等人(1989)美国国家科学院院刊86:1173-1177。
Levin(2004)胃肠病学,127:1841-1844。
Lieberman(2010)胃肠病学,138:2115-2126。
Morikawa等人(2005)胃肠病学,129:422-428。
Notomi等人(2000)核酸研究28:E63。
Tonus(2006)世界胃肠病学杂志,12:7007-7011。
Wahl和Berger(1987)酶学方法,152:399-407。
Walker等人(1992a)美国国家科学院院刊89:392-396。
Walker等人(1992b)核酸研究20:1691-1696。