书签 分享 收藏 举报 版权申诉 / 71

多基因生物标志物的鉴定.pdf

  • 上传人:e1
  • 文档编号:43920
  • 上传时间:2018-01-18
  • 格式:PDF
  • 页数:71
  • 大小:14.57MB
  • 摘要
    申请专利号:

    CN201280068771.3

    申请日:

    2012.11.05

    公开号:

    CN104093859A

    公开日:

    2014.10.08

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情:

    发明专利申请公布后的视为撤回IPC(主分类):C12Q 1/68申请公布日:20141008|||公开

    IPC分类号:

    C12Q1/68

    主分类号:

    C12Q1/68

    申请人:

    AVEO制药公司

    发明人:

    M·罗宾逊; 冯斌; R·尼古勒蒂; J·P·弗雷德里克; L·皮利波维奇

    地址:

    美国马萨诸塞

    优先权:

    2011.12.22 US 61/579,530

    专利代理机构:

    中国国际贸易促进委员会专利商标事务所 11038

    代理人:

    袁泉

    PDF完整版下载: PDF下载
    内容摘要

    本发明公开了鉴定用于预测对目的抗癌药品是敏感的或抵抗的多基因生物标志物、或多基因癌症预后生物标志物的方法。所公开的方法是基于将哺乳动物基因组分类为51个转录簇,即,非重叠的、功能相关的一组基因,其组内的转录水平是高度相关的。此外,本发明还公开了用于预测对tivazanib或纳巴霉素是敏感的或抵抗的特异性多基因生物标志物,以及用于测定乳腺癌预后的特异性多基因生物标志物,所有这些标志物均是使用本文所公开的方法鉴定的。

    权利要求书

    1.  一种鉴定预测性基因集合(“PGS”)的方法,其中所述的预测性基因集合用于将癌症组织分类为对特定的抗癌药品或抗癌药品类型是敏感的或抵抗的,所述的方法包括:
    (a)测量由表1中的转录簇得到的代表性数量的基因在以下中的表达水平:(i)由被鉴定为对抗癌药品敏感的癌症组织的群体得到的组织样品集合,和(ii)由被鉴定为对抗癌药品抵抗的癌症组织的群体得到的组织样品集合;以及
    (b)测定代表性数量的基因在由所述的敏感群体得到的组织样品集合中和在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异,
    其中在敏感群体中的基因表达水平显著不同于在抵抗群体中的基因表达水平的、代表性数量的基因为用于将样品分类为对所述的抗癌药品是敏感的或抵抗的PGS。

    2.
      权利要求1所述的方法,其中将所述的敏感群体的平均簇得分与所述的抵抗群体的平均簇得分相比较的学生t检验用于测定所述的代表性数量的基因在由所述的敏感群体得到的组织样品集合中和在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。

    3.
      权利要求1所述的方法,其中基因集合富集分析(GSEA)用于测定所述的代表性数量的基因在由所述的敏感群体得到的组织样品集合中和在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。

    4.
      权利要求1所述的方法,其中所述的代表性数量的基因为10个或更多。

    5.
      权利要求4所述的方法,其中所述的代表性数量的基因为15个或更多。

    6.
      权利要求5所述的方法,其中所述的代表性数量的基因为20个或更多。

    7.
      权利要求1所述的方法,其中所述的组织样品选自肿瘤样品或血液样品。

    8.
      权利要求1所述的方法,其中针对所述的51个转录簇的每一个实施步骤(a)和(b)。

    9.
      权利要求1所述的方法,其中步骤(a)包括:
    测量图6中代表所述的51个转录簇的每一个的10个基因在以下中的表达水平:(i)由被鉴定为对所述的抗癌药品敏感的癌症组织的群体得到的组织样品集合,和(ii)由被鉴定为对所述的抗癌药品抵抗的癌症组织的群体得到的组织样品集合;
    并且步骤(b)包括:
    针对所述的51个转录簇的每一个,测定图6中的10个基因的表达水平之间是否具有统计学显著性差异,其中所述的基因代表由所述的敏感群体得到的组织样品集合中的簇、以及由所述的抵抗群体得到的组织样品集合中的簇;
    其中由图6中所述的转录簇得到的10个基因所代表的转录簇为用于将样品分类为对所述的抗癌药品是敏感的或抵抗的PGS,其中所述的基因在所述的敏感群体中的基因表达水平与该基因在所述的抵抗群体中的基因表达水平显著不同。

    10.
      权利要求9所述的方法,其中所述的PGS基于转录簇的多样 性。

    11.
      一种鉴定预测性基因集合(“PGS”)的方法,其中所述的预测性基因集合用于将癌症患者分类为具有良好预后或不良预后,所述的方法包括:
    (a)测量由表1中的转录簇得到的代表性数量的基因在以下中的表达水平:(i)由被鉴定为具有良好预后的癌症患者群体得到的组织样品集合;以及(ii)由被鉴定为具有不良预后的癌症患者群体得到的组织样品集合;以及
    (b)测定代表性数量的基因在由所述的良好预后群体得到的组织样品集合中和在由所述的不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异,
    其中在良好预后群体中的基因表达水平显著不同于其在不良预后群体中的基因表达水平的、代表性数量的基因为用于将患者分类为良好预后或不良预后的PGS。

    12.
      权利要求11所述的方法,其中将所述的良好预后群体的平均簇得分与所述的不良预后群体的平均簇得分相比较的学生t检验用于测定所述的代表性数量的基因在由所述的良好预后群体得到的组织样品集合中和在由所述的不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。

    13.
      权利要求11所述的方法,其中GSEA用于测定所述的代表性数量的基因在由所述的良好预后群体得到的组织样品集合中和在由所述的不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。

    14.
      权利要求11所述的方法,其中所述的代表性数量的基因为10个或更多。

    15.
      权利要求14所述的方法,其中所述的代表性数量的基因为15个或更多。

    16.
      权利要求15所述的方法,其中所述的代表性数量的基因为20个或更多。

    17.
      权利要求11所述的方法,其中所述的组织样品选自肿瘤样品或血液样品。

    18.
      权利要求11所述的方法,其中针对所述的51个转录簇的每一个实施步骤(a)和(b)。

    19.
      权利要求11所述的方法,其中步骤(a)包括:
    测量图6中代表所述的51个转录簇的每一个的10个基因在以下中的表达水平:(i)由被鉴定为具有良好预后的癌症患者群体得到的组织样品集合,和(ii)由被鉴定为具有不良预后的癌症患者群体得到的组织样品集合;
    并且步骤(b)包括:
    针对所述的51个转录簇的每一个,测定图6中的10个基因的表达水平之间是否具有统计学显著性差异,其中所述的基因代表由所述的良好预后群体得到的组织样品集合以及由所述的不良预后群体得到的组织样品集合中的簇;
    其中由图6中所述的簇得到的10个基因所代表的转录簇为用于将患者分类为具有良好预后或不良预后的PGS,其中所述的基因在所述的良好预后群体中的基因表达水平与其在所述的不良预后群体中的基因表达水平显著不同。

    20.
      权利要求19所述的方法,其中所述的PGS基于转录簇的多 样性。

    21.
      探针集合,该探针集合包括针对由表1中的各转录簇得到的至少10个基因的探针,前提条件是所述的探针集合不是完整基因组微阵列芯片。

    22.
      权利要求21所述的探针,其中所述的探针选自:(a)微阵列探针集合;(b)PCR引物集合;(c)qNPA探针集合;(d)包括分子条形码的探针集合;以及(e)其中探针被固定在珠上的探针集合。

    23.
      权利要求21所述的的探针集合,其中所述的探针集合包括针对图6中列举的510个基因的每一个的探针。

    24.
      权利要求23所述的的探针集合,其中所述的探针集合由针对图6中列举的510个基因的每一个的探针、以及对照探针集组成。

    25.
      一种鉴定人类肿瘤对使用tivozanib或纳巴霉素进行的治疗可能是敏感的或抵抗的、或者将人类乳腺癌患者分类为具有良好预后或不良预后的方法,其中所述的方法选自:
    (a)一种鉴定人类肿瘤对使用tivozanib进行的治疗可能是敏感的或抵抗的方法,该方法包括:
    (i)在由肿瘤得到的样品中,测量预测性基因集合(PGS)中各基因的相对表达水平,其中所述的PGS包括由TC50得到的至少10个所述的基因,以及
    (ii)根据所述的算法计算PGS得分:

    其中E1、E2……En为所述的PGS中n个基因的表达值,并且
    其中低于定义阈值的PGS得分表明所述的肿瘤对tivozanib可能是敏感的,而高于所述的定义阈值的PGS得分表明所述的肿瘤对 tivozanib可能是抵抗的;
    (b)一种鉴定人类肿瘤对使用纳巴霉素进行的治疗可能是敏感的或抵抗的方法,该方法包括:
    (i)在由所述的肿瘤得到的样品中,测量预测性基因集合(PGS)中各基因的相对表达水平,其中所述的PGS包括由(A)由TC33得到的至少10个基因、以及(B)由TC26得到的至少10个基因,
    (ii)根据所述的算法计算PGS得分:

    其中E1、E2……Em为由TC33得到的至少10个基因的表达值,其中所述的基因在敏感性肿瘤中受到上调;而F1、F2……Fn为由TC26得到的至少10个基因的表达值,所述的基因在抵抗性肿瘤中受到上调,并且
    其中高于所述的定义阈值的PGS得分表明所述的肿瘤对纳巴霉素可能是敏感的,而低于所述的定义阈值的PGS得分表明所述的肿瘤对纳巴霉素可能是抵抗的;以及
    (c)一种将人类乳腺癌患者分类为具有良好预后或不良预后的方法,该方法包括:
    (i)在由所述的患者的肿瘤得到的样品中,测量预测性基因集合(PGS)中各基因的相对表达水平,其中所述的PGS包括由(A)由TC35得到的至少10个基因、以及(B)由TC26得到的至少10个基因,
    (ii)根据所述的算法计算PGS得分:

    其中E1、E2……Em为由TC35得到的至少10个基因的表达值,其中所述的基因在良好预后的患者中受到上调;而F1、F2……Fn为由TC26得到的至少10个基因的表达值,所述的基因在不良预后的患者中受到上调,并且
    其中高于所述的定义阈值的PGS得分表明所述的患者具有良好预后,而低于所述的定义阈值的PGS得分表明所述的患者可能具有不良预后。

    26.
      权利要求25(a)所述的方法,其中所述的PGS包括TC50的10基因子集,该子集选自:
    (a)MRC1、ALOX5AP、TM6SF1、CTSB、FCGR2B、TBXAS1、MS4A4A、MSR1、NCKAP1L和FLI1;以及
    (b)LAPTM5、FCER1G、CD48、ΒIΝ2、C1QB、NCF2、CD14、TLR2、CCL5和CD163。

    27.
      权利要求25(b)所述的方法,其中所述的PGS包括以下基因:FRY、HLF、HMBS、RCAN2、HMGA1、ITPR1、ENPP2、SLC16A4、ANK2、PIK3R1、DTL、CTPS、GINS2、GMNN、MCM5、PRIM1、SNRPA、TK1、UCK2和PCNA。

    28.
      权利要求25(c)所述的方法,其中所述的PGS包括以下基因:RPL29、RPL36A、RPS8、RPS9、EEF1B2、RPS10P5、RPL13A、RPL36、RPL18、RPL14、DTL、CTPS、GINS2、GMNN、MCM5、PRIM1、SNRPA、TK1、UCK2和PCNA。

    29.
      权利要求25所述的方法,该方法进一步包括进行阈值测定分析的步骤,由此生成定义阈值,其中所述的阈值测定分析包括受试者工作特征曲线分析。

    30.
      权利要求25所述的方法,其中所述的PGS中各基因的相对表达水平是通过选自以下的方法测量的:(a)DNA微阵列分析;(b)qRT-PCR分析;(c)qNPA分析;(d)基于分子条形码的测定;以及(e)基于多重珠的测定。

    说明书

    多基因生物标志物的鉴定
    相关申请的交叉引用
    本申请要求2011年12月22日提交的美国临时申请系列号61/579,530的利益和优先权;该申请的全部内容以引用方式并入本文。
    技术领域
    本发明的领域为分子生物学、遗传学、肿瘤学、生物信息学和诊断性检验。
    背景技术
    大多数的癌症药品在一些患者中是有效的,但是在其他患者中则是无效的。该结果源自肿瘤中的遗传变异,并且甚至可以在同一患者的多种肿瘤中观察到。就靶向治疗而言,特别宣布了不同的患者的应答。因此,在不具有合适的检验来测定哪位患者将受益于哪种药品的条件下,不能实现靶向治疗的全部潜力。根据国立卫生研究院(NIH),术语“生物标志物”定义为“可客观测量的特征,并且该特征被评价为正常的生物或致病过程、或者对治疗干预的药理学应答的指示剂”。
    基于生物标志物的发现来开发改良诊断学通过事先鉴定最可能对给定药品显示临床应答的这些患者而具有加速新药品研发的潜力。这会显著地减小临床试验的规模、时间和成本。目前,诸如基因组学、蛋白质组学和分子影像学之类的技术能够快速、敏感且可信赖地检测特定的基因突变、具体基因的表达水平以及其他分子生物标志物。尽管有多种用于肿瘤的分子表征的技术是可利用的,但是由于已经发现的癌症生物标志物很少,所以很大程度上癌症生物标志物的临床应用仍未实现。例如近来的综述文章陈述:非常需要加速研发生物标志物及它们的用途,以改善癌症的诊断和治疗。(Cho、2007、Molecular  Cancer 6:25)。
    另一篇近来关于癌症生物标志物的综述文章包括以下评论:挑战在于发现癌症生物标志物。尽管使用分子靶向试剂在靶向多种类型肿瘤的分子定义的子集(例如慢性粒细胞白血病、胃肠道间质瘤、肺癌和多形性胶质母细胞瘤)中已经获得临床上的成功,但是缺乏有效的策略来评价患者的靶向试剂严重地限制了更广泛地应用这些成功的能力。问题主要在于不能选择患有分子定义的癌症的患者来进行评价这些令人激动的新药品的临床试验。解决方法需要这样的生物标志物,该生物标志物可信赖地鉴定最可能受益于特定试剂的那些患者。(Sawyers、2008、Nature 452:548-552、at 548)。诸如之前之类的评论表明已经意识到特别是在肿瘤性领域中,需要发现临床用途的预测性生物标志物。
    公认的是,需要鉴定多基因生物标志物的方法,其中所述的多基因生物标志物用于鉴定哪些患者为使用给定药品或治疗进行治疗的合适的候选者。就靶向癌症治疗而言,这是特别需要的。
    发明概述
    使用基因表达图谱技术、专属的生物信息学工具和应用统计学,我们发现哺乳动物基因组可以有效地通过51组非重叠的、功能相关的基因表示,这51组基因的组间转录物水平受到协同调节,即,在多个微阵列数据集中,是强相关的或“相干的”。我们将这些组的基因定义为基因转录簇1-51(TC1-TC51)。基于该发现,我们发现了用于快速鉴定以下的广泛适用的方法:(a)对目的抗癌药品具有敏感性或抗性的多基因预测性生物标志物;或(b)多基因癌症预后性生物标志物。我们将此类多基因生物标志物称为预测性基因集合或PGS。
    PGS可以基于一个转录簇或多个转录簇。在一个实施方案中,PGS基于完整的一个或多个转录簇。在其他的实施方案中,PGS基于个别转录簇或多个转录簇的子集中的基因的子集。由任何给定的转录簇得到的基因的子集代表取得该基因的子集的完整的转录簇,这是因为所 述的转录簇内的基因的表达是相干的。因此,当使用转录簇中的基因的子集时,该子集代表由该转录簇得到的基因的子集。
    本文提供了鉴定预测性基因集合(“PGS”)的方法,其中所述的预测性基因集合用于将癌症组织分类为对特定的抗癌药品或抗癌药品类型是敏感的或抵抗的。所述的方法包括以下步骤:(a)测量由表1中的转录簇得到的代表性数量的基因(例如10、15、20或更多的基因)在以下中的表达水平:(i)由被鉴定为对抗癌药品敏感的癌症组织的群体得到的组织样品集合,和(ii)由被鉴定为对抗癌药品抵抗的癌症组织的群体得到的组织样品集合;以及(b)测定代表性数量的基因在由所述的敏感群体得到的组织样品集合中和在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。在敏感群体中的基因表达水平显著不同于其在抵抗群体中的基因表达水平的、代表性数量的基因为用于将样品分类为对所述的抗癌药品是敏感的或抵抗的PGS。可以使用学生t检验或基因集合富集分析(GSEA)来测定代表性数量的基因在由所述的敏感群体得到的组织样品集合中与在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。在一些实施方案中,针对本文所公开的51个转录簇的每一个,实施步骤(a)和(b)。所述的组织样品可以为肿瘤样品或血液样品。
    本文提供了用于鉴定PGS的另一种方法,其中所述的PGS用于将癌症组织分类为对特定抗癌药品或某类药品是敏感的或抵抗的。所述的方法包括:(a)测量图6中代表51个转录簇的每一个的10个基因在以下中的表达水平:(i)由被鉴定为对所述的抗癌药品敏感的癌症组织的群体得到的组织样品集合,和(ii)由被鉴定为对抗癌药品抵抗的癌症组织的群体得到的组织样品集合;以及(b)针对51个转录簇的每一个,测定图6中的10个基因的表达水平之间是否具有统计学显著性差异,其中所述的10个基因代表由敏感群体得到的组织样品集合与由抵抗群体得到的组织样品集合的基因簇。在一些实施方案中,转录簇为用于将样品分类为对抗癌药品是敏感的或抵抗的的PGS,其中所 述的转录簇由图6中所示的簇得到的10个基因表示,并且在敏感群体中表现出基因表达的水平,该基因表达的水平显著不同于抵抗群体中基因表达的水平。在一个实施方案中,PGS基于多个转录簇。所述的组织样品可以为肿瘤样品或血液样品。
    本文提供了用于鉴定PGS的一种方法,其中所述的PGS用于将癌症患者分类为良好预后或不良预后。所述的方法包括:(a)测量由表1中的转录簇得到的代表性数量的基因(例如10、15、20或更多的基因)在以下中的表达水平:(i)由被鉴定为良好预后的癌症患者群体得到的组织样品集合,和(ii)由被鉴定为不良预后的癌症患者群体得到的组织样品集合;以及(b)测定代表性数量的基因在由良好预后群体得到的组织样品集合中和在由不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。在良好预后群体中的基因表达水平显著不同于其在不良预后群体中的基因表达水平的、代表性数量的基因为用于将患者分类为良好预后或不良预后的PGS。可以使用学生t检验或基因集合富集分析(GSEA)来测定代表性数量的基因在由良好预后群体得到的组织样品集合中与在由不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。在一些实施方案中,针对本文所公开的51个转录簇的每一个,实施步骤(a)和(b)。所述的组织样品可以为肿瘤样品或血液样品。
    本文提供了用于鉴定PGS的另一种方法,其中所述的PGS用于将癌症患者分类为对良好预后或不良预后。所述的方法包括:(a)测量图6中代表51个转录簇的每一个的10个基因在以下中的表达水平:(i)由被鉴定为良好预后的癌症患者群体得到的组织样品集合,和(ii)由被鉴定为不良预后的癌症患者群体得到的组织样品集合;以及(b)针对51个转录簇的每一个,测定图6中的10个基因的表达水平之间是否具有统计学显著性差异,其中所述的基因代表由所述的良好预后的群体得到的组织样品集合与由所述的不良预后的群体得到的组织样品集合的簇。在一些实施方案中,由图6中所述的簇得到的10个基因所代表的转录簇为用于将患者分类为具有良好预后或不良预后的 PGS,其中所述的基因在所述的良好预后群体中的基因表达水平与其在所述的不良预后群体中的基因表达水平显著不同。在其他的实施方案中,PGS基于多个转录簇。所述的组织样品可以为肿瘤样品或血液样品。
    本文提供了鉴定人类肿瘤对使用抗癌药品tivozanib进行的治疗可能是敏感的或抵抗的方法。所述的方法包括:(a)在由肿瘤得到的样品中,测量PGS中各基因的相对表达水平,其中所述的PGS包括由TC50得到的至少10个基因;以及(b)根据以下算法计算PGS得分:

    其中E1、E2……En为PGS中n个基因的表达值,其中n为PGS中的基因数量,并且其中低于定义阈值的PGS得分表明肿瘤对tivozanib可能是敏感的,而高于所述的定义阈值的PGS得分表明肿瘤对tivozanib可能是抵抗的。在一个实施方案中,PGS包括TC50的10个基因子集。由TC50得到的示例性10个基因子集为MRC1、ALOX5AP、TM6SF1、CTSB、FCGR2B、TBXAS1、MS4A4A、MSR1、NCKAP1L和FLI1。由TC50得到的另一个示例性10个基因子集为LAPTM5、FCER1G、CD48、ΒIΝ2、C1QB、NCF2、CD14、TLR2、CCL5和CD163。
    在一些实施方案中,将人类肿瘤鉴定为对使用tivozanib进行的治疗可能是敏感的或抵抗的方法包括进行阈值测定分析,由此生成定义阈值。阈值测定分析可以包括受试者工作特征曲线分析。可以通过DNA微阵列分析、qRT-PCR分析、qNPA分析、基于分子条形码的测定或基于多重珠的测定来测定(例如测量)PGS中各基因的相对基因表达水平。
    本文提供了鉴定人类肿瘤对使用纳巴霉素的治疗可能是敏感的或抵抗的方法。该方法包括:(a)在由肿瘤得到的样品中,测量PGS中各基因的相对表达水平,其中是所述的PGS包括:(i)由TC33得到的至少10个基因;以及(ii)由TC26得到的至少10个基因;以及(b)根据以下算法计算PGS得分:

    其中E1、E2……Em为由TC33得到的m个基因的表达值(例如其中m为至少10个基因),所述的基因在敏感性肿瘤中受到上调;而F1、F2……Fn为由TC26得到的n个基因的表达值(例如其中n为至少10个基因),所述的基因在抵抗性肿瘤中受到上调。高于定义阈值的PGS得分表明肿瘤对纳巴霉素可能是敏感的,而低于所述的定义阈值的PGS得分表明肿瘤对纳巴霉素可能是抵抗的。示例性的PGS包括以下基因:FRY、HLF、HMBS、RCAN2、HMGA1、ITPR1、ENPP2、SLC16A4、ANK2、PIK3R1、DTL、CTPS、GINS2、GMNN、MCM5、PRIM1、SNRPA、TK1、UCK2和PCNA。
    在一些实施方案中,鉴定人类肿瘤对使用纳巴霉素进行的治疗可能是敏感的或抵抗的方法包括进行阈值测定分析,由此生成定义阈值。阈值测定分析可以包括受试者工作特征曲线分析。可以通过DNA微阵列分析、qRT-PCR分析、qNPA分析、基于分子条形码的测定或基于多重珠的测定来测定(例如测量)PGS中各基因的相对基因表达水平。
    本文提供了将人类乳腺癌患者分类为良好预后或不良预后的方法。该方法包括:(a)在由患者的肿瘤得到的样品中,测量PGS中各基因的相对表达水平,其中是所述的PGS包括:(i)由TC35得到的至少10个基因;以及(ii)由TC26得到的至少10个基因;以及(b)根据以下算法计算PGS得分:

    其中E1、E2……Em为由TC35得到的m个基因的表达值(例如其中m为至少10个基因),所述的基因在良好预后的患者中是上调的;而F1、F2……Fn为由TC26得到的n个基因的表达值(例如其中n为至少10个基因),所述的基因在不良预后的患者中是上调的。高于定义阈值的PGS得分表示患者良好预后,而低于所述的定义阈值的PGS得分表示患者可能不良预后。示例性的PGS包括以下基因:RPL29、RPL36A、RPS8、RPS9、EEF1B2、RPS10P5、RPL13A、 RPL36、RPL18、RPL14、DTL、CTPS、GINS2、GMNN、MCM5、PRIM1、SNRPA、TK1、UCK2和PCNA。
    在一些实施方案中,将人类乳腺癌患者分类为良好预后或不良预后的方法包括进行阈值测定分析,由此生成定义阈值。阈值测定分析可以包括受试者工作特征曲线分析。可以通过DNA微阵列分析、qRT-PCR分析、qNPA分析、基于分子条形码的测定或基于多重珠的测定来测定(例如测量)PGS中各基因的相对基因表达水平。
    本文提供了探针集合,该探针集合包括针对由表1的各转录簇得到的至少10个基因的探针,前提条件是所述的探针集合并非为整个基因组微阵列芯片。合适的探针集合的实例包括微阵列探针集合、PCR引物集合、qNPA探针集合、包括分子条形码的探针集合(例如Technology)或其中探针被固定在珠上的探针集合(例如Plex assay system)。在一个实施方案中,所述的探针集合包括针对图6中所列的510个基因的每个基因的探针。在另一个实施方案中,所述的探针集合由针对图6中所列的510个基因的每个基因的探针、以及对照探针集组成。在另一个实施方案中,所述的探针包括针对由表1中各转录簇得到的10个基因的探针(其中所述的探针集合包括针对由图6所示的各转录簇得到的至少5个基因、以及由表1中各转录簇随机选择的各相应的转录簇得到的至多5个基因的探针)、以及可任选的对照探针。在某些实施方案中,探针集合包括大约510-1020个探针、510-1530个探针、510-2040个探针、510-2550个探针、或510-5100个探针。
    通过考虑以下附图、发明详述和权利要求书,本发明的这些及气体方面和益处将变得显而易见。
    附图说明
    图1为概括了实施例3的数据的水平图,其中实施例3为证明了在实施例2中鉴定的tivozanib PGS的预测能力的试验。每个柱都表示25个肿瘤群体中的一个肿瘤。肿瘤通过PGS得分排列(由低至高)。 各肿瘤的PGS得分通过柱的高度表示。实际应答者(tivozanib敏感的)通过黑柱表示;实际非应答者(tivozanib抵抗的)通过灰柱表示。预测应答者为低于PGS得分最佳阈值的那些,所述的PGS得分最佳阈值经计算为1.62(通过水平虚线表示)。预测非应答者为高于所述的阈值的那些。
    图2为基于图1中的数据的受试者工作特征(ROC)曲线。一般而言,ROC曲线用于测定最佳阈值。图2中的ROC曲线表明该试验中的最佳阈值PGS得分为1.62。当使用该阈值时,所述的测定由25个肿瘤中正确地分类22个,并且假阳性率为25%,假阴性率为0%。
    图3为概括了实施例5的数据的水平图,其中实施例5为证明了在实施例4中鉴定的纳巴霉素PGS的预测能力的试验。每个柱都表示66个肿瘤群体中的一个肿瘤。肿瘤通过PGS得分排列(由低至高)。各肿瘤的PGS得分通过柱的高度表示。实际应答者通过黑柱表示;实际非应答者通过灰柱鉴定。预测应答者为低于PGS得分最佳阈值的那些,所述的PGS得分最佳阈值经计算为0.011(通过水平虚线表示)。预测非应答者为高于所述的阈值的那些。
    图4为以图3中的数据为基础的受试者工作特征(ROC)曲线。图4中的ROC曲线表明该试验中的最佳阈值PGS得分为-0.011。当使用该阈值时,所述的测定由66个肿瘤中正确地分类45个,并且假阳性率为16%,假阴性率为41%。
    图5为通过使用实施例6中的PGS生成的Kaplan-Meier生存者曲线的比较,其中所述的曲线将Wang乳腺癌数据组中提出的286名乳腺癌患者群体分类,如实施例7所述。该图显示了患者存活的百分率与时间(以月份表示)。上方曲线表示PGS得分高的患者(得分高于阈值),该患者取得了相对较长的实际存活时期。下方曲线表示PGS得分低的患者(得分低于阈值),该患者取得了相对较短的实际存活时期。Cox比例风险回归模型分析显示由TC35和TC26生成的PGS是有效的预后生物标志物,其p值为4.5e-4,风险比值为0.505。划线表示检查过的患者。
    图6为列出了510个人类基因的表,其中表1中51个转录簇的每个转录簇都由10个基因的子集表示。
    发明详述
    定义
    如本文所用,当“相干性”用于一个集合的基因时,其是指在给定类型的组织(例如肿瘤组织)中,所述集合的成员的表达水平显示出统计学显著的、一致增加或降低的趋势。无意于被理论所束缚,本发明人指出相干性可能表明相干基因共同参与了一个或多个生物学功能。
    如本文所述,“最佳阈值PGS得分”是指这样的阈值PGS得分,在该得分,分类器在假阴性调用代价和假阳性调用代价之间给出最理想的平衡。
    如本文所用,就给定的表现型(例如对特定的癌症药品是敏感的或抵抗的)而言,“预测性基因集合”或“PGS”是指一组十个或更多的基因,其在给定类型的组织样品中的PGS得分与给定类型的组织中的给定表现型显著相关。
    如本文所用,“良好预后”是指预计患者在初次诊断为癌症的5年内不具有肿瘤的远转移。
    如本文所用,“不良预后”是指预计患者在初次诊断为癌症的5年内具有肿瘤的远转移。
    如本文所用,“探针”是指能够用于测量特定基因的表达情况的分子。示例性探针包括PCR引物以及基因特异性DNA寡核苷酸探针,例如固定于微阵列基底上的微阵列探针、定量核酸酶保护检验探针、与分子条形码连接的探针、以及固定于珠上的探针。
    如本文所用,“受试者工作特征”(ROC)曲线是指就二元分类器系统而言,假阳性率(敏感性)对比真阳性率(特异性)的图表。在ROC曲线的构建中,使用以下定义:
    假阴性率:FNR=1-TPR
    真阳性率:TPR=真阳性/(真阳性+假阴性)
    假阳性率:FPR=假阳性/(假阳性+真阴性)
    如本文所用,就治疗的肿瘤而言,对治疗的“应答”或“响应”是指该肿瘤显示:(a)生长减缓;(b)生长中断;或(c)衰退。对治疗产生应答的肿瘤为“应答者”并且对治疗是“敏感的”。对治疗不产生应答的肿瘤为“非应答者”并且对治疗是“抵抗的”。
    如本文所用,“阈值测定分析”是指对代表给定肿瘤类型(例如人肾细胞癌)的数据组进行的分析,以测定用于该特定肿瘤类型的阈值PGS得分,例如最佳阈值PGS得分。就阈值测定分析而言,代表给定肿瘤类型的数据组包括:(a)实际应答数据(应答或非应答);以及(b)由一组带瘤小鼠或人得到的各种肿瘤的PGS得分。
    转录簇
    许多生物学家目前认为在哺乳动物中表达的大约25000个基因经历了复杂的调节,从而执行有机体的发育和功能。多组基因与协同系统一起发挥功能,例如DNA复制、蛋白质合成、神经发育等。目前,在转录水平下,不具有用于研究和表征跨越整个基因组的基因的协同表达的综合方法。
    根据表达微阵列数据,我们着手将多个基因分组或“二进制(bin)”成不同的功能组或路径。我们研发出逐步的统计学方法以鉴定多组协同调节的基因。第一步是计算在8个人类数据组的每一组中,每个基因相对于每个其他基因的表达水平的相关系数。这得到了相关得分为13000x13000的矩阵(基于由商业化微阵列芯片(Affymetrix U133A)得到的数据)。然后,跨越13000x13000的相关得分进行k均值聚类。由于微阵列芯片上的13000个基因分开跨越整个人类基因组,并且由于这13000个基因通常被认为包括了最重要的人类基因,所以13000基因芯片被认为是“整个基因组”微阵列。
    历史上,许多研究者发现了某些基因的表达水平与目的表现型或生物学状况之间的相关性。但是,这种相关性具有极有限的用途。这是因为相关性通常不会跨越数据组(例如人类乳腺肿瘤与小鼠乳腺肿 瘤、人类乳腺肿瘤与人类肺部肿瘤、或者一个基因表达技术平台(Affymetrix)与另一个基因表达技术平台(Agilent))提出。
    我们通过鉴定在跨越多个不同数据组中观察到的基因表达相关性而避免所述的陷阱。通过应用k均值聚类分析(Lloyd et al.、1982、IEEE Transactions on Information Theory 28:129-137)来测量跨越多个独立数据组的所有13000个人类基因的RNA表达值,我们将被转录的人类基因域(“转录物组”)分类成100个独特的非重叠的基因集合,就转录输出而言,所述的基因集合的表达水平一起移动(升高或降低)。在跨越多个数据组中所观察到的基因转录物水平的协同变化为我们称之为“相干”的经验现象。
    在通过k均值聚类分析而鉴定100个非重叠基因的组后,我们实施优化过程,其包括以下步骤:(a)利用相干阈值,其消除了100个组中的每一个内的离群值(单个基因);(b)鉴定并除去单个基因,其表达值在Affymetrix系统对比在Agilent系统中测定时过度改变;以及(c)在步骤(a)和(b)后,将阈值应用于任何簇中最少数量的基因。该优化过程的最终结果为一组51个所定义的、高度相干的非重叠基因列表,我们称之为“转录簇”。通过数学计算将包含数以万计的基因的生物学系统的复杂性减少至可以通过少至每组10个基因来表示的51组的基因,已经证明该集合的51个转录簇是用于解释和利用基因表达数据的有效工具。各转录簇中的基因列于表1(下表)中,并通过人类基因组机构(HUGO)符号和Entrez识别器来鉴定。
    表1
    转录簇
































    尽管转录簇通过数学分析鉴定,但是我们证明转录簇具有生物学意义。我们发现转录簇高度富集以用于多种基础的生物学结构或功能。转录簇与基础的生物学结构或功能之间的关联的实例列于下表2中。
    表2
    与转录簇相关联的生物学结构和功能

    转录簇编号相关联的生物学结构和/或功能1肿瘤组织特异性基因集合4Basiloid上皮基因5包括桥粒结构的上皮表现型17RNA剪接22TGF-β转录26增殖27细胞周期控制29DNA完整性和调节,核酸结合

    32代谢35核糖体蛋白37囊泡和细胞内蛋白质运输39缺氧应答基因40内皮特异性基因41细胞内基质、细胞接触44细胞内基质基因45细胞内基质和细胞通讯46内皮和和补充47造血细胞:富集的CD8 T细胞48富集的造血细胞、B细胞、T细胞、NK细胞49富集的造血细胞、树突状细胞、单核细胞50骨髓细胞

    对于一些转录簇而言,假设关联的生物学(结构和/或功能)是存在的,但是尚未被鉴定。但是,重要的是应该注意实施本文所公开的方法(例如鉴定用于将癌症组织分类为对抗癌药品是敏感的或抵抗的PGS)并不需要与任何转录簇相关联的任何生物学结构或功能的知识。本文所述的方法的利用单独地取决于两种类型的相关性:(1)在各转录簇中,转录物水平的相关性;以及(2)转录簇的平均表达得分与表现型(例如药品敏感性与药品抵抗性、或者良好预后与不良预后)之间的相关性。我们发现许多不同的基础的生物学结构和功能与所公开的转录簇相关联或代表,并且该发现是有力证据,说明许多及改变的表现型性状可以由本领域的技术人员容易地与一个或多个转录簇相关,而无需过度的试验。
    一旦转录簇与目的表现型(例如肿瘤对特定药品的敏感性或抵抗性)相关联,则该转录簇(或该转录簇的子集)便可以用作该表现型的多基因生物标志物。换言之,转录簇或其子集为与该转录簇相关联的表现型的PGS。任何给定的转录簇可以与多于一种的表现型相关联。
    表现型可以与多于一个的转录簇相关联。多于一个的转录簇或其子集可以为与这些转录簇相关联的表现型的PGS。
    在某些实施方案中,由表1得到的一个或多个转录簇可以通过分析可任选地排除。例如可以通过分析排除TC1、TC2、TC3、TC4、 TC5、TC6、TC7、TC8、TC9、TC10、TC11、TC12、TC13、TC14、TC15、TC16、TC17、TC18、TC19、TC20、TC21、TC22、TC23、TC24、TC25、TC26、TC27、TC28、TC29、TC30、TC31、TC32、TC33、TC34、TC35、TC36、TC37、TC38、TC39、TC40、TC41、TC42、TC43、TC44、TC45、TC46、TC47、TC48、TC49、TC50或TC51。
    为了实施本文所公开的方法,技术人员需要由以下得到的基因表达的数据(例如传统的微阵列数据或定量PCR数据):(a)对目的表现型,显示为阳性的群体;以及(b)对目的表现型,显示为阴性的群体(统称为“应答数据”)。可以用于产生应答数据的群体的实例包括代表人类患者或动物模型(例如癌症的小鼠模型)群体的组织样品群体。技术人员可以仅使用用于测量组织样品中的基因表达或转录丰度的传统方法、材料和设备而容易地获得必要的应答数据。合适的方法、材料和设备是公知的并且是市售可得的。一旦获得应答数据,便可以通过使用上述表1中所列的转录簇中的基因列表和本文所述的数学计算来实施本文所述的方法。
    如在以下实施例2中更加详细地描述的那样,我们测量了由组织样品中所有51个转录簇得到的基因子集的转录物水平,其中所述的组织样品得自对tivozanib显示为敏感的肿瘤样品群体、以及对tivozanib显示为抵抗的肿瘤样品群体。接着,在各群体的各单体中,我们计算出各簇的簇得分。然后,针对各转录簇,我们使用学生t检验来计算tivozanib敏感群体的簇得分是否显著不同于tivozanib抵抗群体的簇得分。我们发现就TC50而言,在tivozanib敏感群体的簇得分与tivozanib抵抗群体的簇得分之间具有统计学显著性差异。
    本文所公开的转录簇得自对广泛的基因组的分析,并且所述的转录簇广泛地代表对癌症生物学而言并非独特的多样化生物学结构和功能。用于预测对tivozanib的应答的转录簇TC50是由特定种类的造血细胞(渗透某些肿瘤)所表达的高度富集的基因。造血细胞对于许多生物加工而言是重要的。原理上,由该种类的造血细胞所介导的任何 表现型均可以通过测定TC50的表达情况来鉴定。
    表现型定义的群体
    群体。本文所公开的方法可以根据以下所述来使用:(a)由人类患者、动物模型或肿瘤群体得到的基因表达数据(转录丰度的数据),其中所述的人类患者、动物模型或肿瘤群体对目的表现型性状(例如对特定的药品产生应答、或癌症的预后)显示为阳性;连同(b)由多个群体得到的相对的基因表达数据或相对的转录丰度数据,其中就目的表现型性状(例如对特定的癌症药品具有敏感性、和/或在癌症的治疗中的总体预后情况)而言,所述的群体显示为是不同的。优选的是,分类群体(它们在目的表现型性状方面是不同的)在其他方面通常是可比的。例如如果药品敏感群体为特定株系的小鼠组,则抵抗群体也应该是相同株系的小鼠组。在另一个实例中,如果敏感群体为人类肾肿瘤组织活检样品集合,则抵抗群体也应该为人类肾肿瘤组织活检样品集合。
    表现型的定义。用于表现型分类的合适的标准取决于目的表现型。例如如果目的表现型为肿瘤对使用特定抗肿瘤试剂的治疗的敏感性或抵抗性,则可以根据一个或多个参数(例如在个别端点处评估的肿瘤生长的抑制(TGI)、根据生长曲线在一段时间内评估的TGI、或肿瘤史)对肿瘤进行分类。对于给定参数而言,可以设定阈值或临界值以用于区分阳性表现型和阴性表现型。特定的百分TGI通常被用作阈值或临界值。例如这可以为临床定义的RECIST标准(实体肿瘤中的应答评价标准)以用于测量人类临床试验中的TGI。在另一个实例中,利用肿瘤生长曲线中转折点的定时。在另一个实例中,使用组织评估中的给定得分。在选择用于表现型定义的合适的参数和合适的阈值方面具有相当大的自由。就抗肿瘤药品应答分类而言,合适的表现型的定义取决于多个因素,包括所涉及的肿瘤的类型和特定的药品。选择用于表现型定义的合适的参数和合适的阈值在本领域的技术范围内。
    基因表达数据
    组织样品。由人类患者肿瘤或小鼠模型肿瘤得到的组织样品可以 用作RNA源,由此可以测定各转录簇的个别平均表达得分、以及各转录簇的群体平均表达得分。肿瘤的实例为癌、肉瘤、神经胶质瘤和淋巴瘤。可以通过使用常规的肿瘤活检设备和过程来获得组织样品。内镜活检、切除活检、切口活检、细针穿刺活检、点啄活检、刮取活检和皮肤活检为被认可的医疗过程的实例,其中所述的医疗过程可以被本领域的任一技术人员使用,以获得用于实施本发明的肿瘤样品。肿瘤组织样品应该足够大,以提供用于测量个别基因的表达水平的足够的RNA。
    肿瘤组织样品可以为允许定量分析基因表达或转录丰度的任何形式。在一些实施方案中,由组织样品分离RNA,然后进行定量分析。但是,RNA分析的一些方法不需要进行RNA的提取,例如由High Throughput Genomics、Inc.(Tucson、AZ)购得的qNPATM技术。因此,组织样品可以是新鲜的、通过合适的低温技术保藏或通过非低温技术保藏。在本发明中使用的组织样品可以为临床活检样本,其通常被固定在福尔马林中,然后包埋在石蜡中。这种形式的样品通常被称为福尔马林固定、石蜡包埋(FFPE)的组织。适用于本发明的组织制备和组织保藏的技术是本领域的技术人员所公知的。
    由给定转录簇得到的代表性数量的基因的表达水平为输入值,其用于计算该转录簇在给定的组织样品中的个别平均表达得分。各组织样品为群体(例如敏感群体或抵抗群体)的成员。然后,将给定群体中所有单体的个别平均表达得分用于计算给定转录簇在给定群体中的群体平均表达得分。因此对于各组织样品而言,必须测定(即,测量)转录簇中个别基因的表达水平。可以通过任何合适的方法测定基因的表达水平(转录丰度)。用于测量个别基因表达水平的示例性方法包括DNA微阵列分析、qRT-PCR、qNPATM技术、和Plex检验系统,这些方法的每一种方方法均在下文中讨论。
    RNA分离。DNA微阵列分析和qRT-PCR通常涉及由组织样品分离RNA。用于由组织样品快速有效地提取真核生物mRNA(即,poly(a) RNA)的方法已经被良好地建立,并且是本领域的技术人员已知的。例如参见Ausubel et al、1997、Current Protocols of Molecular Biology、John Wiley&Sons。组织样品可以为新鲜的、冷冻的或固定的石蜡包埋(FFPE)的临床研究肿瘤样本。通常,由新鲜的或冷冻的组织样品分离的RNA往往比由FFPE样品分离得到的RNA形成的片段少。但是,肿瘤材料的FFPE样品是更容易获得的,并且FFPE样品是用于本发明的方法的RNA的合适的来源。关于FFPE样品作为用于通过RT-PCR来形成基因表达图谱的RNA源的讨论,例如参见Clark-Langone et al.、2007、BMC Genomics 8:279。此外,参见De Andres et al.、1995、Biotechniques 18:42044;和Baker et al.、美国专利申请公开号2005/0095634。市售可得的试剂盒(具有销售商提供的用于RNA提取和制备的说明书)的使用是广泛且普遍的。各种RNA分离产物和完整试剂盒的商业销售商包括Qiagen(Valencia、CA)、Invitrogen(Carlsbad、CA)、Ambion(Austin、TX)和Exiqon(Woburn、MA)。
    通常,RNA的分离由组织/细胞的破碎开始。在组织/细胞破碎的过程中,理想的是使RNase造成的RNA降解最少。在RNA分离过程中限定RNase活性的一种方法是一旦细胞破碎,便确保变性剂与细胞内容物接触。另一种普通的实施方法是在RNA的分离过程中包括一种或多种蛋白酶。可任选地,一旦收集到新鲜的组织样品,便在室温下将该组织样品浸渍在RNA稳定溶液中。稳定溶液快速地渗透细胞,稳定RNA用于在4℃下储存以用于随后的分离。一种此类的稳定溶液以(Ambion、Austin、TX)出售。
    在一些方案中,通过氯化铯密度梯度离心由破碎的肿瘤材料分离总RNA。通常,mRNA占总细胞RNA的大约1%至5%。固定化的oligo(dT)(例如oligo(dT)纤维素)通常用于将mRNA与核糖体RNA和转运RNA分离。如果在分离后储存RNA,则RNA必须储存在不含RNase的条件下。用于稳定的储存所分离的RNA的方法是本领域已知的。用于稳定的储存RNA的多种市售产品都是可得的。
    微阵列分析。可以使用传统的DNA微阵列表达图谱技术来测量多基因的mRNA表达水平。DNA微阵列为固定于固体表面或基底(例如玻璃、塑料或硅)上的特异性DNA节段或探针的集合,其中各特异性的DNA节段占据阵列中已知的位置。通常在严谨的杂交条件下与标记RNA样品的杂交允许检测并定量与阵列中各探针相应的RNA分子。在严谨洗涤从而除去非特异性结合的样品材料后,通过共聚焦激光显微镜或其它合适的检测方法来扫描微阵列。现代商业化的DNA微阵列(通常称为DNA芯片)通常包括数以万计的探针,因此可以同时测量数以万计的基因的表达。此类微阵列可以用于实施本文所公开的方法。备选地,定制芯片包括测量转录簇的基因表达、加上任何所需的对照或标准品所需的少量的探针。
    为了有利于数据的归一化,可以使用双色微阵列读取器。在双色(双通道)系统中,使用发射第一波长的第一荧光团标记样品,同时使用发射不同波长的第二荧光团标记RNA或cDNA标准品。例如在双色微阵列系统中一起使用Cy3(570nm)和Cy5(670nm)。
    DNA微阵列技术已经被良好地研发、市售可得并且被广泛使用的。因此,在实施本文所公开的方法时,技术人员可以使用微阵列技术来测量转录簇中基因的表达水平,而无需过度的试验。DNA微阵列芯片、试剂(例如用于RNA或cDNA制备、RNA或cDNA标记、杂交和洗涤溶液的那些)、设备(例如微阵列读取器)和方案是本领域公知的,并且可以由多种商业化来源获得。微阵列系统的商业销售商包括Agilent Technologies(Santa Clara、CA)和Affymetrix(Santa Clara、CA),但是使用其他的微阵列系统也可以使用。
    定量RT-PCR。可以使用传统的定量逆转录酶聚合酶链式反应(qRT-PCR)技术来测量代表转录簇中个别基因的mRNA的水平。qRT-PCR的优点包括敏感性、挠性、定量精确度以及区分密切相关mRNA的能力。关于对用于定量PCR的组织样品进行加工的指导可得自多种来源,包括qRT-PCR的商业化产品的制造商和销售商(例如Qiagen(Valencia、CA)and Ambion(Austin、TX))。用于自动实 施qRT-PCR的设备系统是市售可得的,并且常规地用于许多试验室中。公知的商业化系统的实例为Applied Biosystems 7900HT Fast Real-Time PCR System(Applied Biosystems、Foster City、CA)。
    一旦获得分离的mRNA,通过RT-PCR的基因表达图谱中,第一步是将mRNA模板逆转录为cDNA,该cDNA随后在PCR反应中呈指数扩增。两种常用的逆转录酶为avilo myeloblastosis病毒逆转录酶(AMV-RT)和Moloney鼠白血病病毒逆转录酶(MMLV-RT)。逆转录反应通常使用特定的引物、随机六聚体或oligo(dT)引物引发。合适的引物是市售可得的,例如RNA PCR试剂盒(Perkin Elmer、Waltham、MA)。所得的cDNA产物可以在随后的聚合酶链式反应中用作模板。
    使用热稳定的DNA依赖的DNA聚合酶实施PCR的步骤。在PCR系统中最常用的聚合物为水生栖热菌(Taq)聚合酶。PCR的选择性产生于与DNA区域(扩增的对象)(即,由转录物的基因逆转录得到的cDNA区域)互补的引物的使用。因此,当在本发明中使用qRT-PCR时,对给定转录簇中的各基因具有特异性的引物是基于该基因的cDNA序列。诸如green或(Applied Biosystems、Foster City、CA)之类的商业化的技术可以根据销售商的说明书来使用。通过与管家基因(例如β-肌动蛋白或GAPDH)的水平相比较,信使RNA水平可以针对样品加载的差异而归一化。mRNA的表达水平可以相对于任何单个的对照样品(例如由正常的非肿瘤组织或细胞得到的mRNA)来表示。备选地,mRNA的表达水平可以相对于由肿瘤细胞系或汇集的肿瘤样品得到的mRNA、或者由市售可得的对照mRNA组来表示。
    用于PCR分析转录簇中基因的表达水平的合适的引物集合可以由本领域的任一技术人员设计并合成,而无需过度的试验。备选地,用于实施本公开的方法的完整的PCR引物集合可以根据如表1中列举的、转录簇中基因的特性而购自市售的来源,例如Applied Biosystems。PCR引物的长度优选为大约17至25个核苷酸。可以使用用于估算解 链温度(Tm)的常规算法将引物设计为具有特定的Tm。用于设计引物和估算Tm的软件是市售可得的,例如Primer ExpressTM(Applied Biosystems),并且还可以得自互联网,例如Primer3(Massachusetts Institute of Technology)。通过应用已经建立的PCR引物的设计原理,可以使用大量不同的引物来测量任何给定基因的表达水平。因此,所公开的方法不限于哪个特定的引物用于转录簇中的任何给定的基因。
    定量核酸酶保护检验。在未实施RNA提取步骤的条件下测定转录簇中基因的表达水平的合适方法的实例为定量核酸酶保护检验(qNPATM),其可购自High Throughput Genomics、Inc.(aka"HTG";Tucson、AZ)。在qNPA方法中,使用专属的裂解缓冲液(HTG)在96孔板中处理样品,其中所述的裂解缓冲液将总RNA释放到溶液中。将基因特异性DNA寡核苷酸(即,对给定转录簇中的基因具有特异性)直接加入到裂解缓冲液溶液中,并且这些寡核苷酸与裂解缓冲液溶液中存在的RNA杂交。DNA寡核苷酸被过量加入,以确保与DNA寡核苷酸互补的所有RNA分子均杂交。在杂交步骤后,将S1核酸酶加入到混合物中。S1核酸酶消化靶RNA的非杂交部分、非靶RNA的全部以及过量的DNA寡核苷酸。接着,使得S1核酸酶失活。对RNA::DNA异源双链核酸分子进行处理以除去该双链分子的RNA部分,从而仅留下之前受到保护的寡核苷酸探针。留存下来的DNA寡核苷酸为原始RNA样品的化学计量的代表性文库。可以使用ArrayPlate Detection System(HTG)对qNPA寡核苷酸文库进行定量。
    分析。适用于测定转录簇中基因的表达水平的另一个技术实例为基于探针的市售可得的检验系统,其中所述的探针的分子“条形码”为nCounterTM分析系统(Technologies、Seattle、WA)。该系统被设计用于检测和计数单个反应中几百种独特的转录物。将各种彩色条形码附着在对应于目的基因(例如转录簇中的基因)的个别靶特异性探针。当探针与对照混合在一起时,探针形成了多重“码组”。Technology对每个mRNA使用2个大约50个碱基的探针,该探针在 溶液中杂交。“报告探针”携带信号,而“捕获探针”允许络合物被固定以用于收集数据。杂交后,除去过量的探针,并将探针/靶络合物比对并固定于盒中,其中所述的盒被放置在数字分析仪中。分析系统为集成系统,其包括自动化的样品制备、数字分析仪、码组(分子的条形码)、所有的试剂以及进行分析所需的消耗品。
    Plex检验。适用于测定转录簇中基因的表达水平的另一个技术实例是被称为Plex检验(Panomics、Fremont、CA)的市售可得的检验系统。该技术将分枝链DNA信号扩增与xMAP(多分析物图谱)珠结合,从而能够同时定量由新鲜、冷冻或FFPE组织样品,或者经纯化的RNA制备物直接得到的多RNA靶。对该技术的进一步描述,例如参见Flagella et al、2006、Anal.Biochem.352:50-60。
    本文所公开的实施方法不限于使用用于生成基因表达数据的任何具体的技术。如上文讨论那样,多种精确可靠的系统(包括方案、试剂盒设备)是市售可得的。在本文所述的方法中使用的、用于生成基因表达数据的合适的系统的选择和使用为设计上的选择,并且可以由本领域的技术人员完成而无需过度的试验。
    簇得分及群体之间的统计学差异
    可以根据以下算法计算各组织样品中任何给定转录簇的簇得分:

    其中E1、E2……En为针对代表各转录簇的n个基因的每一个基因所获得的相对表达值。
    在药品敏感群体中的各组织样品中以及在药品抵抗群体的各成员组织样品中,可以计算51个转录簇的每一个的簇得分。
    可以以本领域公知的多种方式(例如t检验或Kolmogorov-Smirnov检验)计算统计学意义。例如可以通过使用每个各自转录簇的转录得分、然后使用药品敏感群体与药品抵抗群体之间的双样本t检验来计算p值,由此可以进行学生t检验。参见下文中 的实施例2。另一种合适的方法为Kolmogorov-Smirnov检验,如在Subramanian、Tamayo et al、2005、Proc.Nat'l Acad.Sci USA 102:15545-15550)中所述的GSEA算法。此外,还可以通过使用Fisher确切检验来计算统计学意义(Fisher、1922、J.Royal Statistical Soc.85:87-94;Agresti、1992、Statistical Science 7:131-153),从而计算药品敏感群体与药品抵抗群体之间的p值。
    统计学显著性差异可以基于本领域公知的常用的统计学临界值。例如统计学显著性差异可以为小于或等于0.05、0.01、0.005、0.001的p值。可以使用诸如学生t检验、Kolmogorov-Smirnov检验或Fisher确切检验之类的算法来计算p值。本文考虑,使用合适的算法测定统计学显著性差异在本领域的技术范围内,并且技术人员可以基于将测定的药品和群体(例如肿瘤样品或患者群体)来选择用于测定统计学意义的合适的统计学临界值。
    转录簇的子集
    在一些实施方案中,转录簇的表达与目的表现型(例如药品抵抗的)之间的相关性是通过使用对转录簇中所有基因的表达进行测量而建立的。但是,使用对转录簇中所有基因的表达进行的测量是可任选的。在一些实施方案中,转录簇的表达与表现型之间的相关性是通过使用对由转录簇的子集(即,代表性数量的基因)的表达测量而建立的。转录簇的子集可以直接用于代表完整的转录簇,这是因为在各转录簇内,多个基因是相干表达的。根据定义,在给定转录簇内的基因的表达水平(通过转录风度表示)是相关的。通常,随着子集大小的增加,较大的子集通常会产生更精确的簇得分,并且每减少额外基因,精确性呈边际增长。较小的子集提供了方便与经济。例如,如果各转录簇由10个基因所代表,则51个转录簇的完整组可以有效地仅由510个探针所代表,这些探针可以使用目前可得自商业销售商的技术而被引入到单个微阵列新品、单个PCR试剂盒、单个nCounter AnalysisTM检验(Technologies)或单个Plex检验(Panomics、Fremont、CA)。图6列出了510个人类基因,其中51个 转录簇的每一个均由仅10个基因的子集来表示。
    这种探针数量的减少在生物标志物探索项目中可以是有利的,其中所述的项目即为将肿瘤学的临床表现型(药品应答或预后)与特定的几组生物相关基因(生物标志物)和临床检验相关联。通常,在临床实践中,收集少量的组织,而不考虑保持样品中RNA的整体性。因此,RNA的数量和质量可能不足以用于精确地测量大量基因的表达。通过大幅地减少待检验基因的数量(例如减少100倍),利用转录簇的子集能够对由少量组织(产生了低品质的RNA)得到的转录簇进行有力的分析。
    用于代表各转录簇的基因的最佳数量可以被视为测定有力性与方便程度之间的平衡。当使用转录簇的子集时,该子集优选地包括10个或更多的基因。选择作为代表性数量的合适的数量可以由本领域的技术人员来进行,而无需过度的试验。
    我们试图利用数学的严谨来证明,由转录簇1-51的任意一个得到的至少10个基因的基本上任意的子集都可以为取得该子集的完整转录簇的高度有效的替代品。换言之,我们试图测定任意随机选择的10个基因的子集是否会产生这样的个别平均表达得分,该个别平均表达得分与由各自转录簇的每个成员的表达得分计算得到的个别平均表达得分高度相关。为了实现该目的,我们由各转录簇得到10000随机选择的10个基因的子集。然后,我们计算10,000个个别平均表达得分的每一个与针对转录簇的所有基因的个别平均表达得分之间的相关性。
    表3示出了针对每一个转录簇的10,000个Pearson相关性比较的最差相关性p值。对于51个转录簇的每一个而言,10,000随机选择的10个基因的子集的每一个均产生了这样的个别平均表达得分,该个别平均表达得分与由完整转录簇计算得到的个别平均表达得分是显著相关的。这为有力的数学证明:由51个转录簇的任意一个得到的基本上任意一个10个基因的子集都足以代表完整的转录簇,所述的子集可以作为完整转录簇的高度有效的替代品,因此会大幅减少建立转录簇与 目的表现型之间的关联所必须测量的基因表达的数量(及由此减少探针的数量)。
    表3
    就各转录簇而言,由10,000随机选择的子集得到的最差p值
    TC No.p值010020030046.40E-99050067.81E-129071.29E-129082.19E-223093.89E-202103.71E-09116.91E-210122.05E-189132.34E-177146.38E-132150162.01E-150170180190208.61E-219214.50E-161225.68E-194231.55E-153241.60E-188250260270281.57E-67293.84E-219300311.60E-133320

    333.61E-124341.74E-163350361.34E-206373.04E-207381.20E-143390400410421.58E-132434.80E-228440450460470480490500511.86E-127

    表3中,0表示小于5.40E-267的p值。
    在基于子集的实施方案的另一个实例中,利用数学能力我们证明,对于任意的转录簇而言,任意10个基因的子集都产生了这样的个别平均表达得分,该个别平均表达得分与由该转录簇的每一个成员的表达得分计算得到的个别平均表达得分显著相关,其中所述的任意10个基因的子集包括由代表图6中的转录簇的子集得到的至少5个基因,以及由所述的转录簇随机选择的查询的至多5个不同的基因。换言之,对于图6中所代表的51个转录簇的每一个而言,10个基因的子集中的至多5个基因可以被选自表1中的相同选录簇的不同基因取代。
    在本证明中,对于51个转录簇的每一个而言,我们生成了10,000个新的、10个基因的子集,其中至少5个基因取自代表图6中的转录簇的10个基因的子集,并且至少5个额外的基因随机选自所述的转录簇。然后,我们计算10,000个个别平均表达得分的每一个与对于转录簇的所有基因而言的个别平均表达得分之间的相关性。对于TC1-25、TC27-36和TC38-51而言,10,000个Pearson相关性比较的最差相关 性p值为小于5.40E-267。对于TC26而言,10,000个Pearson相关性比较的最差相关性p值为3.7E-126,而TC37的最差相关性p值为2.3E-128。对于51个转录簇的每一个,10,000个新的、10个基因子集的每一个均产生这样的个别平均表达得分,该个别平均表达得分与由完整的转录簇计算得到的个别平均表达得分显著相关。这是有力的数学证明:包括由图6中的10个基因实例得到的至少5个基因以及由同一转录簇得到的至多5个随机选择的基因的、基本上任意的10个基因子集足以代表完整的转录簇,这样所述的10个基因的子集可以用作完整转录簇的高度有效的替代品。这是有利的,因为这样可以大幅减少建立转录簇与目的表现型之间的关联所需要的基因表达测量的数量(及由此减少探针的数量)。本领域的技术人员将认识到以下实例在上文所述的更广泛的证明范围内(表3和相关的讨论),所述的实例为由表1中的任意转录簇得到的基本上任意的10个基因的子集都可以用作完整转录簇的替代品。
    预测性基因集合(PGS)
    预测性基因集合(PGS)为多基因生物标志物,其可以用于针对特定的表现型而对组织类型(例如哺乳动物肿瘤)进行分类。特定的表现型的实例为:(a)对特定的癌症药品敏感;(b)对特定的癌症药品抵抗;(c)在治疗后可能具有良好的结果(良好预后);以及(d)在治疗后可能具有较差的结果(不良预后)。
    本文公开了通过使用本文所列的51个转录簇集合中的一个或多个转录簇来鉴定新型预测性基因集合的一般方法。当显示转录簇产生了与目的表现型显著相关的簇得分时,PGS是基于该转录簇或由该转录簇衍生的。在一些实施方案中,PGS包括转录簇中所有的基因。在其他的实施方案中,PGS仅包括由转录簇得到的基因的子集,而非整个转录簇。优选的是,使用本文所述的方法鉴定的PGS包括由转录簇得到的10个或更多的基因,例如11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、46、48或50个基因。
    在一些实施方案中,多于1个的转录簇与目的表现型相关联。在这种情况下,PGS可以基于任意一个相关联的转录簇或多个相关联的转录簇。
    PGS得分
    通过测量PGS中至少10个基因的每一个的表达水平(就一种组织样品而言),并根据以下算法来计算该组织样品的PGS得分,从而取得PGS的预测值:

    其中E1、E2……En为PGS中n个基因的表达值。
    可任选地,除了PGS以外,可以测量其他基因的表达水平,例如待用作内部标准品的管家基因。
    应该注意,尽管计算簇得分与计算PGS得分的算法基本上是相同的,并且这2个计算均涉及基因的表达值,但是簇得分与PGS得分是不同的。差异如本文所述。簇得分与已知表现型的样品相关联,其中所述的样品用于鉴定PGS的方法中。相反,PGS得分与未知表现型的样品相关联,其中对所述的样品进行测定并根据可能的表现型分类。
    PGS得分的解释
    PGS得分根据阈值PGS得分而进行解释。高于阈值PGS得分的PGS得分解释为指示组织样品被分类为可能具有第一表现型(例如肿瘤可能对特定药品的治疗是敏感的)。低于阈值PGS得分的PGS得分解释为指示组织样品被分类为可能具有第二表现型(例如肿瘤可能对所述的药品的治疗是抵抗的)。就肿瘤而言,给定的阈值PGS得分可以根据肿瘤类型而变化。在所公开的方法的上下文中,术语“肿瘤类型”考虑的是(a)物种(小鼠或人);以及(b)来源的器官或组织。可任选地,肿瘤类型进一步考虑到基于基因表达特征的肿瘤分类,例如,HER2-阳性的乳腺肿瘤,或表达特定EGFR突变的非小细胞肺癌。
    对于任何给定的肿瘤类型,最佳阈值PGS得分可通过进行阈值测定分析而根据经验(或至少大约地)进行测定。优选地,阈值测定分析包括受试者工作特征(ROC)曲线分析。
    ROC曲线分析是公知的统计学技术,本领域普通技术人员可应用此技术。对于ROC曲线分析的讨论一般参见Zweig et al、1993、"Receiver operating characteristic(ROC)plots:a fundamental evaluation tool in clinical medicine,"Clin.Chem.39:561-577;和Pepe、2003、The statistical evaluation of medical tests for classification and prediction、Oxford Press、New York。
    PGS得分及最佳阈值PGS得分可随肿瘤类型而不同。因此,阈值测定分析优选地使用本公开的方法在一个或多个数据组上进行的,其中所述的数据组代表待测试的任何给定的肿瘤类型。用于阈值测定分析的数据组包括:(a)实际应答数据(应答或非应答),以及(b)对于来自人类肿瘤或小鼠肿瘤的组的个别肿瘤样品的PGS得分。一旦测定了给定肿瘤类型的PGS得分阈值,此阈值可用于解释来自该肿瘤类型的肿瘤的PGS得分。
    ROC曲线分析大体上是如下进行的。PGS得分大于阈值的任何样品被鉴定为非应答者。PGS得分小于或等于阈值的任何样品被鉴定为应答者。对来自所测试的样品集合的每个PGS得分,使用该PGS得分作为阈值而分类为“应答者”和“非应答者”(假想调用(hypothetical call))。通过比较数据组的假想调用与实际应答数据,此过程使得可以对各潜在的阈值进行TPR(y矢量)和FPR(x矢量)的计算。然后,通过制作点阵图,使用TPR矢量和FPR矢量建立ROC曲线。如果ROC曲线是在点(0,0)到点(1.0,1.0)对角线之上、显示PGS测试结果相比随机测试为更好的测试(例如参见图2和4)。
    ROC曲线可用于鉴定最佳操作点。最佳操作点是产生假阳性代价相对假阴性代价之间最佳平衡的点。这些代价不必是相等的。在ROC空间中,点x,y处的分类平均期望代价由以下表达式表示:
    C=(1-p)α*x+p*β(1-y),
    其中:
    α=假阳性代价,
    β=错过阳性(假阴性)的代价,以及
    p=阳性事件的比率。
    假阳性和假阴性可通过为α和β指定不同的值而有不同的权重。例如如果目的表现型性状是药品应答的,并且决定要以治疗更多非应答者的患者作为代价而在应答者组中包含更多患者,则可以在α上给予更高的权重。在此情况下,假定假阳性和假阴性的代价是相同的(α等于β)。因此,在ROC空间中,点x,y处的分类平均期望分类代价为:
    C’=(1-p)*x+p*(1-y),
    最小的C’可以在使用假阳性和假阴性的所有对(x,y)后进行计算。最佳PGS得分阈值计算为C’处(x,y)的PGS得分。例如实施例2中所示,使用此方法测定的最佳PGS得分阈值为1.62。
    除了预测肿瘤对特定药品(例如tivozanib)的治疗是敏感的还是抵抗的,PGS得分提供了近似但有用的指示:根据PGS得分的量级,肿瘤是应答的或抵抗的可能性有多大。
    实施例
    通过以下实施例进一步说明本发明。提供实施例仅是为了示例性说明的目的,并不应该解释为以任何方式限定本发明的范围或内容。
    实施例1:鼠肿瘤-BH存档
    将多于100种鼠乳腺肿瘤(BH存档)的遗传多样性群体用于鉴定对目的药品敏感的肿瘤(应答者)和对同一目的药品抵抗的肿瘤(非应答者)。BH存档是由多于100种自发鼠乳腺肿瘤得到的原发肿瘤材料通过体内繁殖建立和冷冻保存而建立的,其中所述的鼠乳腺肿瘤由改造的嵌合小鼠衍生得到的,而所述的小鼠发育为HER2依赖的、可诱导的自发乳腺肿瘤。
    小鼠基本按照如下方式形成。将Ink4a纯合裸鼠ES细胞与下列四种构建体(为分离的片段)共转染:MMTV-rtTA、TetO-HER2V659Eneu、TetO-荧光素酶及PGK-嘌呤霉素。将携带这些构件体的ES细胞注射到3天大的C57BL/6胚囊中,将该胚囊移植到假 孕雌鼠中,使其妊娠而分娩嵌合小鼠。小鼠乳房瘤病毒(MMTV)长末端重复序列用于驱使反向四环素反式激活因子(rtTA)的乳腺特异性表达。当在小鼠的饮用水中提供多西环素时,rtTA提供了HER2活化原癌基因的乳腺特异性表达。在通过多西环素诱导西环素应答性启动子后,小鼠发展成侵入性乳腺瘤,潜伏期为大约2至6个月。
    多于100种肿瘤的BH存档基本按照如下方式形成。使用细胞筛通过对肿瘤进行物理破碎而从嵌合动物分离原发肿瘤细胞。一般地将1x105个细胞与基质胶(体积比50:50)混合,并皮下注射到雌性NCr nu/nu小鼠中。当这些肿瘤生长到大约500mm3(一般需要2-4周)时,收集其进行新一轮的体内繁殖,此后将肿瘤材料冷冻保存在液氮中。为了表征繁殖且存档的肿瘤,将由各单个的肿瘤系得到的1x105个细胞解冻,并皮下注射到BALB/c裸鼠中。当肿瘤的平均尺寸达到500至800mm3时,将动物处死并将肿瘤手术移除以用于进一步的分析。
    在组织、细胞和分子水平上表征BH肿瘤存档。分析包括普通组织病理学(结构、细胞学、纤维组织、坏疽程度、血管形态学)、IHC(例如肿瘤血管的CD31、肿瘤细胞增殖的Ki67、路径活化的信号传导蛋白)、球分子图谱(RNA表达的微阵列、针对DNA拷贝数的阵列CGH)、以及特定基因的RNA和蛋白质表达水平(qRT-PCR、免疫测试)。此类分析表明了分子改变的异常程度,这些改变在重要的表现型参数中(例如肿瘤生长速率、微血管和对不同癌症药品的不同敏感性)显示。
    例如,在大约100中BH鼠肿瘤中,组织病理学分析表明了各亚型,各亚型都具有不同的形态学特征,包括所涉及的基质细胞的水平、细胞角蛋白染色和细胞结构。一种亚型表现出巢式细胞角蛋白阳性、上皮细胞,其被胶原蛋白阳性、成纤维细胞样基质细胞包围,以及较慢的增殖速率,而第二亚型表现出实体肿瘤薄片、具有较少基质的上皮状恶性细胞、及较快的增殖速率。这些和其他亚型也可以通过它们的基因表达图谱区分。
    实施例2:Tivozanib PGS的鉴定
    就对于使用tivozanib的治疗的敏感性,测定BH鼠肿瘤存档中的肿瘤。肿瘤对该药品治疗的应答的评价基本如以下方式进行。通过将物理破碎的肿瘤细胞(与基质胶混合)注射到6周龄的雌性BALB/c裸鼠中来建立皮下移植的肿瘤。当肿瘤达到大约100-200mm3时,将20只带瘤小鼠随机分为2组。组1接受媒介物。组2通过口头填喂接受5mg/kg每日的tivozanib。使用卡尺每周2次测量肿瘤,并计算肿瘤体积。
    这些研究表明在响应于tivozanib的生长抑制中,具有明显的肿瘤间改变。应答中的这种改变是预料到的,这是因为小鼠模型肿瘤由自发产生的肿瘤繁殖,因此预计包括有助于肿瘤形成的不同组的二级新生突变。药品应答的改变是有用的且是需要的,这是因为其模制了天然形成的人类肿瘤所显示的肿瘤间改变的药品应答。根据肿瘤生长的抑制、组织病理学和IHC(CD31)来鉴定tivozanib敏感的肿瘤和tivozanib抵抗的肿瘤。通常,当使用5mg/kg tivozanib对带瘤小鼠进行治疗后,tivozanib敏感的肿瘤表现为肿瘤未发展(通过卡尺测量),而且接近完全杀灭肿瘤(除了边缘以外)。
    使用定制的Agilent微阵列(Agilent小鼠40K芯片),将由BH存档中的各肿瘤得到的信使RNA(大约6μg)扩增和杂交。常规的微阵列技术用于测量由66种肿瘤的每一种得到的组织样品中大约40000个基因的表达。将小鼠肿瘤样品的基因表达图谱与对照样品(由Stratagene得到的小鼠通用参照RNA,cat.#740100-41)比较,并且将市售可得的特征提取软件(Agilent Technologies、Santa Clara、CA)用于特征提取和数据归一化。
    针对不同转录簇中基因的平均(总计)表达,使用学生t检验来评价tivozanib敏感的肿瘤和tivozanib抵抗的肿瘤之间的差异。t检验基本如以下方式进行。将由上文所述的微阵列分析得到的基因表达值用于计算各肿瘤中各转录簇的簇得分。然后,利用双样品t检验(比较了tivozanib敏感的肿瘤和tivozanib抵抗的肿瘤)来计算各转录簇 的p值。此外,还计算了假阳性率(FDR)。10个最高得分的转录簇的p值和假阳性率示于表4中。
    表4
    Tivozanib敏感的肿瘤与tivozanib抵抗的肿瘤中,转录簇表达的学生t检验结果
    TC No.结构/功能p值FDRTC50骨髓细胞4E-040.003TC48富集的造血细胞;树突状细胞;单核细胞0.0010.004TC46富集的造血细胞;CD68细胞0.0030.005TC4Basiloid上皮基因0.0040.005TC5上皮表现型,桥粒结构0.0040.005TC42 0.0040.005TC9 0.0090.009TC6 0.0120.011TC38 0.0150.011TC8 0.0170.011

    通过进一步考虑将假阳性发现率大于0.005的转录簇删除。2个转录簇(即,TC50和TC48)被鉴定为假阳性发现率大于0.005。TC50被鉴定为具有最低的假阳性率,即,0.003。TC50的高表达与tivozanib抵抗有关。
    本实施例证明了本公开的方法的能力。在本实施例中,常规微阵列表达图谱的数学分析得到TC50,其与骨髓细胞的某些子集(可以调节非VEGF依赖的血管再生术)有关,由此提供了tivozanib抵抗的机制。
    实施例3:预测小鼠对tivozanib的应答
    在涉及25种肿瘤群体的试验中评价在实施例2中鉴定的tivozanib PGS(TC50)的预测能力,其中所述的25种肿瘤群体事先基于如实施例1和2所述,对使用tivozanib的实际药品应答测定而被分类为tivozanib敏感的或tivozanib抵抗的。这25种肿瘤得自原发小鼠肿瘤(其中驱动原癌基因是HER2)的专属存档(proprietary archive)。在本实施例中,使用的PGS为由TC50得到的以下10基因子集:
    MRC1
    ALOX5AP
    TM6SF1
    CTSB
    FCGR2B
    TBXAS1
    MS4A4A
    MSR1
    NCKAP1L
    FLI1
    由通过常规微阵列分析得到的基因表达数据来计算各肿瘤的PGS得分。我们根据以下算法来计算tivozanib PGS得分:

    其中E1、E2……En为PGS中n个基因的表达值。
    由该试验得到的数据概括于图1的瀑布图中。在阈值测定分析中,使用ROC曲线分析凭经验测定最佳阈值PGS得分为1.62。由ROC曲线分析得到的结果概括于图2中。
    当使用该阈值时,在25种肿瘤中,所述的测定正确地预测了22种肿瘤是tivozanib敏感的(应答的)或tivozanib抵抗的(非应答的)(图1)。在预测tivozanib抵抗的情况下,假阳性率为25%,假阴性率为0%。利用Fisher确切检验评估所述结果的统计学意义(Fisher、1922、J.Royal Statistical Soc.85:87-94;Agresti、1992、Statistical Science 7:131-153),从而估计应答者富集的p值。在这种情况下,用于Fisher确切检验的列联表示于图5中(下图):
    表5
    用于预测Tivozanib应答的列联表
     实际敏感的实际抵抗的总计所谓敏感的9312所谓抵抗的01313总计91625

    在本实施例中,Fisher确切检验的p值为0.00722,其为由于偶然 而观察到该检验结果的可能性。该p值是统计学意义的传统临界值(即,p=0.05)的6.9倍。
    实施例4:纳巴霉素PGS的鉴定
    测定由BH鼠肿瘤存档得到的肿瘤对使用纳巴霉素(叶称为西罗莫司或)治疗的敏感性。肿瘤对纳巴霉素治疗的评价基本如以下方式进行。通过将破碎的肿瘤细胞(原发肿瘤材料)与基质胶混合物理注射到6周龄的磁性BALB/c裸鼠中以建立皮下移植的肿瘤。当肿瘤达到大约100-200mm3时,将20只带瘤小鼠随机分为2组。组1接受赋形剂。组2通过腹膜内注射每日接受0.1mg/kg的纳巴霉素。使用卡尺每周2次测量肿瘤,并计算肿瘤体积。这些研究表明在响应于纳巴霉素的生长抑制中,具有明显的肿瘤间改变。纳巴霉素抵抗的肿瘤被定义为表现出肿瘤生长抑制达50%或更低的那些。纳巴霉素敏感的肿瘤被定义为表现出肿瘤生长抑制达到高于50%的那些。在66种测定的肿瘤中,发现41种肿瘤是纳巴霉素敏感的,并发现25种肿瘤是纳巴霉素抵抗的。
    按照上文实施例2中所述由所述的肿瘤制备mRNA并进行微阵列分析。为了根据51个转录簇的表达富集情况来鉴定纳巴霉素敏感的肿瘤与纳巴霉素抵抗的肿瘤之间的差异,我们将Gene Set Enrichment Analysis(GSEA)应用于由41中纳巴霉素敏感的肿瘤和25种纳巴霉素抵抗的肿瘤得到的RNA表达数据。(对于GSEA的讨论,参见Subramanian et al.、2005、"Gene set enrichment analysis:A knowledge-based approach for interpreting genome-wide expression profiles,"Proc.Natl.Acad.Sci.USA 102:15545-15550.)
    对RNA表达数据应用GSEA表明,根据51个转录簇的表达情况,纳巴霉素敏感组与纳巴霉素抵抗组之间的差异是显著的。表6(下文中)示出了肿瘤敏感组的GSEA结果。当根据假阳性率q值来评级时,发现最富集的高表达的转录簇为TC33。
    表6
    纳巴霉素敏感的肿瘤的GSEA结果

    表7(下文中)示出了肿瘤抵抗组的GSEA结果。当根据假阳性率q值来评级时,发现最富集的高表达的转录簇为TC26。
    表7
    纳巴霉素抵抗的肿瘤的GSEA结果

    在纳巴霉素敏感的肿瘤中最高富集的转录簇(TC33)与在纳巴霉素抵抗的肿瘤中最高富集的转录簇(TC26)用于形成20个基因的纳巴霉素PGS,该20个基因的纳巴霉素PGS由得自TC33的10个基因和得自TC26的10个基因组成。这种特定的纳巴霉素PGS包括以下20个基因:
    TC33TC26FRYDTLHLFCTPSHMBSGINS2RCAN2GMNNHMGA1MCM5

    ITPR1PRIM1ENPP2SNRPASLC16A4TK1ANK2UCK2PIK3R1PCNA

    由于PGS包括在敏感性肿瘤中受到上调的10个基因以及在抵抗性肿瘤中受到上调的10个基因,使用以下算法来计算雷帕霉素PGS得分:

    其中E1、E2……Em为在敏感性肿瘤中受到上调的m基因标识的表达值(TC33);并且其中F1、F2……Fn为在抵抗性肿瘤中受到上调的n基因标识的表达值(TC26)。在上述实施例中,m为10,n为10。
    实施例5:预测鼠对纳巴霉素的应答
    在涉及66种肿瘤群体的试验中评价在实施例4中鉴定的纳巴霉素PGS的预测能力,其中所述的66种肿瘤群体事先基于实施例4所述,对使用纳巴霉素的实际药品应答测定而被分类为纳巴霉素敏感的或纳巴霉素抵抗的。这66种肿瘤得自原发小鼠肿瘤(其中驱动原癌基因是HER2)的专属存档。由通过常规微阵列分析得到的基因表达数据来计算各肿瘤的PGS得分。由本试验得到的数据概括于图3所示的瀑布图中。在阈值测定分析中,使用ROC曲线分析凭经验测定最佳阈值PGS得分为0.011。由ROC曲线分析得到的数据概括于图4中。
    当使用该阈值时,在66种肿瘤中,所述的测试正确地预测(即,68.2%)了45种肿瘤是纳巴霉素敏感的(应答的)或纳巴霉素抵抗的(非应答的)(图3)。在预测纳巴霉素抵抗的情况下,假阳性率为16%,假阴性率为41%。利用Fisher确切检验评估所述结果的统计学意义(Fisher、supra;Agresti、supra),从而估计应答者富集的p值。在这种情况下,用于Fisher确切检验的列联表示于表8中。
    表8
    用于预测纳巴霉素应答的列联表
     实际敏感的实际抵抗的总计所谓敏感的24428所谓抵抗的172138总计412566

    在本实施例中,Fisher确切检验的p值为0.000815。其表示了单独由于偶然而观察到该检验结果的可能性是0.000815,这是仅仅由于偶然而观察到该检验结果的可能性。该p值是统计学意义的传统临界值的61.4倍,即,p=0.05。
    实施例6:乳腺癌预后PGS的鉴定
    使用295个乳腺肿瘤群体(NKI乳腺癌数据组)来分离具有短期远端转移(不良预后,5年内转移)的肿瘤与具有长期远端转移(良好预后,5年内未转移)的肿瘤。在295个NKI乳腺肿瘤中,196个样品是良好预后的,78个样品是不良预后的。
    当将由NKI乳腺数据组得到的196个良好预后肿瘤与由NKI乳腺数据组得到的78个不良预后肿瘤相比较时,鉴定代表生物学途径的差异表达基因集合。使用Gene Set Enrichment Analysis(GSEA),对51个转录簇评价良好预后的肿瘤与不良预后的肿瘤之间,途径基因列表的富集差异。在比较良好预后肿瘤与不良预后肿瘤中,我们的分析证明其成员基因表现出显著的表达差异的转录簇TC35(与核糖体相关联的)为良好预后组中过表达最多的转录簇(表9)。
    表9良好预后的肿瘤的GSEA结果

    如在表10所呈现的GSEA结果,在不良预后组中,TC26(与增值相关联)为过表达最多的转录簇。
    表10
    不良预后的肿瘤的GSEA结果

    将良好预后肿瘤的最富集的转录簇(TC35)与不良预后肿瘤的最富集的转录簇(TC26)用于形成20个基因的乳腺癌预后PGS,其由得自TC35的10个基因和得自TC26的10个基因组成。该特定的乳腺癌PGS包括以下20个基因:
    TC35TC26RPL29DTLRPL36ACTPSRPS8GINS2RPS9GMNNEEF1B2MCM5RPS10P5PRIM1RPL13ASNRPARPL36TK1RPL18UCK2RPL14PCNA

    由于乳腺癌预后PGS包括在良好预后肿瘤中受到上调的10个基因以及在不良预后肿瘤中受到上调的10个基因,使用以下算法来计算乳腺癌预后PGS得分:

    其中E1、E2……Em为在良好预后肿瘤中受到上调的m基因标识的表达值(TC35);并且其中F1、F2……Fn为在不良预后肿瘤中受到上调的n基因标识的表达值(TC26)。在上述实施例中,m为 10,n为10。
    实施例7:乳腺癌预后PGS的确认
    在独立的乳腺癌数据组(即,Wang乳腺癌数据组)中确认实施例6(上文)中鉴定的预后PGS(Wang et al.、2005、Lancet365:671-679)。由Wang乳腺癌数据组得到的286个乳腺肿瘤群体用作独立的确认数据组。Wang数据组中的样品具有包括总生存期和时间(死亡或未死亡)的临床注释。实施例6中鉴定的20个基因的乳腺癌预后PGS为患者结果的有效预测剂。这在图5中显示,其为Kaplan-Meier生存曲线的比较。该Kaplan-Meier图示出了患者生存百分率与时间(月计)。上方曲线表示PGS得分高的患者(得分高于阈值),这些患者取得了相对较长的实际生存。下方曲线表示PGS得分低的患者(得分低于阈值),这些患者取得了相对较短的实际生存。Cox比例风险回归模型分析显示由TC35和TC26形成的PGS为有效的预后生物标志物,并且p值为4.5e-4,风险比为0.505。
    实施例8:预测人类应答
    以下预后实施例详细地说明了技术人员如何使用本公开的方法(使用数据)来预测人类对tivozanib的应答。
    就给定的肿瘤类型(例如肾细胞癌)而言,肿瘤样品(存档的FFPE块、新鲜样品或冷冻的样品)得自使用tivozanib治疗患者前的人类患者(间接通过医院或临床试验室)。根据标准的组织学过程,将新鲜的或冷冻的肿瘤样品在10%中性缓冲的福尔马林中放置5-10小时,然后用醇脱水,并包埋在石蜡中。
    由10μm FFPE部分提取RNA。通过二甲苯提取和然后的乙醇洗涤除去石蜡。使用商业化的RNA制备试剂盒分离RNA。使用合适的商业化试剂盒对RNA进行定量,例如荧光法(Molecular Probes、Eugene、OR)。通过传统方法分析RNA的大小。
    使用用于qRT-PCR的SuperscriptTMFirst-Strand Synthesis Kit(Invitrogen)来进行逆转录。总的RNA和合并的基因特异性引物分别以10-50ng/μl和100nM(各种引物)存在。
    对于PGS中的各基因而言,使用商业化的软件设计qRT-PCR引物,例如Primer软件(Applied Biosystems、Foster City、CA)。根据设备制造商或销售商的建议,使用商业化的合成设备和合适的试剂来合成寡核苷酸引物。使用合适的商业化标记试剂盒标记探针。
    使用Applied Biosystems 7900HT设备,根据制造商的说明在384孔板中进行反应。使用1ng总RNA/反应孔合成的cDNA,在2个重复的5μl反应物中测量PGS中各基因的表达。最终的引物和探针浓度分别为0.9μΜ(各引物)和0.2μΜ。根据标准的操作过程进行PCR循环。为了证实qRT-PCR信号是由于RNA而不是污染的DNA,对于各测定的基因,未平行运行RT对照。在qRT-PCR(由探针被切割而释放荧光信号的时间点开始)过程中,对于给定的扩增曲线而言,阈值循环增加超过了特定的荧光阈值设定。具有较大的内部模板的测定样品在扩增循环早期便超过了阈值。
    为了比较所有样品的基因表达水平,将基于5个参照基因(管家基因,其表达水平与所评价的肿瘤类型的所有样品相似)的归一化用于校正各测试孔中由于RNA品质和RNA总量的改变而引起的差异。各样品的参照CT(阈值循环)定义为参照基因的平均测量CT。测定基因的归一化mRNA水平定义为ΔCT,其中ΔCT=参照基因CT-测定基因CT
    根据上文所述的算法,由基因的表达水平来计算各肿瘤样品的PGS得分。与测定的肿瘤样品相关联的实际应答数据得自提供肿瘤样品的医院或临床试验室。通常,根据肿瘤缩小(例如缩小30%,通过合适的成像技术测定,例如CT扫描)来定义临床应答。在一些情况下,根据时间(例如无进展生存期)来定义人类临床应答。如上文所述,计算给定肿瘤类型的最佳阈值PGS得分。随后,该最佳阈值PGS得分用于预测相同肿瘤类型的新测定的人类肿瘤对使用tivozanib进行的治疗是应答的还是非应答的。
    参考文献的引入
    对于所有目的而言,本文引用的各专利文件和科学文章的完全公开以引用方式并入本文。
    等价物
    在不脱离本发明的基本特征的条件下,本发明可以以其他特定的形式体现。因此,之前的实施方案应考虑为是示例性的,而非限定了本文所述的发明。本发明的范围由所附的权利要求书而非之前的描述来表明,并且在与权利要求书等价的含义和范围内的所有改变均将涵盖在本发明的范围内。

    关 键  词:
    多基因 生物 标志 鉴定
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:多基因生物标志物的鉴定.pdf
    链接地址:https://www.zhuanlichaxun.net/p-43920.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1