《多基因生物标志物的鉴定.pdf》由会员分享,可在线阅读,更多相关《多基因生物标志物的鉴定.pdf(71页完整版)》请在专利查询网上搜索。
1、10申请公布号CN104093859A43申请公布日20141008CN104093859A21申请号201280068771322申请日2012110561/579,53020111222USC12Q1/6820060171申请人AVEO制药公司地址美国马萨诸塞72发明人M罗宾逊冯斌R尼古勒蒂JP弗雷德里克L皮利波维奇74专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人袁泉54发明名称多基因生物标志物的鉴定57摘要本发明公开了鉴定用于预测对目的抗癌药品是敏感的或抵抗的多基因生物标志物、或多基因癌症预后生物标志物的方法。所公开的方法是基于将哺乳动物基因组分类为51个转录簇,即,。
2、非重叠的、功能相关的一组基因,其组内的转录水平是高度相关的。此外,本发明还公开了用于预测对TIVAZANIB或纳巴霉素是敏感的或抵抗的特异性多基因生物标志物,以及用于测定乳腺癌预后的特异性多基因生物标志物,所有这些标志物均是使用本文所公开的方法鉴定的。30优先权数据85PCT国际申请进入国家阶段日2014080186PCT国际申请的申请数据PCT/US2012/0635792012110587PCT国际申请的公布数据WO2013/095793EN2013062751INTCL权利要求书4页说明书59页附图7页19中华人民共和国国家知识产权局12发明专利申请权利要求书4页说明书59页附图7页10。
3、申请公布号CN104093859ACN104093859A1/4页21一种鉴定预测性基因集合“PGS”的方法,其中所述的预测性基因集合用于将癌症组织分类为对特定的抗癌药品或抗癌药品类型是敏感的或抵抗的,所述的方法包括A测量由表1中的转录簇得到的代表性数量的基因在以下中的表达水平I由被鉴定为对抗癌药品敏感的癌症组织的群体得到的组织样品集合,和II由被鉴定为对抗癌药品抵抗的癌症组织的群体得到的组织样品集合;以及B测定代表性数量的基因在由所述的敏感群体得到的组织样品集合中和在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异,其中在敏感群体中的基因表达水平显著不同于在抵抗群体。
4、中的基因表达水平的、代表性数量的基因为用于将样品分类为对所述的抗癌药品是敏感的或抵抗的PGS。2权利要求1所述的方法,其中将所述的敏感群体的平均簇得分与所述的抵抗群体的平均簇得分相比较的学生T检验用于测定所述的代表性数量的基因在由所述的敏感群体得到的组织样品集合中和在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。3权利要求1所述的方法,其中基因集合富集分析GSEA用于测定所述的代表性数量的基因在由所述的敏感群体得到的组织样品集合中和在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。4权利要求1所述的方法,其中所述的代表性数量的基因为10。
5、个或更多。5权利要求4所述的方法,其中所述的代表性数量的基因为15个或更多。6权利要求5所述的方法,其中所述的代表性数量的基因为20个或更多。7权利要求1所述的方法,其中所述的组织样品选自肿瘤样品或血液样品。8权利要求1所述的方法,其中针对所述的51个转录簇的每一个实施步骤A和B。9权利要求1所述的方法,其中步骤A包括测量图6中代表所述的51个转录簇的每一个的10个基因在以下中的表达水平I由被鉴定为对所述的抗癌药品敏感的癌症组织的群体得到的组织样品集合,和II由被鉴定为对所述的抗癌药品抵抗的癌症组织的群体得到的组织样品集合;并且步骤B包括针对所述的51个转录簇的每一个,测定图6中的10个基因的。
6、表达水平之间是否具有统计学显著性差异,其中所述的基因代表由所述的敏感群体得到的组织样品集合中的簇、以及由所述的抵抗群体得到的组织样品集合中的簇;其中由图6中所述的转录簇得到的10个基因所代表的转录簇为用于将样品分类为对所述的抗癌药品是敏感的或抵抗的PGS,其中所述的基因在所述的敏感群体中的基因表达水平与该基因在所述的抵抗群体中的基因表达水平显著不同。10权利要求9所述的方法,其中所述的PGS基于转录簇的多样性。11一种鉴定预测性基因集合“PGS”的方法,其中所述的预测性基因集合用于将癌症患者分类为具有良好预后或不良预后,所述的方法包括A测量由表1中的转录簇得到的代表性数量的基因在以下中的表达水。
7、平I由被鉴定为具有良好预后的癌症患者群体得到的组织样品集合;以及II由被鉴定为具有不良预后的癌症患者群体得到的组织样品集合;以及B测定代表性数量的基因在由所述的良好预后群体得到的组织样品集合中和在由所权利要求书CN104093859A2/4页3述的不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异,其中在良好预后群体中的基因表达水平显著不同于其在不良预后群体中的基因表达水平的、代表性数量的基因为用于将患者分类为良好预后或不良预后的PGS。12权利要求11所述的方法,其中将所述的良好预后群体的平均簇得分与所述的不良预后群体的平均簇得分相比较的学生T检验用于测定所述的代表性数量。
8、的基因在由所述的良好预后群体得到的组织样品集合中和在由所述的不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。13权利要求11所述的方法,其中GSEA用于测定所述的代表性数量的基因在由所述的良好预后群体得到的组织样品集合中和在由所述的不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。14权利要求11所述的方法,其中所述的代表性数量的基因为10个或更多。15权利要求14所述的方法,其中所述的代表性数量的基因为15个或更多。16权利要求15所述的方法,其中所述的代表性数量的基因为20个或更多。17权利要求11所述的方法,其中所述的组织样品选自肿瘤样品或血。
9、液样品。18权利要求11所述的方法,其中针对所述的51个转录簇的每一个实施步骤A和B。19权利要求11所述的方法,其中步骤A包括测量图6中代表所述的51个转录簇的每一个的10个基因在以下中的表达水平I由被鉴定为具有良好预后的癌症患者群体得到的组织样品集合,和II由被鉴定为具有不良预后的癌症患者群体得到的组织样品集合;并且步骤B包括针对所述的51个转录簇的每一个,测定图6中的10个基因的表达水平之间是否具有统计学显著性差异,其中所述的基因代表由所述的良好预后群体得到的组织样品集合以及由所述的不良预后群体得到的组织样品集合中的簇;其中由图6中所述的簇得到的10个基因所代表的转录簇为用于将患者分类为。
10、具有良好预后或不良预后的PGS,其中所述的基因在所述的良好预后群体中的基因表达水平与其在所述的不良预后群体中的基因表达水平显著不同。20权利要求19所述的方法,其中所述的PGS基于转录簇的多样性。21探针集合,该探针集合包括针对由表1中的各转录簇得到的至少10个基因的探针,前提条件是所述的探针集合不是完整基因组微阵列芯片。22权利要求21所述的探针,其中所述的探针选自A微阵列探针集合;BPCR引物集合;CQNPA探针集合;D包括分子条形码的探针集合;以及E其中探针被固定在珠上的探针集合。23权利要求21所述的的探针集合,其中所述的探针集合包括针对图6中列举的510个基因的每一个的探针。24权利。
11、要求23所述的的探针集合,其中所述的探针集合由针对图6中列举的510个基因的每一个的探针、以及对照探针集组成。25一种鉴定人类肿瘤对使用TIVOZANIB或纳巴霉素进行的治疗可能是敏感的或抵抗的、或者将人类乳腺癌患者分类为具有良好预后或不良预后的方法,其中所述的方法选权利要求书CN104093859A3/4页4自A一种鉴定人类肿瘤对使用TIVOZANIB进行的治疗可能是敏感的或抵抗的方法,该方法包括I在由肿瘤得到的样品中,测量预测性基因集合PGS中各基因的相对表达水平,其中所述的PGS包括由TC50得到的至少10个所述的基因,以及II根据所述的算法计算PGS得分其中E1、E2EN为所述的PGS。
12、中N个基因的表达值,并且其中低于定义阈值的PGS得分表明所述的肿瘤对TIVOZANIB可能是敏感的,而高于所述的定义阈值的PGS得分表明所述的肿瘤对TIVOZANIB可能是抵抗的;B一种鉴定人类肿瘤对使用纳巴霉素进行的治疗可能是敏感的或抵抗的方法,该方法包括I在由所述的肿瘤得到的样品中,测量预测性基因集合PGS中各基因的相对表达水平,其中所述的PGS包括由A由TC33得到的至少10个基因、以及B由TC26得到的至少10个基因,II根据所述的算法计算PGS得分其中E1、E2EM为由TC33得到的至少10个基因的表达值,其中所述的基因在敏感性肿瘤中受到上调;而F1、F2FN为由TC26得到的至少1。
13、0个基因的表达值,所述的基因在抵抗性肿瘤中受到上调,并且其中高于所述的定义阈值的PGS得分表明所述的肿瘤对纳巴霉素可能是敏感的,而低于所述的定义阈值的PGS得分表明所述的肿瘤对纳巴霉素可能是抵抗的;以及C一种将人类乳腺癌患者分类为具有良好预后或不良预后的方法,该方法包括I在由所述的患者的肿瘤得到的样品中,测量预测性基因集合PGS中各基因的相对表达水平,其中所述的PGS包括由A由TC35得到的至少10个基因、以及B由TC26得到的至少10个基因,II根据所述的算法计算PGS得分其中E1、E2EM为由TC35得到的至少10个基因的表达值,其中所述的基因在良好预后的患者中受到上调;而F1、F2FN为。
14、由TC26得到的至少10个基因的表达值,所述的基因在不良预后的患者中受到上调,并且其中高于所述的定义阈值的PGS得分表明所述的患者具有良好预后,而低于所述的定义阈值的PGS得分表明所述的患者可能具有不良预后。26权利要求25A所述的方法,其中所述的PGS包括TC50的10基因子集,该子集选自AMRC1、ALOX5AP、TM6SF1、CTSB、FCGR2B、TBXAS1、MS4A4A、MSR1、NCKAP1L和FLI1;以权利要求书CN104093859A4/4页5及BLAPTM5、FCER1G、CD48、I2、C1QB、NCF2、CD14、TLR2、CCL5和CD163。27权利要求25B所述。
15、的方法,其中所述的PGS包括以下基因FRY、HLF、HMBS、RCAN2、HMGA1、ITPR1、ENPP2、SLC16A4、ANK2、PIK3R1、DTL、CTPS、GINS2、GMNN、MCM5、PRIM1、SNRPA、TK1、UCK2和PCNA。28权利要求25C所述的方法,其中所述的PGS包括以下基因RPL29、RPL36A、RPS8、RPS9、EEF1B2、RPS10P5、RPL13A、RPL36、RPL18、RPL14、DTL、CTPS、GINS2、GMNN、MCM5、PRIM1、SNRPA、TK1、UCK2和PCNA。29权利要求25所述的方法,该方法进一步包括进行阈值测定分析的。
16、步骤,由此生成定义阈值,其中所述的阈值测定分析包括受试者工作特征曲线分析。30权利要求25所述的方法,其中所述的PGS中各基因的相对表达水平是通过选自以下的方法测量的ADNA微阵列分析;BQRTPCR分析;CQNPA分析;D基于分子条形码的测定;以及E基于多重珠的测定。权利要求书CN104093859A1/59页6多基因生物标志物的鉴定0001相关申请的交叉引用0002本申请要求2011年12月22日提交的美国临时申请系列号61/579,530的利益和优先权;该申请的全部内容以引用方式并入本文。技术领域0003本发明的领域为分子生物学、遗传学、肿瘤学、生物信息学和诊断性检验。背景技术0004大。
17、多数的癌症药品在一些患者中是有效的,但是在其他患者中则是无效的。该结果源自肿瘤中的遗传变异,并且甚至可以在同一患者的多种肿瘤中观察到。就靶向治疗而言,特别宣布了不同的患者的应答。因此,在不具有合适的检验来测定哪位患者将受益于哪种药品的条件下,不能实现靶向治疗的全部潜力。根据国立卫生研究院NIH,术语“生物标志物”定义为“可客观测量的特征,并且该特征被评价为正常的生物或致病过程、或者对治疗干预的药理学应答的指示剂”。0005基于生物标志物的发现来开发改良诊断学通过事先鉴定最可能对给定药品显示临床应答的这些患者而具有加速新药品研发的潜力。这会显著地减小临床试验的规模、时间和成本。目前,诸如基因组学。
18、、蛋白质组学和分子影像学之类的技术能够快速、敏感且可信赖地检测特定的基因突变、具体基因的表达水平以及其他分子生物标志物。尽管有多种用于肿瘤的分子表征的技术是可利用的,但是由于已经发现的癌症生物标志物很少,所以很大程度上癌症生物标志物的临床应用仍未实现。例如近来的综述文章陈述非常需要加速研发生物标志物及它们的用途,以改善癌症的诊断和治疗。CHO、2007、MOLECULARCANCER625。0006另一篇近来关于癌症生物标志物的综述文章包括以下评论挑战在于发现癌症生物标志物。尽管使用分子靶向试剂在靶向多种类型肿瘤的分子定义的子集例如慢性粒细胞白血病、胃肠道间质瘤、肺癌和多形性胶质母细胞瘤中已经。
19、获得临床上的成功,但是缺乏有效的策略来评价患者的靶向试剂严重地限制了更广泛地应用这些成功的能力。问题主要在于不能选择患有分子定义的癌症的患者来进行评价这些令人激动的新药品的临床试验。解决方法需要这样的生物标志物,该生物标志物可信赖地鉴定最可能受益于特定试剂的那些患者。SAWYERS、2008、NATURE452548552、AT548。诸如之前之类的评论表明已经意识到特别是在肿瘤性领域中,需要发现临床用途的预测性生物标志物。0007公认的是,需要鉴定多基因生物标志物的方法,其中所述的多基因生物标志物用于鉴定哪些患者为使用给定药品或治疗进行治疗的合适的候选者。就靶向癌症治疗而言,这是特别需要的。。
20、0008发明概述0009使用基因表达图谱技术、专属的生物信息学工具和应用统计学,我们发现哺乳动物基因组可以有效地通过51组非重叠的、功能相关的基因表示,这51组基因的组间转录物说明书CN104093859A2/59页7水平受到协同调节,即,在多个微阵列数据集中,是强相关的或“相干的”。我们将这些组的基因定义为基因转录簇151TC1TC51。基于该发现,我们发现了用于快速鉴定以下的广泛适用的方法A对目的抗癌药品具有敏感性或抗性的多基因预测性生物标志物;或B多基因癌症预后性生物标志物。我们将此类多基因生物标志物称为预测性基因集合或PGS。0010PGS可以基于一个转录簇或多个转录簇。在一个实施方案。
21、中,PGS基于完整的一个或多个转录簇。在其他的实施方案中,PGS基于个别转录簇或多个转录簇的子集中的基因的子集。由任何给定的转录簇得到的基因的子集代表取得该基因的子集的完整的转录簇,这是因为所述的转录簇内的基因的表达是相干的。因此,当使用转录簇中的基因的子集时,该子集代表由该转录簇得到的基因的子集。0011本文提供了鉴定预测性基因集合“PGS”的方法,其中所述的预测性基因集合用于将癌症组织分类为对特定的抗癌药品或抗癌药品类型是敏感的或抵抗的。所述的方法包括以下步骤A测量由表1中的转录簇得到的代表性数量的基因例如10、15、20或更多的基因在以下中的表达水平I由被鉴定为对抗癌药品敏感的癌症组织的。
22、群体得到的组织样品集合,和II由被鉴定为对抗癌药品抵抗的癌症组织的群体得到的组织样品集合;以及B测定代表性数量的基因在由所述的敏感群体得到的组织样品集合中和在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。在敏感群体中的基因表达水平显著不同于其在抵抗群体中的基因表达水平的、代表性数量的基因为用于将样品分类为对所述的抗癌药品是敏感的或抵抗的PGS。可以使用学生T检验或基因集合富集分析GSEA来测定代表性数量的基因在由所述的敏感群体得到的组织样品集合中与在由所述的抵抗群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。在一些实施方案中,针对本文所公开的51个。
23、转录簇的每一个,实施步骤A和B。所述的组织样品可以为肿瘤样品或血液样品。0012本文提供了用于鉴定PGS的另一种方法,其中所述的PGS用于将癌症组织分类为对特定抗癌药品或某类药品是敏感的或抵抗的。所述的方法包括A测量图6中代表51个转录簇的每一个的10个基因在以下中的表达水平I由被鉴定为对所述的抗癌药品敏感的癌症组织的群体得到的组织样品集合,和II由被鉴定为对抗癌药品抵抗的癌症组织的群体得到的组织样品集合;以及B针对51个转录簇的每一个,测定图6中的10个基因的表达水平之间是否具有统计学显著性差异,其中所述的10个基因代表由敏感群体得到的组织样品集合与由抵抗群体得到的组织样品集合的基因簇。在一。
24、些实施方案中,转录簇为用于将样品分类为对抗癌药品是敏感的或抵抗的的PGS,其中所述的转录簇由图6中所示的簇得到的10个基因表示,并且在敏感群体中表现出基因表达的水平,该基因表达的水平显著不同于抵抗群体中基因表达的水平。在一个实施方案中,PGS基于多个转录簇。所述的组织样品可以为肿瘤样品或血液样品。0013本文提供了用于鉴定PGS的一种方法,其中所述的PGS用于将癌症患者分类为良好预后或不良预后。所述的方法包括A测量由表1中的转录簇得到的代表性数量的基因例如10、15、20或更多的基因在以下中的表达水平I由被鉴定为良好预后的癌症患者群体得到的组织样品集合,和II由被鉴定为不良预后的癌症患者群体得。
25、到的组织样品集合;以及B测定代表性数量的基因在由良好预后群体得到的组织样品集合中和在由不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。在良说明书CN104093859A3/59页8好预后群体中的基因表达水平显著不同于其在不良预后群体中的基因表达水平的、代表性数量的基因为用于将患者分类为良好预后或不良预后的PGS。可以使用学生T检验或基因集合富集分析GSEA来测定代表性数量的基因在由良好预后群体得到的组织样品集合中与在由不良预后群体得到的组织样品集合中的表达水平之间是否具有统计学显著性差异。在一些实施方案中,针对本文所公开的51个转录簇的每一个,实施步骤A和B。所述的组织。
26、样品可以为肿瘤样品或血液样品。0014本文提供了用于鉴定PGS的另一种方法,其中所述的PGS用于将癌症患者分类为对良好预后或不良预后。所述的方法包括A测量图6中代表51个转录簇的每一个的10个基因在以下中的表达水平I由被鉴定为良好预后的癌症患者群体得到的组织样品集合,和II由被鉴定为不良预后的癌症患者群体得到的组织样品集合;以及B针对51个转录簇的每一个,测定图6中的10个基因的表达水平之间是否具有统计学显著性差异,其中所述的基因代表由所述的良好预后的群体得到的组织样品集合与由所述的不良预后的群体得到的组织样品集合的簇。在一些实施方案中,由图6中所述的簇得到的10个基因所代表的转录簇为用于将患。
27、者分类为具有良好预后或不良预后的PGS,其中所述的基因在所述的良好预后群体中的基因表达水平与其在所述的不良预后群体中的基因表达水平显著不同。在其他的实施方案中,PGS基于多个转录簇。所述的组织样品可以为肿瘤样品或血液样品。0015本文提供了鉴定人类肿瘤对使用抗癌药品TIVOZANIB进行的治疗可能是敏感的或抵抗的方法。所述的方法包括A在由肿瘤得到的样品中,测量PGS中各基因的相对表达水平,其中所述的PGS包括由TC50得到的至少10个基因;以及B根据以下算法计算PGS得分00160017其中E1、E2EN为PGS中N个基因的表达值,其中N为PGS中的基因数量,并且其中低于定义阈值的PGS得分表。
28、明肿瘤对TIVOZANIB可能是敏感的,而高于所述的定义阈值的PGS得分表明肿瘤对TIVOZANIB可能是抵抗的。在一个实施方案中,PGS包括TC50的10个基因子集。由TC50得到的示例性10个基因子集为MRC1、ALOX5AP、TM6SF1、CTSB、FCGR2B、TBXAS1、MS4A4A、MSR1、NCKAP1L和FLI1。由TC50得到的另一个示例性10个基因子集为LAPTM5、FCER1G、CD48、I2、C1QB、NCF2、CD14、TLR2、CCL5和CD163。0018在一些实施方案中,将人类肿瘤鉴定为对使用TIVOZANIB进行的治疗可能是敏感的或抵抗的方法包括进行阈值测定。
29、分析,由此生成定义阈值。阈值测定分析可以包括受试者工作特征曲线分析。可以通过DNA微阵列分析、QRTPCR分析、QNPA分析、基于分子条形码的测定或基于多重珠的测定来测定例如测量PGS中各基因的相对基因表达水平。0019本文提供了鉴定人类肿瘤对使用纳巴霉素的治疗可能是敏感的或抵抗的方法。该方法包括A在由肿瘤得到的样品中,测量PGS中各基因的相对表达水平,其中是所述的PGS包括I由TC33得到的至少10个基因;以及II由TC26得到的至少10个基因;以及B根据以下算法计算PGS得分0020说明书CN104093859A4/59页90021其中E1、E2EM为由TC33得到的M个基因的表达值例如其。
30、中M为至少10个基因,所述的基因在敏感性肿瘤中受到上调;而F1、F2FN为由TC26得到的N个基因的表达值例如其中N为至少10个基因,所述的基因在抵抗性肿瘤中受到上调。高于定义阈值的PGS得分表明肿瘤对纳巴霉素可能是敏感的,而低于所述的定义阈值的PGS得分表明肿瘤对纳巴霉素可能是抵抗的。示例性的PGS包括以下基因FRY、HLF、HMBS、RCAN2、HMGA1、ITPR1、ENPP2、SLC16A4、ANK2、PIK3R1、DTL、CTPS、GINS2、GMNN、MCM5、PRIM1、SNRPA、TK1、UCK2和PCNA。0022在一些实施方案中,鉴定人类肿瘤对使用纳巴霉素进行的治疗可能是敏。
31、感的或抵抗的方法包括进行阈值测定分析,由此生成定义阈值。阈值测定分析可以包括受试者工作特征曲线分析。可以通过DNA微阵列分析、QRTPCR分析、QNPA分析、基于分子条形码的测定或基于多重珠的测定来测定例如测量PGS中各基因的相对基因表达水平。0023本文提供了将人类乳腺癌患者分类为良好预后或不良预后的方法。该方法包括A在由患者的肿瘤得到的样品中,测量PGS中各基因的相对表达水平,其中是所述的PGS包括I由TC35得到的至少10个基因;以及II由TC26得到的至少10个基因;以及B根据以下算法计算PGS得分00240025其中E1、E2EM为由TC35得到的M个基因的表达值例如其中M为至少10。
32、个基因,所述的基因在良好预后的患者中是上调的;而F1、F2FN为由TC26得到的N个基因的表达值例如其中N为至少10个基因,所述的基因在不良预后的患者中是上调的。高于定义阈值的PGS得分表示患者良好预后,而低于所述的定义阈值的PGS得分表示患者可能不良预后。示例性的PGS包括以下基因RPL29、RPL36A、RPS8、RPS9、EEF1B2、RPS10P5、RPL13A、RPL36、RPL18、RPL14、DTL、CTPS、GINS2、GMNN、MCM5、PRIM1、SNRPA、TK1、UCK2和PCNA。0026在一些实施方案中,将人类乳腺癌患者分类为良好预后或不良预后的方法包括进行阈值测定。
33、分析,由此生成定义阈值。阈值测定分析可以包括受试者工作特征曲线分析。可以通过DNA微阵列分析、QRTPCR分析、QNPA分析、基于分子条形码的测定或基于多重珠的测定来测定例如测量PGS中各基因的相对基因表达水平。0027本文提供了探针集合,该探针集合包括针对由表1的各转录簇得到的至少10个基因的探针,前提条件是所述的探针集合并非为整个基因组微阵列芯片。合适的探针集合的实例包括微阵列探针集合、PCR引物集合、QNPA探针集合、包括分子条形码的探针集合例如TECHNOLOGY或其中探针被固定在珠上的探针集合例如PLEXASSAYSYSTEM。在一个实施方案中,所述的探针集合包括针对图6中所列的51。
34、0个基因的每个基因的探针。在另一个实施方案中,所述的探针集合由针对图6中所列的510个基因的每个基因的探针、以及对照探针集组成。在另一个实施方案中,所说明书CN104093859A5/59页10述的探针包括针对由表1中各转录簇得到的10个基因的探针其中所述的探针集合包括针对由图6所示的各转录簇得到的至少5个基因、以及由表1中各转录簇随机选择的各相应的转录簇得到的至多5个基因的探针、以及可任选的对照探针。在某些实施方案中,探针集合包括大约5101020个探针、5101530个探针、5102040个探针、5102550个探针、或5105100个探针。0028通过考虑以下附图、发明详述和权利要求书,。
35、本发明的这些及气体方面和益处将变得显而易见。附图说明0029图1为概括了实施例3的数据的水平图,其中实施例3为证明了在实施例2中鉴定的TIVOZANIBPGS的预测能力的试验。每个柱都表示25个肿瘤群体中的一个肿瘤。肿瘤通过PGS得分排列由低至高。各肿瘤的PGS得分通过柱的高度表示。实际应答者TIVOZANIB敏感的通过黑柱表示;实际非应答者TIVOZANIB抵抗的通过灰柱表示。预测应答者为低于PGS得分最佳阈值的那些,所述的PGS得分最佳阈值经计算为162通过水平虚线表示。预测非应答者为高于所述的阈值的那些。0030图2为基于图1中的数据的受试者工作特征ROC曲线。一般而言,ROC曲线用于测。
36、定最佳阈值。图2中的ROC曲线表明该试验中的最佳阈值PGS得分为162。当使用该阈值时,所述的测定由25个肿瘤中正确地分类22个,并且假阳性率为25,假阴性率为0。0031图3为概括了实施例5的数据的水平图,其中实施例5为证明了在实施例4中鉴定的纳巴霉素PGS的预测能力的试验。每个柱都表示66个肿瘤群体中的一个肿瘤。肿瘤通过PGS得分排列由低至高。各肿瘤的PGS得分通过柱的高度表示。实际应答者通过黑柱表示;实际非应答者通过灰柱鉴定。预测应答者为低于PGS得分最佳阈值的那些,所述的PGS得分最佳阈值经计算为0011通过水平虚线表示。预测非应答者为高于所述的阈值的那些。0032图4为以图3中的数据。
37、为基础的受试者工作特征ROC曲线。图4中的ROC曲线表明该试验中的最佳阈值PGS得分为0011。当使用该阈值时,所述的测定由66个肿瘤中正确地分类45个,并且假阳性率为16,假阴性率为41。0033图5为通过使用实施例6中的PGS生成的KAPLANMEIER生存者曲线的比较,其中所述的曲线将WANG乳腺癌数据组中提出的286名乳腺癌患者群体分类,如实施例7所述。该图显示了患者存活的百分率与时间以月份表示。上方曲线表示PGS得分高的患者得分高于阈值,该患者取得了相对较长的实际存活时期。下方曲线表示PGS得分低的患者得分低于阈值,该患者取得了相对较短的实际存活时期。COX比例风险回归模型分析显示由。
38、TC35和TC26生成的PGS是有效的预后生物标志物,其P值为45E4,风险比值为0505。划线表示检查过的患者。0034图6为列出了510个人类基因的表,其中表1中51个转录簇的每个转录簇都由10个基因的子集表示。0035发明详述0036定义说明书CN104093859A106/59页110037如本文所用,当“相干性”用于一个集合的基因时,其是指在给定类型的组织例如肿瘤组织中,所述集合的成员的表达水平显示出统计学显著的、一致增加或降低的趋势。无意于被理论所束缚,本发明人指出相干性可能表明相干基因共同参与了一个或多个生物学功能。0038如本文所述,“最佳阈值PGS得分”是指这样的阈值PGS得。
39、分,在该得分,分类器在假阴性调用代价和假阳性调用代价之间给出最理想的平衡。0039如本文所用,就给定的表现型例如对特定的癌症药品是敏感的或抵抗的而言,“预测性基因集合”或“PGS”是指一组十个或更多的基因,其在给定类型的组织样品中的PGS得分与给定类型的组织中的给定表现型显著相关。0040如本文所用,“良好预后”是指预计患者在初次诊断为癌症的5年内不具有肿瘤的远转移。0041如本文所用,“不良预后”是指预计患者在初次诊断为癌症的5年内具有肿瘤的远转移。0042如本文所用,“探针”是指能够用于测量特定基因的表达情况的分子。示例性探针包括PCR引物以及基因特异性DNA寡核苷酸探针,例如固定于微阵列。
40、基底上的微阵列探针、定量核酸酶保护检验探针、与分子条形码连接的探针、以及固定于珠上的探针。0043如本文所用,“受试者工作特征”ROC曲线是指就二元分类器系统而言,假阳性率敏感性对比真阳性率特异性的图表。在ROC曲线的构建中,使用以下定义0044假阴性率FNR1TPR0045真阳性率TPR真阳性/真阳性假阴性0046假阳性率FPR假阳性/假阳性真阴性0047如本文所用,就治疗的肿瘤而言,对治疗的“应答”或“响应”是指该肿瘤显示A生长减缓;B生长中断;或C衰退。对治疗产生应答的肿瘤为“应答者”并且对治疗是“敏感的”。对治疗不产生应答的肿瘤为“非应答者”并且对治疗是“抵抗的”。0048如本文所用,。
41、“阈值测定分析”是指对代表给定肿瘤类型例如人肾细胞癌的数据组进行的分析,以测定用于该特定肿瘤类型的阈值PGS得分,例如最佳阈值PGS得分。就阈值测定分析而言,代表给定肿瘤类型的数据组包括A实际应答数据应答或非应答;以及B由一组带瘤小鼠或人得到的各种肿瘤的PGS得分。0049转录簇0050许多生物学家目前认为在哺乳动物中表达的大约25000个基因经历了复杂的调节,从而执行有机体的发育和功能。多组基因与协同系统一起发挥功能,例如DNA复制、蛋白质合成、神经发育等。目前,在转录水平下,不具有用于研究和表征跨越整个基因组的基因的协同表达的综合方法。0051根据表达微阵列数据,我们着手将多个基因分组或“。
42、二进制BIN”成不同的功能组或路径。我们研发出逐步的统计学方法以鉴定多组协同调节的基因。第一步是计算在8个人类数据组的每一组中,每个基因相对于每个其他基因的表达水平的相关系数。这得到了相关得分为13000X13000的矩阵基于由商业化微阵列芯片AFFYMETRIXU133A得到的数据。然后,跨越13000X13000的相关得分进行K均值聚类。由于微阵列芯片上的13000个基因分开跨越整个人类基因组,并且由于这13000个基因通常被认为包括了最重要的人说明书CN104093859A117/59页12类基因,所以13000基因芯片被认为是“整个基因组”微阵列。0052历史上,许多研究者发现了某些基。
43、因的表达水平与目的表现型或生物学状况之间的相关性。但是,这种相关性具有极有限的用途。这是因为相关性通常不会跨越数据组例如人类乳腺肿瘤与小鼠乳腺肿瘤、人类乳腺肿瘤与人类肺部肿瘤、或者一个基因表达技术平台AFFYMETRIX与另一个基因表达技术平台AGILENT提出。0053我们通过鉴定在跨越多个不同数据组中观察到的基因表达相关性而避免所述的陷阱。通过应用K均值聚类分析LLOYDETAL、1982、IEEETRANSACTIONSONINFORMATIONTHEORY28129137来测量跨越多个独立数据组的所有13000个人类基因的RNA表达值,我们将被转录的人类基因域“转录物组”分类成100个。
44、独特的非重叠的基因集合,就转录输出而言,所述的基因集合的表达水平一起移动升高或降低。在跨越多个数据组中所观察到的基因转录物水平的协同变化为我们称之为“相干”的经验现象。0054在通过K均值聚类分析而鉴定100个非重叠基因的组后,我们实施优化过程,其包括以下步骤A利用相干阈值,其消除了100个组中的每一个内的离群值单个基因;B鉴定并除去单个基因,其表达值在AFFYMETRIX系统对比在AGILENT系统中测定时过度改变;以及C在步骤A和B后,将阈值应用于任何簇中最少数量的基因。该优化过程的最终结果为一组51个所定义的、高度相干的非重叠基因列表,我们称之为“转录簇”。通过数学计算将包含数以万计的基。
45、因的生物学系统的复杂性减少至可以通过少至每组10个基因来表示的51组的基因,已经证明该集合的51个转录簇是用于解释和利用基因表达数据的有效工具。各转录簇中的基因列于表1下表中,并通过人类基因组机构HUGO符号和ENTREZ识别器来鉴定。0055表10056转录簇0057说明书CN104093859A128/59页1300580059说明书CN104093859A139/59页140060说明书CN104093859A1410/59页150061说明书CN104093859A1511/59页160062说明书CN104093859A1612/59页170063说明书CN104093859A171。
46、3/59页180064说明书CN104093859A1814/59页190065说明书CN104093859A1915/59页200066说明书CN104093859A2016/59页210067说明书CN104093859A2117/59页220068说明书CN104093859A2218/59页230069说明书CN104093859A2319/59页240070说明书CN104093859A2420/59页250071说明书CN104093859A2521/59页260072说明书CN104093859A2622/59页270073说明书CN104093859A2723/59页28007。
47、4说明书CN104093859A2824/59页290075说明书CN104093859A2925/59页300076说明书CN104093859A3026/59页310077说明书CN104093859A3127/59页320078说明书CN104093859A3228/59页330079说明书CN104093859A3329/59页340080说明书CN104093859A3430/59页350081说明书CN104093859A3531/59页360082说明书CN104093859A3632/59页370083说明书CN104093859A3733/59页380084说明书CN1040。
48、93859A3834/59页390085说明书CN104093859A3935/59页400086说明书CN104093859A4036/59页410087说明书CN104093859A4137/59页420088说明书CN104093859A4238/59页430089尽管转录簇通过数学分析鉴定,但是我们证明转录簇具有生物学意义。我们发现转录簇高度富集以用于多种基础的生物学结构或功能。转录簇与基础的生物学结构或功能之间的关联的实例列于下表2中。0090表20091与转录簇相关联的生物学结构和功能0092转录簇编号相关联的生物学结构和/或功能1肿瘤组织特异性基因集合4BASILOID上皮基因5。
49、包括桥粒结构的上皮表现型17RNA剪接22TGF转录说明书CN104093859A4339/59页4426增殖27细胞周期控制29DNA完整性和调节,核酸结合32代谢35核糖体蛋白37囊泡和细胞内蛋白质运输39缺氧应答基因40内皮特异性基因41细胞内基质、细胞接触44细胞内基质基因45细胞内基质和细胞通讯46内皮和和补充47造血细胞富集的CD8T细胞48富集的造血细胞、B细胞、T细胞、NK细胞49富集的造血细胞、树突状细胞、单核细胞50骨髓细胞00930094对于一些转录簇而言,假设关联的生物学结构和/或功能是存在的,但是尚未被鉴定。但是,重要的是应该注意实施本文所公开的方法例如鉴定用于将癌症组织分类为对抗癌药品是敏感的或抵抗的PGS并不需要与任何转录簇相关联的任何生物学结构或功能的知识。本文所述的方法的利用单独地取决于两种类型的相关性1在各转录簇中,转录物水平的相关性;以及2转录簇的平均表达得分与表现型例如药品敏感性与药品抵抗性、或者良好预后与不良预后之间的相关性。我们发现许多不同的基础的生物学结构和功能与所公开的转录簇相关联或代表,并且该发现是有力证据,说明许多及改变的表现型性状可以由本领域的技术人员容易地与一个或多个转录簇相关,而无需过度的试验。0095一旦转录簇与目的表现型例如肿瘤对特定药品的敏感性或抵抗性相关联,则该转录簇或该转录簇的子集便可以用作。