BRCA1活性调节子 发明领域
本发明广泛涉及人类疾病领域,更特别地涉及对基于具有BRCA1活性的调节子的疾病的治疗和诊断方法。
发明背景
乳腺癌是美国死于癌症的妇女的主要病因,每年有近170000名妇女罹患该病。报导病例的5%被认为起因于患者对该病有遗传倾向。乳腺癌通常可分为早期发作和晚期发作型,后者定义为在50岁左右发病。诊断患有乳腺癌的40岁以下妇女的接近25%被认为是家族性的,因此是有遗传因素的。晚期型乳腺癌也常是家族性的,虽然该病患者的家庭成员患此病的危险要少于早期型患者的家庭成员。
根据对遗传性早期乳腺癌和卵巢癌家族的研究,据称与这些疾病相关的一个基因已确定位于17号染色体的长臂,命名为BRCA1,或乳腺癌1基因(breast cancer one gene)。见Hitoyuki T.等,癌症研究,55:2998-3002。对偶发乳腺癌的研究也表明该病与更精确地定位于染色体区17q21地BRCA1有遗传联系。见Hall J.M.等,科学,250:1684-1689(1990)。
最近,BRCA1基因已被克隆,显示出编码一个有肿瘤抑制蛋白活性的蛋白质。参见Miki Y.等,科学,266:66-71;WO96/05306。一段时间以来,人们已经知道许多癌症至少部分起因于某些称为“原癌基因”的正常基因的突变。“原癌基因”参与调节正常细胞生长,其方式刚刚开始在分子水平进行探讨。突变的“原癌基因”,或称为“癌基因”的致癌基因破坏了正常细胞生长,如果癌症不能及时发现和治疗,这最终将导致生物的死亡。正常或癌细胞生长过程中,“原癌基因”或“癌基因”分别与调节或试图调节正常细胞或癌细胞的生长调节子相抗衡。这种蛋白称为肿瘤抑制蛋白,包括BRCA1、P53、成视网膜细胞瘤蛋白(Rb),多发性结肠腺癌蛋白(APC)、Wilm癌1型蛋白(WT1)、1型神经纤维瘤蛋白(NF1)和2型神经纤维瘤蛋白(NF2)。
BRCA1 cDNA编码具1863个氨基酸的一个蛋白质,理论分子量接近207000。参见Miki Y.等(1994),科学,266:66-71。BRCA1经过克隆和鉴定表明是一个肿瘤抑制蛋白。例如几位研究者最近的工作表明将BRCA1基因序列转染到MCF-7肿瘤细胞中并表达时,抑制了体内肿瘤生长,延长了患有肿瘤的动物的存活时间。参见Holt J.T.等,(1996),国家遗传学(Nat.Genet.),12:298-302。用表达抗已形成的MCF-7腹膜肿瘤的野生型BRCA1的逆转录病毒载体得到相似的结果。
已有大量工作致力于鉴定BRCA1中影响其肿瘤抑制活性的区域。看来该分子的不同区域对其肿瘤抑制活性影响不同。例如,近手全长的截短BRCA1蛋白不抑制乳腺癌细胞生长,但能抑制卵巢癌细胞生长。参见Holt J.T.等,(1996),国家遗传学,12:298-302。这些现象有力地提示不同的宿主细胞因子,推测是一些蛋白质,与BRCA1不同区域相互作用而影响细胞生长。
在过去几年中已着手阐明某些肿瘤抑制蛋白与宿主细胞蛋白的相互作用。参见Levin A.,生物化学年度综述,1993,62卷:623-651。鉴定参与这些相互作用的蛋白将有助于发展新的诊断方法,和新的确诊、治疗癌症的疗法。例如,成视网膜细胞瘤抑制蛋白邻近脯氨酸的丝氨酸处于磷酸化状态。细胞周期S、G2和M期磷酸化水平高,影响这个反应的激酶依次被调节细胞周期的一个细胞周期蛋白激活。随后在有丝分裂晚期,磷酸酶移去该蛋白质的磷酸基团,成视网膜细胞瘤抑制蛋白在G0-G1期恢复非磷酸化状态。显然,鉴定出能影响这些相互作用的药物有望在调节细胞生长中发挥重要作用,因而能应用于癌症治疗。
然而,到目前为止,对与肿瘤抑制蛋白BRCA1的相互作用的研究很少。为了完善诊断和治疗乳腺癌、卵巢癌的方法,关键在于鉴定和分离出这样的蛋白质。
发明概述
本发明第一个目的是描述一族相关的分离核酸序列,它们编码以下称为调节子蛋白的能结合肿瘤抑制蛋白BRCA1的蛋白质。
本发明第二个目的是描述一族相关的分离核酸序列,它们编码分子量大约45-97Kdal的BRCA1调节子蛋白,所述蛋白质至少有一个亮氨酸拉链结构域,任选有一个锌指结构域,它们结合位于BRCA1前600个氨基酸内用于调节子蛋白结合的不连续序列。
本发明第三个目的是描述有一个亮氨酸拉链结构域和一个锌指结构域的分子量约为53Kdal的BRCA1调节子蛋白,所述两个结构域均靠近分子的氨基端,结合BRCAI上位于BRCA1前600个氨基酸内调节子蛋白结合的共有序列。
本发明第四个目的是分别描述BRCA1调节子蛋白的分离核酸或蛋白质片段。
本发明第五个目的是描述用编码BRCA1调节子蛋白或片段的分离的核酸序列转化了的宿主细胞。
本发明第六个目的是描述含有编码BRCA1调节子蛋白或片段的分离的核酸序列的载体。
本发明第七个目的是描述由BRCA1和BRCA1调节子蛋白的全长或片段组成的复合物。
本发明第八个目的是描述利用编码BRCA1调节子蛋白全长或其片段的分离核酸序列或其片段诊断疾病,优选涉及不希望的细胞生长的疾病(包括癌症)的方法。
本发明第九个目的是描述一种检验方法,用于鉴定对涉及不希望的细胞生长的疾病(包括癌症)有疗效的化合物。
在阅读了下述说明书中对本发明各个方面的描述后,本发明以上和其它目的对本领域技术人员将是显而易见的。本发明上述和其它内容在下面的附图、发明详述、实施例中将作更详细解释。
附图概述
图1显示BRCA1调节子蛋白的cDNA和氨基酸序列,描述为1号序列,091-21A31。
图2显示BRCA1调节子蛋白的cDNA和氨基酸序列,描述为3号序列,091-1F84。
图3显示BRCA1调节子蛋白的cDNA和氨基酸序列,描述为5号序列,091-132Q20。
图4显示可提高细胞内BRCA1含量的化合物的鉴定方法模式。
表1显示BRCA1中与BRCA1调节子蛋白3号序列091-1F84,1号序列091-21A31,5号序列091-132Q20相互作用的区域。实验中利用双杂合检测方法,参见美国专利5 283 173或Chien等,1991,美国国家科学院院报,88:9578-9582。编码3号序列091-1F84,1号序列091-21A31和5号序列091-132Q20的cDNA与GAL4激活结构域融合,表中显示的BRCA1区域与GAL4结合结构域融合。“+”号作为β-半乳糖苷酶活性指标。一个“+”号表示活性最低,三个表示活性最高。
表2显示BRCA1调节子蛋白1号序列091-21A31中与BRCA1的区域相互作用的区域。
发明详述
说明书中提到的所有出版物和专利申请在此引入作为参考,它们在同一程度上被引用,似乎每篇出版物或专利申请都是特别地并单独地引入作为参考。
定义
首先需要指出,除非另有规定,此处所有科技名词与本发明所属领域的技术人员通常理解的含义相同。一般所用的术语和下面描述的实验操作是本领域内公知和常用的。重组核酸方法、多核苷酸合成、微生物培养及转化(如电穿孔、脂质体转染)均使用标准技术。通常,酶反应和提纯步骤均参照生产商说明。技术和操作通常按照本领域常规方法和常用参考书进行(通常参考Sambrook等,分子克隆:实验室手册,第二版(1989),冷泉港实验室出版社,冷泉港,N.Y.,在此引入作为参考)。此处所用的术语和下面描述的分析化学、有机合成化学及药物配制实验操作是本领域内公知和常用的。化学合成、化学分析、药物配制和给药、患者医治均使用标准技术。
表示本发明BRCA1或BRCA1调节子蛋白选定的特定实施方案的分子式中,尽管常常未特别指出,但应理解氨基和羧基末端基团为处于生理pH值时的构型,除非另有规定。因此,应理解在生理pH值时为N-端H2+和C-端O-状态,在特定实施例或分子式中不特别说明。此处所用多肽符号与标准使用方法和传统一致,即分子左手端是氨基末端,右手端是羧基末端。当然,酸和碱式盐,包括在非生理pH值时形成的盐,也包含在本发明化合物中。文中所述氨基酸残基优选为L异构型。20个常见氨基酸、非天然氨基酸如a,a-分布的氨基酸(a,a-distributed amino acids)、N-烷基化氨基酸、乳酸及其它非常规氨基酸的立体异构体(如D型氨基酸)也适合作为本发明多肽的组分,只要该多肽仍保留了所需的功能性质即可。对于图示的多肽而言,每个编码残基适当时用三字母表示,与常见氨基酸的三字母名称一致,这符合标准多肽命名法(描述于生物化学杂志,243:3553-59(1969)),在37CFR§1.822(6)(2)中采用。
游离官能团,包括位于羧基和氨基末端的(称为非干扰性取代基),也可以是酰胺化、酰基化或其它改变化合物溶解度而不影响其活性的取代。这在已知BRCA1调节子蛋白具有能结合BRCA1的某些区,并希望从这些区域制备可溶性多肽的情况中尤其有用。
本发明公开中使用的下列术语,除非另有说明,作如下理解:
“分离的蛋白质”在本文中指一种来源于cDNA、重组RNA的蛋白质,或者来源于合成的或某种组合的蛋白质,由于其来源,所述“分离的蛋白质”(1)基本上与自然界发现的蛋白质无关,(2)基本不含相同来源的其它蛋白质,如不含人蛋白质,(3)可以用其它种的细胞表达,或(4)自然界中不存在。
此处用于描述物质的“自然存在”是指该物质能在自然界中找到。例如,存在于生物体(包括病毒)内,能从自然界来源中分离得到,未被人有意在实验室修饰过的多肽和多核苷酸序列是自然存在的。
术语“多核苷酸”在本文中指一个至少10个碱基长的多聚体形式的核苷酸,可以是核糖核苷酸或脱氧核糖核苷酸或这两种类型的修饰形式。该术语包括单链或双链DNA。
本文所用术语“寡核苷酸”包括自然存在的、或通过自然存在或非自然存在的寡核苷酸键连接在一起的修饰核苷酸。寡核苷酸是具200个碱基或更短的多核苷酸子集合。优选寡核苷酸长度为10到60个碱基,最优选12、13、14、15、16、17、18、19或20到40个碱基。寡核苷酸通常是单链的,例如用作探针;虽然也可以是双链的,例如用于构建基因突变体。本发明的寡核苷酸可以是有义或反义寡核苷酸。本文所用术语“自然存在的核苷酸”包括核糖核苷酸或脱氧核糖核苷酸。本文所用术语“修饰的核苷酸”包括带有修饰的或取代的糖基等的核苷酸。本文所用术语“寡核苷酸键”包括如硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯(phosphoroselenoate)、二硒代磷酸酯(phosphorodiselenoate)、phosphoroanilothioate、phosphoroaniladate、氨基磷酸酯等寡核苷酸键。需要时寡核苷酸可带有检测标记。
本文所用术语“序列同源性”是描述两个核酸序列之间碱基匹配的比例或两个氨基酸序列之间氨基酸匹配的比例。若序列同源性表示为百分比,如50%,则该百分比表示与其它序列进行比较的BRCA1序列长度上的匹配比例。可以允许存在缺口(在两个序列中任一个)以达到最大匹配程度;一般所用缺口长度为15个碱基或更少,优选6个碱基或更少,更优选2个碱基或更少。寡核苷酸用作探针或处理时,目标核酸和寡核苷酸序列之间序列同源性一般在20个可能的寡核苷酸碱基对配对中有不少于17个目标碱基匹配(85%);优选10个可能的碱基对配对中有不少于9个目标碱基匹配(90%);最优选20个可能的碱基对配对中不少于19个目标碱基匹配(95%)。
如果两个氨基酸序列部分或全部相同,则它们是同源的,例如,85%同源性意味着两个序列排列比较达到最大匹配时有85%氨基酸是相同的。可以允许存在缺口(在两个序列任一个中)以达到最大匹配程度;缺口长度优选5个碱基或更少,更优选2个碱基或更少。可替代地并优选地,如果两个蛋白质序列(或来源于它们的最少30个氨基酸的多肽序列)用具有突变数据矩阵和缺口罚分为6或更大的ALIGN程序得到的序列对比度大于5(标准偏差单位),则它们是同源的。参见Dayhoff M.O.,蛋白序列与结构图谱,1972,第五卷,国家生物医学研究基金会,101-110,和该卷的第2号增刊,1-10页。更优选地,若用ALIGN程序最佳排列使两个序列或其部分的氨基酸有50%或以上相同时,则它们是同源的。
BRCA1调节子蛋白的一个特点是有亮氨酸拉链结构域。后者描述为富含亮氨酸残基的一段氨基酸,通常为每第7个残基,通过它,蛋白质可二聚化形成同源或异源二聚体。有亮氨酸拉链的蛋白包括Jun和Fos。
BRCA1调节子蛋白的一个任选的特点是有锌指结构域,优选类型是C3H2C3,C3HC4,或CX2CX11-27CXHX2H或CX2CX6-17CX2C;其中C、X和H分别代表半胱氨酸、一个氨基酸和组氨酸。这个结构域结合锌离子,经常与结合DNA的蛋白质有关。用本领域人员知道的合适的数据库,特别是Prosite Protein Database易于识别这样的结构域。
本文所用“基本纯”意味着目的种类是优势种类(即组合物中,在摩尔水平上,它比其它种类大分子含量高),优选地,基本纯的级分是目的种类至少占所有种类大分子的50%(摩尔基础上)的一种组合物。通常,一种基本纯的组合物是组合物中目的种类占所有种类大分子的80%以上,更优选高于85%、90%、95%和99%。最优选目的种类已纯化至基本同质(组合物中不能由常规检测方法发现污染种类),其中组合物基本由一种大分子组成。
“调节子蛋白”、“调节肽”或“调节多肽”指的是影响BRCA1基因的活性或该基因编码的蛋白质的活性的蛋白质或肽。每个定义包括一个或更多这样的实体。
化学术语的使用按照本领域内常规使用方法,示例见此处引作参考的《McGraw-Hill化学名词词典》(Parker S.编,1985),McGraw-Hil,San Francisco。
通过基因工程由克隆的基因制备蛋白质是公知的技术。参见Bell等的美国专利4 761 371号第6列第3行到第9列第65行(所有引用的专利文献的公开内容均在此引入作为参考)。下面的讨论意欲作为本领域概述,不求反映全貌。
功能相关的DNA区是可操纵地连接在一起的。例如:启动子与由它控制转录的编码序列是可操纵地连接的;核糖体结合位点可操纵地连接到由它决定起始翻译的编码序列上。通常可操纵地连接意味着是邻近的,在前导序列的情况中,是邻近的且读框一致的。
合适的宿主细胞包括原核细胞、酵母细胞或高等真核细胞。原核细胞包括革兰氏阴性和阳性生物体,如大肠杆菌或杆菌属(Bacilli)。高等真核细胞包括下面描述的来源于哺乳动物的已建好的细胞系。可作为例子的宿主细胞是DH5α、E.coli W3110(ATCC27 325)、E.coli B、E.coli X1776(ATCC31 537)、E.coli294(ATCC31 446)。假单胞菌、芽孢杆菌和粘质沙雷氏菌(Serratia marcesans)也是合适的宿主。
在昆虫系统中,苜蓿银纹夜蛾(Autographa californica)核型多角体病毒(AcNPV)可作为表达外源基因的载体。(参见Smith等,1983,病毒学杂志,46:584;Smith,美国专利第4 215 051号)。在下面描述的一个特定实施方案中,用表达标记了glu-glu表位的BRCA1调节子蛋白构建体的杆状病毒载体感染Sf9昆虫细胞。参见Rubinfeld等,生物化学杂志,270(10):5549-5555(1995)。可使用本领域公知的其它表位标记,包括6x组氨酸标记、myc或EE-标记(即Glu-Glu标记)。E代表谷氨酸。
有多种合适的微生物载体可供选择。通常,一种微生物载体包含能被目的宿主识别的复制起点、在宿主中能行使功能的启动子和表型选择基因如编码赋予抗生素抗性或提供自养需要的蛋白质的基因。可构建相似的构建体以用于其它宿主。大肠杆菌通常使用pBR322转化,参见Bolivar等,基因,2,95(1977)。pBR322含有氨苄青霉素和四环素抗性基因,因此易于鉴定到转化细胞。表达载体应含有能被宿主生物识别的启动子。这通常意味着启动子来源于目的宿主。最常用于重组微生物表达载体的启动子包括β-内酰胺酶(青霉素酶)和乳糖启动子系统(Chang等,自然,275,615(1978);Goeddel等,核酸研究,8,4057(1980)和欧洲专利申请36 776),tac启动子(H.De Boer等,美国国家科学院院报,80,21(1983))。这些是常用的,其它微生物启动子也是适宜的。许多启动子的核酸序列细节已公开,技术人员可以将它们可操纵地连接到质粒或病毒载体上编码BRCA1的DNA上(Siebenlist等,细胞,20,269,1980)。启动子和Shine-Dalgarno(SD)序列(用于在原核宿主中表达的情况)被可操纵地连接到编码BRCA1的DNA上,即它们的定位能促进从DNA到BRCA1信使RNA的转录。SD序列能通过它与大肠杆菌16S rRNA 3′末端的碱基配对促进mRNA与核糖体的结合(Steitz等(1979),生物调节与发育:基因表达(R.F.Goldberger编))。要表达具有弱核糖体结合位点的原核基因和真核基因参见Sambrook等,(1989)“大肠杆菌中克隆基因的表达”,《分子克隆:实验室指南》。此外,细菌启动子可以包括自然存在的非细菌来源的启动子,它具有结合细菌RNA聚合酶和起始转录的能力。自然存在的非细菌来源的启动子也可以与适宜的RNA聚合酶相偶联以在原核细胞中高产量表达某些基因。噬菌体T7 RNA聚合酶/启动子系统是偶联启动子系统的一个例子(Studier等,(1986),分子生物学杂志,189:113;Tabor等(1985),美国国家科学院院报,82:1074)。另外,杂合启动子也可以由噬菌体启动子和大肠杆菌操纵子区域组成(欧洲专利公开267 851号)。
BRCA1调节子蛋白可以在细胞内表达。启动子序列可以直接连接BRCA1调节子蛋白基因或它的一个片段,这种情况下N端第一个氨基酸总是由ATG起始密码子编码的甲硫氨酸。N端的甲硫氨酸可根据需要用溴化氰体外温育或用细菌甲硫氨酸N端肽酶(欧洲专利公开219 237号)通过体内或体外温育的方法而从该蛋白质中切去。
真核微生物如酵母培养物可以用合适的BRCA1调节子蛋白载体转化。参见美国专利4 745 057。酿酒酵母是低等真核宿主微生物中最常用的,虽然有许多其它菌株可选用。酵母载体可以含有酵母2μ质粒的复制起点或自主复制序列(ARS)、启动子、编码BRCA1调节子蛋白的DNA、多聚腺苷酸化和转录终止序列,及选择基因。
适用于酵母载体的启动子序列包括金属硫蛋白启动子、3-磷酸甘油酸激酶(Hitzeman等,生物化学杂志,255,2073(1980))或其它糖酵解酶(Hess等,J.Adv.Enzyme Reg.,7,149(1968);Holland等,生物化学,17,4900(1978)),如烯醇化酶、甘油醛-3-磷酸脱氢酶、己糖激酶、丙酮酸脱羧酶、磷酸果糖激酶、葡萄糖-6-磷酸异构酶、3-磷酸甘油酸变位酶、丙酮酸激酶、磷酸丙糖异构酶、磷酸葡萄糖异构酶和葡萄糖激酶等的启动子。适用于酵母表达的载体和启动子在R.Hitzman等,欧洲专利公开73 657号有进一步的详述。
来源于多细胞生物的细胞培养物是我们希望的用于重组BRCA1调节子蛋白合成的宿主。原则上,任何来源于脊椎或无脊椎动物的高等真核细胞都是可行的。但正如实施例中显示,优选的是哺乳动物细胞。在细胞培养体系中增殖这些细胞已是常规操作。参见组织培养,学术出版社,Kruse和Paterson主编(1973)。
用于转化脊椎动物细胞的表达载体的转录和翻译调控序列经常来源于病毒。例如,常用的一些启动子来源于CMV、多瘤病毒、腺病毒2和猴病毒40(SV40)。参见美国专利4599308。
复制起点可通过构建含有外源起点的载体提供,如来源于SV40或其它病毒(多瘤病毒、腺病毒、VSV或BPV)或由宿主细胞染色体复制机制提供。如果载体能整合到宿主染色体中,则后者是一种有效的方法。
BRCA1调节子蛋白的鉴定
BRCA1调节子蛋白的鉴定可以使用多种鉴定蛋白质-蛋白质相互作用的不同检测方法。可用的传统方法有将细胞裂解液或利用BRCA1从细胞裂解物中得到的蛋白质通过梯度或层析柱进行共免疫沉淀、交联和共提纯,在细胞裂解液中鉴定出可与BRCA1相互作用的蛋白质。这些方法中可以应用完整BRCA1或一个BRCA1肽。一旦分离后,这样的胞内蛋白可被鉴定,并可随之与标准技术结合,从而鉴定与它相互作用的蛋白质。例如,可以用本领域人员熟知技术如Edman降解技术确定与BRCA1相互作用的胞内蛋白质的至少部分氨基酸序列。(参见如Creighton 1983,“蛋白质:结构和分子原理”,W.H.Freeman&Co.,N.Y.,34-49)。得到的氨基酸序列可用来指导合成寡核苷酸混合物,用于筛选编码这些胞内蛋白质的基因序列。筛选可用如标准的杂交或PCR技术实现。合成寡核苷酸混合物和筛选的技术是众所周知的。(参见Ausubel,出处同前,PR教程:方法和应用指南,1990,Innis,M.等编,学术出版社公司,纽约)。
另外,可以使用能同时鉴定到编码与BRCA1相互作用的胞内蛋白质的基因的方法。这些方法包括,例如用探针检测表达文库,其方式与熟知的抗体检测λgt11文库相似,其中使用标记的BRCA1蛋白或融合蛋白如BRCA1与标记蛋白(如酶、荧光物质、发光蛋白或染料)融合,或融合一个Ig-Fc结构域。
作为体内检测蛋白质相互作用的一种方法-双杂合系统,如下详述,这种方法仅作例证而非限定。这个系统已有描述(美国专利5283173,Chien等,1991,美国国家科学院院报,88:9578-9582),并且可从Clontech(Palo Alto,CA)购到。简要步骤是,利用这个系统构建编码两个杂合蛋白的质粒:一个质粒由编码转录激活蛋白的DNA结合结构域的核酸与编码BRCA1、BRCA1肽或融合蛋白的BRCA1核苷酸序列融合组成,另一个质粒由编码该转录激活蛋白激活结构域的核苷酸与编码未知蛋白的cDNA融合组成,该cDNA已重组到这个质粒中作为cDNA文库的一部分。将所述DNA结合结构域融合质粒和该cDNA文库转化酿酒酵母的一个菌株,该菌株带有一个报告基因(如HIS3或LacZ),其调控区包含该转录激活蛋白的结合位点。单独一个杂合蛋白不能激活报告基因的转录;DNA结合结构域杂合蛋白不能激活是因为它无激活功能,激活结构域杂合蛋白不能激活则是因为它不能定位到激活蛋白的结合位点。两个杂合蛋白的相互作用重新组成了功能性的激活蛋白,导致报告基因的转录激活,这可以通过对报告基因产物的测定而检测到。
双杂合系统或相关方法可以用来从激活结构域文库筛选出与“诱饵”基因产物相互作用的蛋白质。作为例证而非限制,优选利用BRCA1肽或融合蛋白作为诱饵基因产物。单独的全长BRCA1可以作为转录激活蛋白,因此不能作诱饵。将整个基因组或cDNA序列与编码激活结构域的DNA融合。将这个文库与一个质粒共转化到一种酵母报告菌株中,该质粒编码诱饵BRCA1基因产物和DNA结合结构域融合形成的杂合蛋白。从产生的转化体中筛选出报告基因转录被激活的那些转化体。作为例证而非限制,可将诱饵BRCA1基因序列例如BRCA1的开放阅读框(或BRCA1的一个结构域)克隆到载体中以便该序列被可翻译地融合到编码GAL4蛋白的DNA结合结构域的DNA上。纯化菌落,分离出引起报告基因转录的文库质粒。利用DNA测序确定克隆的核苷酸序列,进而揭示由所述文库质粒编码的蛋白质序列的性质。
可用本领域常规方法,构建细胞系的cDNA文库,所述细胞系是欲从中检测与诱饵BRCA1基因产物相互作用的蛋白质的细胞系。根据此处叙述的特定体系,例如,可将cDNA片段可插入载体中以便与GAL4蛋白的转录激活结构域可翻译地融合。该文库与诱饵BRCA1基因-GAL4融合质粒共转化到带有LacZ基因的酵母菌株,其中LacZ基因由含有GAL4激活序列的启动子所驱动。将cDNA编码的与诱饵BRCA1基因产物相互作用的蛋白质与GAL4转录激活结构域融合,重新组成活性GAL4蛋白,由此启动HIS3基因表达。表达HIS3的克隆在缺乏组氨酸的半固体琼脂培养基平板能生长,据此可被检出。从这些菌株提纯cDNA,并用来通过本领域常规技术制备和分离与诱饵BRCA1基因相互作用的蛋白质。
用上述双杂合技术鉴定到了几个BRCA1调节子蛋白,显示具有包括亮氨酸拉链结构域在内的某些共同特征。
BRCA1调节子蛋白cDNA
三个代表性的BRCA1调节子蛋白的cDNA和推测的氨基酸序列见图1-3。cDNA和它们编码的蛋白质定为1号序列,091-21A31;3号序列,091-1F84;5号序列,091-132Q20。这些cDNA编码的蛋白质分子量约为45-97kd。特别值得注意的是,其中至少有一个亮氨酸拉链基序,还任选存在一个锌指结构域。
本发明的BRCA1调节子蛋白的核苷酸序列包括:(a)图1-3所示或1996年8月14日保藏于美国典型培养物保藏中心(ATCC)的保藏号为98141(3号序列,091-1F84)、98142(1号序列,091-21A31)、98143(5号序列,091-132Q20)的cDNA克隆中的DNA序列;(b)与图1-3所示的或所述保藏于ATCC的cDNA克隆所含的DNA序列的互补序列在高度严紧条件下能杂交上且编码功能相当的基因产物的任何核苷酸序列,所述高度严紧条件例如是与结合于滤膜的DNA在0.5MNaHPO4,7%十二烷基磺酸钠(SDS),1mM EDTA,65℃下杂交,在0.1xSSC/0.1%SDS,于68℃下洗涤(Ausubel F.M.等编,1989,分子生物学最新方案,第1卷,Green Publishing Associates,Inc.,JohnWiley&sons,Inc.,New York,p2.10.3);(c)与编码图1-3所示的氨基酸序列的DNA序列或包含于如上所述的保藏于ATCC的cDNA克隆中的DNA序列的互补序列在较弱严紧度的条件下能杂交上、但仍编码与BRCA1调节子蛋白功能相当的基因产物的任何核苷酸序列,所述较弱严紧条件例如是中度严紧条件下,举例来说,用0.2xSSC/0.1%SDS在42℃洗涤(Ausubel等,1989,出处同前)。功能相当的基因产物包括自然存在于其它种的BRCA1调节子蛋白基因,以及自然存在的或工程化的保持至少部分BRCA1调节子蛋白活性(即结合BRCA1)的突变体BRCA1调节子蛋白基因。本发明也包括(a)到(c)的序列的简并性变体。
本发明还包括与上段中(a)到(c)的核苷酸序列能杂交上,因此是相应核苷酸序列的互补体的核酸分子,优选DNA分子。这样的杂交条件可以是如上所述的高度或不太高的严紧条件。在所述核酸分子是脱氧寡核苷酸(寡核苷酸)情况下,高度严紧条件是指在如6xSSC/0.05%焦磷酸钠中于37℃(对14个碱基的寡核苷酸)、48℃(对17个碱基的寡核苷酸)、55℃(对20个碱基的寡核苷酸)、60℃(对23个碱基的寡核苷酸)下洗涤。这些核酸分子可以编码或作为BRCA1调节子蛋白基因的反义分子,可以用于例如基因调控(用于和/或作为BRCA1调节子蛋白基因核酸序列的扩增反应的反义引物)。这样的序列可以作为核酶和/或三股螺旋序列的一部分,也可以用于BRCA1调节子蛋白基因调控。更进一步,这些分子可以作为诊断方法的组分,由此例如可检测与失控细胞生长(即癌症)相关的特定BRCA1调节子蛋白等位基因的存在。
另外,本领域技术人员明白,利用依据本发明公开的BRCA1调节子蛋白基因产物内的氨基酸序列设计的两组简并寡核苷酸引物群,可以通过PCR从所需生物体的核酸中分离到BRCA1调节子蛋白基因的同系物。该反应的模板可以是从诸如已知或怀疑表达BRCA1调节子蛋白等位基因的人或非人细胞系或细胞型(如乳腺或卵巢细胞)的mRNA通过逆转录得到的cDNA。
可对该PCR产物进行亚克隆和测序,以确保扩增的序列代表BRCA1调节子蛋白基因的序列。随后可利用该PCR片段通过多种方法分离全长cDNA克隆。例如,可标记所述扩增片段并用于筛选cDNA文库,如噬菌体cDNA文库。或者,可利用该标记片段通过筛选基因组文库而分离基因组克隆。
可以应用PCR技术分离全长cDNA序列。例如,按照标准步骤,可以从合适的细胞来源(即已知或怀疑表达BRCA1调节子蛋白基因的细胞例如乳腺或卵巢细胞)分离RNA。用一个特异于扩增片段5′最末端的寡核苷酸引物引发第一链的合成,从而进行逆转录反应。所得的RNA/DNA杂合体可通过标准的末端转移酶反应加上鸟嘌呤尾巴,该杂合体经RNAaseH消化,随后用poly-C引物引发第二链的合成。这样可容易地分离出所述扩增片段上游cDNA序列。可能用到的克隆策略综述见如Sambrook等,1989,出处同前。
突变体BRCA1调节子蛋白基因的cDNA也可以利用例如PCR进行分离。这种情况下,可以从推测带有突变体BRCA1调节子蛋白等位基因的个体的已知或怀疑表达该突变蛋白的细胞中分离mRNA,用oligo-dT寡核苷酸与之杂交,并经逆转录延伸新链,从而合成第一链cDNA。然后利用与正常基因5′端特异杂交的寡核苷酸合成第二链cDNA。用这两个引物,经PCR扩增出该产物,将其克隆至合适的载体中,按照本领域技术人员熟知的方法进行DNA序列分析。通过比较突变体BRCA1调节子蛋白等位基因和正常BRCA1调节子蛋白等位基因的DNA序列,可以确定导致突变体BRCA1调节子蛋白基因产物功能丧失或改变的突变。
可以利用从已知或怀疑带有突变体BRCA1调节子蛋白等位基因的个体得到的DNA构建基因组文库,或者利用从已知或怀疑表达突变体BRCA1调节子蛋白等位基因的细胞型得到的RNA构建cDNA文库。然后可标记正常BRCA1调节子蛋白基因或其任何合适的片段,并用作探针从这些文库中鉴定相应的突变BRCA1调节子蛋白等位基因。然后可纯化含有突变BRCA1调节子蛋白基因序列的克隆,并按照本领域技术人员熟知的方法进行序列分析。
另外,可以利用从诸如已知或怀疑带有突变BRCA1调节子蛋白等位基因的个体的已知或怀疑表达这种突变等位基因的细胞型中分离的RNA合成的cDNA构建表达文库。以这种方式,可以表达由所述推测的突变细胞型产生的基因产物,并利用标准抗体筛选技术和抗正常BRCA1调节子蛋白基因产物的抗体(如下述)进行筛选。(筛选技术,参见例如,HarlowE和Lane编,1988,《抗体:实验指南》,冷泉港出版社,冷泉港),另外,可以用标记的融合蛋白实现筛选。在BRCA1调节子蛋白基因突变导致表达了一个功能改变的基因产物(如由于错义或移码突变引起的)的情况下,BRCA1调节子蛋白的一套多克隆抗体就可能与BRCA1调节子蛋白突变体发生交叉反应。通过它们与标记抗体的反应检测到的这种BRCA1调节子蛋白突变体可被纯化,并按照本领域技术人员熟知的方法进行序列分析。
本发明也包括编码BRCA1调节子肽段、截短的BRCA1调节子、BRCA1调节子融合蛋白的核苷酸序列。核苷酸编码的融合蛋白包括但不限于全长BRCA1调节子、截短的BRCA1调节子或肽片段与不相关的蛋白质或肽(如协助融合蛋白纯化和检测的标记表位或可以用作标记的酶、荧光蛋白、发光蛋白)等的融合体。优选的表位标记是glu-glu,如Rubinfeld B.等,生物学和化学杂志,第270卷,10:5549-5555(1995)和Grussenmyer T等,美国国家科学院院报,82:7952-7954(1985)所述。
本发明也包括(a)含有任意上述BRCA1调节子编码序列和/或它们的互补体(即反义序列)的DNA载体;(b)含有任意上述BRCA1调节子编码序列的DNA表达载体,其中所述编码序列可操纵性地连接了可指导其表达的调控元件;(c)含有任意上述BRCA1调节子编码序列的基因工程宿主细胞,其中所述编码序列可操纵性地连接了可指导其在宿主细胞的表达的调控元件。此处所用调控元件包括但不限于诱导型和非诱导型启动子、增强子、操纵子和本领域技术人员熟知的可启动和调控表达的其它元件。这样的调控元件包括但不限于杆状病毒启动子、巨细胞病毒hCMV即早期基因、SV40腺病毒早期或晚期启动子、lac系统、trp系统、TAC系统、TRC系统、噬菌体A的主要操纵子和启动区、fd衣壳蛋白控制区、3-磷酸甘油酸激酶启动子、酸性磷酸酶启动子、酵母交配因子启动子。
BRCA1调节子蛋白
如前所述,图1-3显示三个代表性BRCA1调节子蛋白的cDNA序列和推测的氨基酸序列;1号序列,091-21A31;3号序列,091-1F84;5号序列,091-132Q20。5号序列,091-132Q20不是全长序列。已计算出诸蛋白质的分子量约为45-97kd。特别值得注意的是其中存在至少一个亮氨酸拉链基序,任选一个锌指结构域。例如,3号序列,091-1F84有两个亮氨酸拉链;5号序列,091-132Q20有一个亮氨酸拉链,而1号序列,091-21A31有一个亮氨酸拉链和一个锌指结构域。用Prosite蛋白数据库很容易识别这些结构域。
本发明的BRCA1调节子蛋白、肽片段、它们的突变、截短或缺失形式及它们的融合蛋白质可以应用于多种用途,包括但不限于抗体制备、作诊断检测中的试剂、鉴定和/或与其它参与细胞生长的基因产物相互作用,在筛选可用于治疗不期望的细胞生长紊乱(包括但不限于癌症)的化合物的测定中用作试剂、作治疗这些疾病的药物。
举例说明,BRCA1调节子蛋白1号序列,091-21A31以甲硫氨酸开始,该甲硫氨酸的周围DNA序列与翻译起始位点一致。这个BRCA1调节子蛋白预测分子量为53.3KD。
本发明的BRCA1调节子蛋白氨基酸序列包括图1所示的氨基酸序列或前述保藏于ATCC的cDNA克隆编码的氨基酸序列。另外,其它种的BRCA1调节子蛋白也包括在本发明内。实际上,由上面描述的cDNA编码的任何一种BRCA1调节子蛋白都在本发明范围内。
本发明还包括上面描述的核酸序列编码的BRCA1调节子蛋白的同功分子,判断原则包括但不限于结合BRCA1的能力,与BRCA1结合的亲和力,当BRCA1调节子蛋白的同功分子存在于适宜类型细胞(如卵巢或乳腺细胞)中时所导致的细胞代谢或表型的变化。这种BRCA1调节子蛋白的同功分子包括但不限于在由上述BRCA1调节子核苷酸序列编码的氨基酸序列内发生了氨基酸残基的添加或取代,但产生的是沉默突变,由此得到的功能等同的基因产物。氨基酸残基的取代建立在相关残基在极性、电荷、溶解度、疏水性、亲水性、和/或两亲性方面的相似性。例如,非极性(疏水性)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸、甲硫氨酸;非极性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺、谷氨酰胺;带正电荷的氨基酸(碱性)包括精氨酸、赖氨酸、组氨酸;带负电荷的氨基酸(酸性)包括天冬氨酸和谷氨酸。
虽然可以对BRCA1调节子蛋白DNA进行随机突变(利用本领域技术人员熟知的随机诱变技术),并检测产生的突变体BRCA1调节子蛋白活性,但定点突变BRCA1调节子编码序列(利用本领域熟知的定点诱变技术),可以产生功能增强(如对BRCA1亲和力改变)的突变体BRCA1调节子蛋白。
例如,可以改造突变体BRCA1调节子蛋白以使蛋白质保留了种间特征区域,而可变残基发生改变,这可通过诸如缺失或插入一个氨基酸残基或者一或多个不同氨基酸残基的取代。可以在可变位置上作保守性改变,以便产生的突变BRCA1调节子蛋白仍保留原有功能。可在这些可变位置上作非保守性改变,以使突变BRCA1调节子蛋白功能改变。或者,若需要改变功能,则可对保守区作缺失或非保守性改变。本领域技术人员利用此处所述内容可以很容易检测出这种功能改变的突变或缺失的BRCA1调节子蛋白。
可以对BRCA1调节子编码序列作其它突变,以产生更适于在所选定的宿主细胞中表达、表达量增加等的BRCA1调节子蛋白。例如,每个氨基酸的三联密码子可被修饰以更接近宿主细胞翻译机制偏好使用的密码子。
对应于BRCA1调节子蛋白一个或多个结构域(或者结构域的一部分)的肽(如亮氨酸拉链、锌指),截短的或缺失的BRCA1调节子蛋白(如缺失一个或多个上述结构域的BRCA1调节子蛋白),以及全长的BRCA1调节子蛋白、BRCA1调节子蛋白肽、截短的BRCA1调节子蛋白与其它无关蛋白质的融合蛋白也在本发明范围内,这可以根据这部分和上文公开的BRCA1调节子核苷酸和BRCA1调节子蛋白氨基酸序列设计。这种融合蛋白包括但不限于与表位标记的融合体(例如文中示例);或与提供标记功能的酶、荧光蛋白或发光蛋白的融合体。
虽然BRCA1调节子蛋白和肽可以化学合成(参见Creighton,1983,蛋白质:结构与分子原理,W.H.Freeman&Co.,N.Y.),但BRCA1调节子蛋白衍生的大的多肽和全长BRCA1调节子蛋白本身可能最好是通过重组DNA技术,采用本领域熟知的技术表达含有BRCA1调节子基因序列和/或编码序列的核酸而制备。这些方法可以用来构建含有上述BRCA1调节子核苷酸序列和适宜的转录和翻译调控信号的表达载体。这些方法包括诸如体外重组DNA技术、合成技术、体内遗传重组等。实例参见Sambrook等,1989(出处同前)和Ausubel等,1989(出处同前)等内叙述的技术。可供选择的,编码BRCA1调节子核苷酸序列的RNA可以用例如合成仪化学合成。实例参见《寡核酸合成》,1984,Gait,M.J.等编,IRL Press,Oxford中所述技术,该书全文引入本文作为参考。
可以利用多种宿主表达载体系统来表达本发明的BRCA1调节子核苷酸序列。BRCA1调节子蛋白肽或多肽是可溶性分泌型衍生物时,则可从培养基中回收。如果该BRCA1调节子蛋白肽或多肽不是分泌型的,则可以从宿主细胞中分离。但在不仅需要保持BRCA1调节子蛋白的结构和功能特性,并能应用于估计生物活性(例如药物筛选测定)的情况下,可以使用这种加工过的宿主细胞本身。
可用于本发明目的的表达系统包括但不限于微生物,例如转化了含有BRCA1调节子核苷酸序列的重组噬菌体DNA、质粒DNA或粘粒DNA表达载体的细菌(如大肠杆菌、枯草芽孢杆菌);转化了含有BRCA1调节子核苷酸序列的重组酵母表达载体的酵母菌(如酵母属、毕赤酵母属);被含有BRCA1调节子序列的重组病毒表达载体(如杆状病毒)感染的昆虫细胞体系;被含有BRCA1调节子核苷酸序列的重组病毒表达载体(如花椰菜花叶病毒CaMV;烟草花叶病毒TMV)感染的或者重组质粒(如Ti质粒)转化了的植物细胞体系;引入了带有来自哺乳动物细胞基因组的启动子(如金属硫蛋白启动子)或哺乳动物病毒(如腺病毒晚期启动子、牛痘病毒7.5K启动子)的重组表达构建体的哺乳动物细胞体系(如COS、CHO、BHK、293、3T3、U937)。
在细菌体系中,可以根据待表达的BRCA1调节子基因产物的预定用途选择较好的表达载体。例如,若要制备大量的这种蛋白质以生产BRCA1调节子蛋白的药用组合物或产生抗BRCA1调节子蛋白的抗体,就选用能启动高水平表达较容易纯化的融合蛋白产物的载体。这种载体包括但不限于大肠杆菌表达载体pUR278(Ruther等,1983,EMBO J,2:1791),其中BRCA1调节子编码序列可与Lac-Z编码区读框一致地单独连接至载体中从而产生融合蛋白;pIN载体(Inouye&Inouye,1985,核酸研究,13:3103-3109;Van Heeke&Schuster,1989,生物学与化学杂志,264:5503-5509)等。也可以用pGEX载体来表达与谷胱甘肽S-转移酶(GST)形成融合蛋白的外源多肽。若插入片段编码一个较小的多肽(小于25kD),则融合蛋白通常可溶,并可以通过谷胱甘肽-琼脂糖珠吸附细胞水解物后,再用游离谷胱甘肽洗脱的方法而很容易地纯化。pGEX载体设计为包含凝血酶或凝血因子Xa蛋白酶切割位点,这样克隆的目的基因产物就能从GST部分释放出来。或者,若融合蛋白不可溶,并在宿主细胞内形成包涵体,则可以利用本领域技术人员熟知的技术提纯包涵体,溶解该重组蛋白质。
在昆虫细胞体系,可以用苜蓿银纹夜蛾核型多角体病毒(AcNPV)作载体来表达外源基因。(参见Smith等,1983,病毒学杂志,46:584;Smith,美国专利4215051)。下面描述的一个特定实施方案中,用表达6xHIS标记的构建体或表达EE标记的BRCA1调节子构建体的杆状病毒载体感染Sf9昆虫细胞。
在哺乳动物宿主细胞中,可以使用多种基于病毒的表达系统。下面更详细地描述的特定实施方案用CMV启动子在U937细胞或Cos-7细胞瞬时表达标记的BRCA1调节子cDNA序列,以表达重组蛋白质。或者,可以利用本领域熟知的逆转录载体系统将该重组表达构建体插入宿主细胞。例如,公开的PCT申请说明书WO96/09400和WO94/29438描述的用于转导造血细胞的逆转录载体系统。
在用病毒作为表达载体的情况下,可将所需的BRCA1调节子核苷酸序列连接到腺病毒转录/翻译调控复合物上,如晚期启动子和三联前导序列。随后可通过体内或体外重组将该嵌合基因插入腺病毒基因组。在病毒基因组非必要区域(例如E1或E3区)插入一段序列将产生活性的、能在感染宿主中表达BRCA1调节子基因产物的重组病毒(参见Logan&Shenk,1984,美国国家科学院院报,81:3655-3659)。还可能需要特异起始信号以有效翻译插入的BRCA1调节子核苷酸序列。这些信号包括ATG起始密码子和相邻序列。若将带有自身起始密码子和相邻序列的完整BRCA1调节子基因或cDNA插入合适的表达载体,则不需要另外的翻译调控信号。然而,若只插入部分BRCA1调节子编码序列,则需要提供外源翻译调控信号,可能包括ATG起始密码子。另外,起始密码子必须与目的编码序列的阅读框一致,以保证翻译出完整的插入片段。外源翻译调控信号和起始密码子可以是自然或合成等多种来源。表达效率可以通过加入合适的转录增强元件、转录终止子等获得提高(参见Bittner等,1987,酶学方法,153:516-544)。
另外,可以选择可调节插入序列的表达或按照预期方式修饰和加工该基因产物的宿主株。基因产物的修饰(如糖基化)和加工(如切割)可能对蛋白质的功能很重要。对于蛋白质和基因产物的翻译后加工和修饰,不同宿主细胞有特征性和特异的机制。可以选择合适的细胞系或宿主系统来保证所表达的外源蛋白正确修饰和加工。为了实现这个目的,可以用具有用于初级转录产物适当加工的细胞机制的真核宿主细胞,这样的哺乳动物宿主细胞包括但不限于CHO、VERO、BHK、HeLa、COS、MDCK、293、3T3、WI38、U937细胞。
为了实现长期、高产地制备重组蛋白,优选稳定表达体系。例如,可以加工能稳定表达上述BRCA1调节子序列的细胞系。用含有病毒复制起点的表达载体,不如用转化了在合适的表达调控元件(例如,启动子、增强子序列、转录终止子、多聚腺苷酸化位点等)调控下的DNA和一个选择性标记的宿主细胞。导入外源DNA后,可以使工程化的细胞在富集培养基中生长1-2天,然后转到选择培养基中。该重组质粒含有的选择性标记使细胞能抗选择压,并允许质粒稳定整合到细胞的染色体内,生长形成集落,这种集落又可以被克隆,发展为细胞系。这个方法可以用于构建表达BRCA1调节子基因产物的细胞系。这种工程化细胞系在筛选和评估影响BRCA1调节子基因产物内源活性的化合物时特别有用。
多种选择系统可供利用,包括但不限于单纯疱疹病毒胸苷激酶基因(Wigler等,1977,细胞,11:223)、次黄嘌呤-鸟嘌呤磷酸核糖转移酶基因(Szybalska&Szybalski,1962,美国国家科学院院报,48:2026)、腺嘌呤磷酸核糖转移酶基因(Lowy等,1980,细胞22:817),它们分别可以用于tk-、hgprt-、aprt-细胞。对抗代谢物的抗性也可以用作选择下列基因的基础:dhfr,此基因赋予对氨甲蝶呤的抗性(Wigler等,1980,美国国家科学院院报,77:3567;Ohare,1981,美国国家科学院院报,78:1527);gpt,此基因赋予对霉酚酸的抗性(Mulligan&Berg,1981,美国国家科学院院报,78:2072);neo,此基因赋予对氨基糖苷G-418的抗性(Colberre-Garapin等,1981,分子生物学杂志,150:1);hygro,此基因赋予对潮霉素的抗性(Santerre等,1984,基因,30:147)。
BRCA1调节子基因产物也可以在转基因动物中进行表达。任何种类动物,包括但不限于小鼠、大鼠、兔、豚鼠、猪、微型猪、羊、非人灵长类如狒狒、猴和黑猩猩可以用于制作BRCA1调节子转基因动物。
本领域熟知的任何技术可以用来将BRCA1调节子转基因导入动物中以产生转基因动物的基础品系。这样的技术包括但不限于原核微量注射(HoppeP.C.和WagnerT.E.,1989,美国专利4873191)、对种系细胞进行逆转录病毒介导的基因转移(Van der Putten等,1985,美国国家科学院院报,82:6148-6152)、对胚胎干细胞实施基因打靶(Thompson等,1989,细胞,56:313-321)、胚胎电穿孔(Lo,1983,分子细胞生物学,3:1803-1814)、精子介导的基因转移(Lavitrano等,1989,细胞,57:717-723)等。这些技术的综述参见此处全文引作参考文献的Gordon,1989,转基因动物,细胞学国际评论(Intl.Rev.Cytol.),115:171-229。
本发明提供了全部细胞带有BRCA1调节子转基因的转基因动物,以及部分而非全部细胞带有转基因的动物即嵌合体动物。转基因可以以单个转基因或串联体例如头接头或头接尾串联体形式整合。该转基因可以选择性地导入特定细胞类型中,并参照下列Lasko等的技术(Lasko,M.等,1992,美国国家科学院院报,89:6232-6236)进行激活。这种细胞类型特异性激活所需调控序列取决于感兴趣的特定细胞类型,这对于本领域技术人员来说是很显然的。如果需要将BRCA1调节子转基因整合到内源BRCA1调节子基因的染色体位点,则优选基因打靶。简而言之,用这种技术时,设计含有与内源BRCA1调节子基因同源的一些核苷酸序列的载体,以通过与染色体序列之间的同源重组,插入内源BRCA1调节子基因的核苷酸序列中并破坏其功能。这样,也可以通过在内源基因中插入非功能性序列而使内源BRCA1调节子基因的表达丧失。转基因可以选择性地导入特定细胞类型中,从而仅在这一细胞类型中失活内源BRCA1调节子基因,参照下列Gu等的技术(Gu等,1994,科学,265:103-106)。这种细胞类型特异性失活所需的调控序列取决于感兴趣的细胞类型,这对于本领域技术人员来说也是显然的。
转基因动物建成后,就可以用标准技术检测重组BRCA1调节子基因的表达。初步筛选可以用Southern印迹分析或PCR技术分析动物组织,检测所述转基因是否已整合。转基因动物组织中转基因的mRNA表达水平可以利用下述技术估计,这些技术包括但不限于对得自动物的特定细胞类型样品进行Northern印迹分析,原位杂交分析,RT-PCR。也可以利用下述的特异于BRCA1调节子转基因产物的抗体对表达BRCA1调节子基因的组织样品进行免疫化学定量。
BRCA1调节子蛋白的抗体
特异识别BRCA1调节子蛋白的一个或多个表位,或其保守变体、肽片段的一个或多个表位的抗体也包括在本发明内。这样的抗体包括但不限于多克隆抗体、单克隆抗体(mAbs)、人源化的或嵌合抗体、单链抗体、Fab片段、F(ab’)2片段、由Fab表达文库产生的片段、抗独特型(anti-Id)抗体、以及上述任一形式的表位结合片段。
本发明的抗体可以用于例如,检测生物样品中的BRCA1调节子蛋白,所以可以作为该蛋白质含量异常的患者的诊断和治疗手段。这样的抗体也可以与例如化合物筛选方案结合应用,如本文所述用于评价待测化合物对BRCA1调节子蛋白表达和/或活性的影响。另外,这样的抗体也可以与基因治疗技术结合应用,以在导入患者体内前评价正常和/或工程化的BRCA1调节子蛋白表达细胞。这样的抗体还可以作为抑制异常BRCA1调节子蛋白活性的方法。
为制备抗体,可通过注射BRCA1调节子蛋白、BRCA1调节子蛋白肽、截短的BRCA1调节子蛋白多肽、BRCA1调节子蛋白同功分子、或BRCA1调节子蛋白的突变体而对各种宿主动物进行免疫。这样的宿主动物包括但不限于兔、小鼠、大鼠等等。可以利用多种佐剂来增强免疫应答,这取决于宿主种类,包括但不限于弗氏佐剂(完全和不完全弗氏佐剂),矿物胶如氢氧化铝,表面活性剂如溶血卵磷脂、普卢龙尼克多元醇类、聚阴离子、肽、油乳胶、匙孔血蓝蛋白、二硝基苯酚、和可能有用的人佐剂如BCG(卡介苗)和小型棒状杆菌。多克隆抗体是来源于免疫动物血清的异种抗体分子群。
单克隆抗体是特异抗原的同种抗体群,可以用通过连续培养细胞系产生抗体分子的任何技术获得。这些技术包括但不限于Kohler和Milstein的杂交瘤技术(1975,自然,256:495-497;美国专利4376110)、人类B细胞杂交瘤技术(Kosbor等,1983,今日免疫学,4:72;Cole等,1983,美国国家科学院院报,80:2026-2030)、EBV-杂交瘤技术(Cole等,1985,单克隆抗体和癌症治疗,Alan R.Liss,Inc.,pp77-96)。这样的抗体可以是包括IgG、IgM、IgE、IgA、IgD的任何免疫球蛋白型及其亚型。本发明产生单克隆抗体的杂交瘤可以体内或体外培养。在体内能高滴度产生单克隆抗体使得这一方法成为目前优选的方法。
另外,可以利用将合适抗原特异性的小鼠抗体分子基因连接合适生物活性的人抗体分子基因产生嵌合抗体的技术(Morrison等,1984, 美国国家科学院院报81:6851-6855;Neuberger等,1984,自然,312:604-608;Takeda等,1985,自然,314:452-454)。嵌合抗体是各部分来源于不同动物种类的分子,如具有来源于单克隆抗体的可变区和人免疫球蛋白恒定区的分子。
或者,用于制备单链抗体的技术(美国专利4946778;Bird,1988,科学,242:423-426;Huston等,1988,美国国家科学院院报,85:5879-5883;Ward等,1989,自然,334:544-546)可用来生产抗BRCA1调节子蛋白基因产物的单链抗体。单链抗体是通过一个氨基酸桥连接Fv区的重链和轻链片段而产生的单链多肽。
识别特异表位的抗体片段可由已知技术制备。例如,这种片段包括但不限于可通过胃蛋白酶水解抗体产生的F(ab’)2和还原F(ab’)2的二硫键产生的Fab片段。或者,可以构建Fab表达文库(Huse等,1989,科学,246:1275-1281)从而快速、简单地鉴定到所需特异性的单克隆Fab片段。
反过来,采用本领域技术人员熟知的技术,可以利用BRCA1调节子蛋白的抗体产生能“模拟”BRCA1调节子蛋白的抗独特型抗体(参见Greenspan&Bona,1993,FASEB J.,7(5):437-444;Nissinoff,1991,免疫学杂志,147(8):2429-2438)。
用BRCA1调节子鉴定可提高BRCA1水平的化合物
BRCA1基因编码有肿瘤抑制活性的一种蛋白质。参见Holt J.T.等,(1996)国家遗传学,12卷,298-302。研究表明某些癌症细胞中BRCA1水平低,提高BRCA1水平能恢复正常细胞表型。因此,可提高BRCA1水平的化合物在癌症治疗中有重要的治疗用途。
本发明一个方面是描述协助鉴定可提高BRCA1胞内水平的化合物的分析方法,其中使用BRCA1和BRCA1调节子。图4以简图形式给出该方法的一个模式。概括地说,这一方法是基于以下两点:首先,已知BRCA1是通用的转录激活子;第二,BRCA1调节子结合BRCA1。该方法利用了上述双杂合技术的某些特性。构建两个质粒,转染合适的细胞系,优选乳腺或卵巢细胞系。优选的一个乳腺细胞系是MCF-7。一个质粒含有由GAL4识别的核苷酸序列,其操纵性连接了激活子序列,还含有位于这一序列下游的报告基因。优选的报告基因的一个例子是荧光素酶的编码基因。第二个质粒编码表达GAL4 DNA结合结构域与BRCA1调节子的融合蛋白。优选的调节子是1号序列,091-21A31。
GAL4 DNA结合结构域-BRCA1调节子融合蛋白结合第一个质粒的GAL4 DNA结合结构域,随后与存在的任何BRCA1形成GAL4 DNA结合结构域-BRCA1调节子融合蛋白和BRCA1的复合物。复合物中的BRCA1靠近激活子序列,从而启动报告基因的转录。因此,可以检测出化合物刺激BRCA1产生的能力。能刺激BRCA1产生的化合物会使报告基因产物增加。上述方法见图4。
鉴定改变BRCA1和BRCA1调节子相互作用的化合物
如上所述,BRCA1是已知的肿瘤抑制蛋白。参见Holt J.T.等,(1996)国家遗传学,12卷,298-302。因此,影响BRCA1和BRCA1调节子蛋白之间正常的相互作用的化合物可能会影响BRCA1肿瘤抑制活性。影响程度主要取决于受测化合物的化学性质。有些可能强烈破坏BRCA1与BRCA1调节子蛋白之间的相互作用,有些仅有小的影响。前者用分析致瘤性改变的生物学检测方法可以反映,后者则不行。反之亦然,某些化合物能增进BRCA1和BRCA1调节子蛋白的相互作用,出现相反的生物学影响。因此迫切需要鉴定出影响BRCA1和BRCA1调节子蛋白相互作用的化合物。
用于鉴定影响BRCA1和BRCA1调节子蛋白相互作用的化合物的体系,其基本原理包括制备含有上述BRCA1蛋白、多肽、肽、融合蛋白以及BRCA1调节子蛋白的反应混合物,条件适宜、两者充分相互作用并结合,因而形成复合物。为了检测化合物的抑制活性,分别制备含有和不含待测化合物的反应混合物。待测化合物可以开始就包含在反应混合物中,或者在加入BRCA1部分和BRCA1调节子蛋白后的某时刻加入。对照反应混合物温育,其中不含化合物或加安慰剂。检测BRCA1和BRCA1调节子蛋白形成的任何复合物。对照反应体系中形成复合物,而含有受测化合物的反应混合物中不产生,表明该化合物干扰BRCA1和BRCA1调节子蛋白之间的相互作用。另外,含有待测化合物和正常BRCA1蛋白的反应混合物中复合物的形成情况可以与含有待测化合物和突变体BRCA1蛋白的反应混合物中复合物的形成情况进行比较。在需要鉴定破坏突变体BRCA1的相互作用,而不破坏正常BRCA1的相互作用的化合物时这种比较可能很重要。
干扰BRCA1和BRCA1调节子蛋白相互作用的化合物的分析方法可以异种或同种形式进行。异种分析包括将BRCA1部分或BRCA1调节子蛋白固定在固相上,反应结束时检测锚定在固相上的复合物。同种分析中整个反应在液相进行。两种方法加入反应物的顺序可以改变以得到待测化合物的不同信息。例如,以竞争机制干扰相互作用的待测化合物可以在存在待测物质的反应中鉴定到,即在BRCA1和BRCA1调节子蛋白之前或同时将待测物质加入反应体系。或者,破坏复合物形成的受测化合物,例如有更高的结合常数而取代复合物中的一个组分的化合物,通过在复合物形成后加入待测化合物可以鉴定到。下面有简要叙述。
在异种分析体系中,BRCA1部分或反应性BRCA1调节子蛋白锚定在固相表面,而未锚定的那一种被直接或间接标记。实际操作中,可以方便地利用微量滴定板。锚定的那一种可以是通过非共价或共价连接而固定。简单地将固相表面涂覆BRCA1或BRCA1调节子蛋白溶液并干燥即可实现非共价连接。或者,可以用特异于待锚定的那一种物质的固定化抗体将该物质锚定于固相表面。固相表面可以预先制备并存放。
为了进行检测,将有或没有待测化合物的涂覆表面与固定物质的对应反应物接触。反应完全后,除去未反应的组分(如冲洗),任何已形成的复合物均保留在固相表面。固相表面锚定的复合物的检测方法有多种。若未固定的那一种物质已预先标记,则在固相表面检测到固定的标记物表明形成了复合物。若未固定的那一种物质没有预先标记,则可以用间接标记检测锚定于表面的复合物;例如,用特异于起初未固定的物质的标记抗体(抗体可以直接标记或用标记的抗免疫球蛋白抗体间接标记)。根据反应组分加入的顺序可以检测待测化合物是抑制复合物的形成或破坏已形成的复合物。
或者,反应可以在有或没有待测化合物的液相中进行,从未反应组分中分离出反应产物,检测复合物;例如,用特异于结合组分之一的固定化抗体将溶液中形成的任何复合物锚定,用特异于另一反应物的标记抗体检测锚定的复合物。同样,根据反应组分加入液相的顺序可以鉴定出待测化合物是抑制复合物的形成还是破坏已形成的复合物。
在本发明一个候选实施方案中,可以使用同种分析。这个方法中,提前制备BRCA1部分和相互作用性BRCA1调节子蛋白形成的复合物,其中BRCA1或其BRCA1调节子蛋白已被标记,但标记产生的信号将因为复合物的形成而猝灭(参见Rubenstein的美国专利4109496,其中用这种方法进行免疫测定)。加入与已形成的复合物的一种组分竞争并发生取代的测试物质将产生高于本底的信号。这样就可以鉴定出破坏BRCA1/胞内BRCA1调节子蛋白相互作用的待测物质。
本发明一个特定实施方案中,可以制备BRCA1融合蛋白以用于固定化。例如,可以用融合载体如pGEX-5X-1等将BRCA1或肽片段与谷胱甘肽-S-转移酶(GST)基因融合,融合方式保证在所产生的融合蛋白中能维持它的结合活性。纯化相互作用性BRCA1调节子蛋白,按照本领域常规和上述方法制备单克隆抗体。该抗体用例如放射性同位素125I通过常规方法标记。在异种测定中,例如可以将GST-BRCA1融合蛋白锚定于谷胱甘肽-琼脂糖珠上。随后在有或没有待测化合物的情况下加入与之作用的BRCA1调节子蛋白,保证发生相互作用和结合。反应结束后洗去未结合的物质,将标记单克隆抗体加入体系,使其结合到复合物组分中。测定谷胱甘肽-琼脂糖珠存留的放射强度可以检测到BRCA1蛋白和相互作用性BRCA1调节子蛋白之间的相互作用。待测化合物成功抑制相互作用会使测得的放射强度下降。
或者,可以在没有谷胱甘肽-琼脂糖珠的液相中混合GST-BRCA1融合蛋白和与之相互作用的BRCA1调节子蛋白。待测化合物在两种物质结合过程中或之后加入。然后将混合液加入谷胱甘肽-琼脂糖珠中,洗去未结合物质。同样通过加入标记抗体并测定琼脂糖珠中存留的放射强度可以检测到BRCA1/BRCA1调节子蛋白相互作用被抑制的程度。
在本发明另一个实施方案中,同样的技术可以用于BRCA1和/或BRCA1调节子蛋白结合结构域所对应的肽片段,而代替两种全长蛋白质之一或二者。可以用本领域多种常规方法鉴定和分离结合结构域。这些结构域在实施例中有更详细讨论。这些方法包括但不限于诱变编码两种蛋白质之一的基因和用共免疫沉淀测定筛选结合被破坏的一些方法。然后可选择出编码复合物中另一种物质的基因中发生的补偿性突变。对编码相应蛋白质的基因的序列分析将揭示与蛋白质中参与相互结合的区域对应的突变。也可以使用双杂合分析,实施例中有更详细讨论。举例说明,如果得到胞内BRCA1调节子蛋白的编码基因,可以构建短基因片段表达该蛋白质的肽片段,随后可检测其结合活性并纯化或合成。
有效剂量
上述鉴定到的影响BRCA1和BRCA1调节子蛋白的相互作用、从而影响细胞生长的化合物,其毒性和药效可以按照标准过程在细胞培养或实验动物中确定。例如,可以确定LD50(50%群体致死剂量)和ED50(50%群体治疗有效剂量)。多种本领域技术人员已知的模型体系可以用来检测化合物的细胞生长性质,包括细胞在软琼脂中的生长和在体内对肿瘤的作用。这些实验可以在用BRCA1和BRCA1调节子共转染的细胞中进行。
毒性和治疗效果之间的剂量比率是治疗指数,可以表达为LD50/ED50。优选治疗指数大的化合物。因为可能用到有毒副作用的化合物,应仔细设计给药体系,将化合物定位到目的组织位点,以使对未感染细胞的潜在损伤减至最小,从而减少副作用。
可以利用细胞培养测定和动物研究中得到的数据制定出适合人类使用的剂量范围。优选化合物剂量在包括ED50且仅有弱的或没有毒性的循环浓度范围内。剂量可在该范围内根据采用的剂量形式和给药途径而变化。本发明方法中所用的任何一种化合物的治疗有效剂量均可由细胞培养测定初步估计。可以在动物模型中确定剂量,得到一个血循环浓度范围,其中包括在细胞培养物中测得的IC50(即待测化合物取得对症状二分之一最大抑制效果的浓度)。这种信息可以用来更精确地确定人类的有效剂量。血浆中的含量可以用例如高效液相层析测定。
下面的实施例举例说明了本发明的特定实施方案及各种应用。这些实施例仅供解释之用而非对本发明的限定。
实施例1
编码BRCA1调节子蛋白的cDNA的鉴定
用美国专利5283173或Chien等,1991,美国国家科学院院报88:9578-9582描述的酵母双杂合检测系统初步鉴定BRCA1调节子。检测组分可以购自Clontech(Palo Alto CA)。
编码人BRCA1的cDNA(参见Miki Y.等,科学,266:66-71;PCT/US95/10202)用MvnI-Nhel消化,将代表BRCA1第8-1293位氨基酸的片段与pGBT8质粒的SmaI-Nhel位点的GAL4结合结构域融合,该质粒是Chien等,美国国家科学院院报,88:9578-9582(1991)中描述的质粒pMA424在EcoR1和Sal1单切位点间插入序列5’-CCGGGGATCCCCATGGCTAGCCATATG-3’进行改造而得到的。将融合质粒转化酵母菌株YGH1,评估携有质粒GAL4-BRCA1(8-1293)的YGH1株激活两个报告性状的能力:在无组氨酸培养基上的生长和β-半乳糖苷酶活性。带有质粒GAL4-BRCA1(8-1293)的YGH1菌株能在无组氨酸的平板上生长但在无组氨酸的平板中加入7.5mM 3-氨基-1,2,4-三唑(3AT)会受到调控,该菌株无可检测到的β-半乳糖苷酶活性。带有质粒GAL4-BRCA1(8-1293)的YGH1菌株随后被融合于质粒pGAD中GAL4激活结构域的Hela细胞cDNA文库转化(Chien等,1991,美国国家科学院院报,88:9578-9582)。若cDNA编码的蛋白质可与BRCA1蛋白(氨基酸8-1293)相互作用,则该YGH1菌株应能在补充了7.5mM 3-氨基-1,2,4-三唑的无组氨酸平板中生长,并产生β-半乳糖苷酶。
2.5×106个转化子中筛选到4株能在补充了7.5mM 3-氨基-1,2,4-三唑的无组氨酸平板中生长,并有β-半乳糖苷酶活性。用从这4株酵母菌株回收的质粒重新转化初始YGH1 GAL4-BRCA1(8-1293)菌株。所有质粒都赋予菌株在补充了7.5mM 3-氨基-1,2,4-三唑的无组氨酸平板中生长的能力,并能产生β-半乳糖苷酶。在随后的筛选中,发现4株菌中的3株含有编码与BRCA1有明确结合能力的调节子蛋白的cDNA。一个质粒含有编码被命名为1号序列,091-21A31的BRCA1调节子蛋白的新cDNA。其核苷酸和氨基酸序列见图1。计算分子量约53kd,pI估计为9.05。特别值得注意的是它有一个锌指结构域和一个亮氨酸拉链基序。
第二个cDNA的核苷酸序列和它编码的氨基酸序列(此后命名为3号序列,091-1F84)见图2。它有两个亮氨酸拉链结构域。蛋白质分子量计算为96443.3,pI估计为4.95。
第三个cDNA的核苷酸序列和它编码的氨基酸序列(此后命名为5号序列,091-132Q20)见图3。该克隆有一个亮氨酸拉链结构域。蛋白质分子量计算为45904.9,pI估计为6.73。
实施例2
BRCA1结构域与BRCA1调节子的结合
进行实验确定BRCA1哪些区域与实施例1所述三个BRCA1调节子相互作用。采用美国专利5 283 173或Chien等,1991,美国国家科学院院报,88:9578-9582描述的酵母双杂合测定进行实验。将编码3号序列,091-1F84;1号序列,091-21A31;5号序列,091-132Q20的cDNA与GAL4激活结构域融合,将表1所示的BRCA1的各个区域和含有BRCA1氨基酸1-300、1-600或8-1293的区域与GAL4结合结构域融合。对照包括载体或与GAL4结合结构域融合的bcl-2(参见美国专利5539 085)。
表1
BRCA1与双杂合系统(091-)的相互作用
用于上述研究的BRCA1构建体由BRCA1限制酶切片段克隆至质粒pGBT8中而产生,该质粒是质粒pMA424在EcoRI和SalI单切位点间插入序列5’-CCGGGGATCCCCATGGCTAGCCATATG-3’而改造得到的(如Chien等,美国国家科学院院报,88卷,9578-9582(1991)所述)。简言之,含有BRCA1前300个氨基酸的构建体是将Nco1-EcoR1消化产生的BRCA1钝末端片段亚克隆至pGBT8的EcoR1酶切位点钝末端而产生的。含有8-1293位氨基酸的BRCA1构建体如上述构建。最后,含有1-600位氨基酸的BRCA1构建体是将BRCA1的Nco1-Spe1片段亚克隆至pGBT8的Nco1-Nhe1位点而产生的。
表1显示BRCA1中与3号序列,091-1F84;1号序列,091-21A31;5号序列,091-132Q20编码的蛋白质相互作用的区域。用“+”主观反映测定的β-半乳糖苷酶活性。一个“+”表示最低,三个“+”表示活性最高。从表1明显可见BRCA1前300个氨基酸不结合三个BRCA1调节子中的任一个,但三个BRCA1调节子都与含有BRCA1前600个氨基酸的BRCA1构建体结合。BRCA1调节子都不结合载体或bcl-2对照,却都与近似全长的含有8-1293位氨基酸的BRCA1构建体结合。
这些结果显示三个BRCA1调节子优先结合BRCA1前600个氨基酸。
实施例3
1号序列,091-21A31与BRCA1相互作用的结构域的鉴定
进行双杂合实验来确定BRCA1调节子091-21A31,1号序列与BRCA1相互作用的区域。方法基本如实施例1所述。酵母培养物的转化和生长基本按照美国专利5283173;Chien等,1991,美国国家科学院院报,88:9578-9582;Spaargaren M等,(1994)生物化学杂志,300:303-307描述的方法进行。
简言之,将YGH1酵母菌株用编码1号序列,091-21A31的cDNA,或编码融合了GAL4激活结构域、含有1号序列091-21A31的氨基酸78-469、1-300、300-469的片段的cDNA共转化。将bcl-2 cDNA(参见美国专利5539085)与GAL4激活结构域融合作为对照。将编码具有氨基酸1-300、1-600、8-1293的BRCA1片段的cDNA如实施例2所述与GAL4结合结构域融合。
1号序列,091-21A31构建体用质粒pGADGH或pGAD424制备;两者可购自Clontech。
含有氨基酸78-469的1号序列,091-21A31的构建体是将1号序列,091-21A31的EcoR1-Xhol片段亚克隆至pGAD424的EcoR1-Sal1位点而产生的。
含有氨基酸1-300的1号序列,091-21A31的构建体是将1号序列,091-21A31的BamH1-Sal1片段亚克隆至pGADGH的BamH1-Sal1位点而产生的。
含有氨基酸300-469的1号序列,091-21A31的构建体是将1号序列,091-21A31的BamH1钝末端-Sal1片段亚克隆至pGADGH的Sal1钝末端-Xhol位点而产生的。
表2显示共转化实验结果。显然BRCA1的前300个氨基酸不结合三个1号序列(091-21A31)的片段构建体中的任何一个,也不结合1号序列(091-21A31)。含有1-600位氨基酸的BRCA1构建体确实结合1号序列,091-21A31和含有该序列氨基酸78-469的构建体,但不结合含有该序列氨基酸1-300、300-469的构建体。同样,含有氨基酸8-1293的BRCA1构建体也与1号序列(091-21A31)的氨基酸78-469、1-300的构建体结合,而不结合具有该序列的氨基酸300-469的构建体。
表2
BRCA1与091-21的相互作用
实施例4
BRCA1调节子的表达和提纯
在杆状病毒感染的SF9细胞中表达并提纯BRCA1调节子。产生杆状病毒及培养SF9细胞的方法为本领域公知技术,详细操作可见于M.Summers和G.Smith“杆状病毒载体与昆虫培养操作指南”一文,Texas Agricultural Experiment Station,Bulletin NO.1555(1987年5月或G.E.Smith和M.D.Summers的EPO127839)。
以下构建体用pAcC 13(Rubinfeld B.等,细胞,65:1033-1042(1991))或pAcC 13衍生的pAcOG制备。后一个质粒中用加工成编码起始甲硫氨酸、Glu-Glu表位标记(Grussenmyer T.等,美国国家科学院院报82:7952(1985))和含有数个终止子的多克隆位点(Rubinfeld B.等,生物学和化学杂志,270:5549-5555(1995))的合成接头取代了原质粒的多接头。
含有1号序列,091-21A31的构建体是将1号序列,091-21A31的Kpn1-Xbal片段亚克隆至pAcC 13的Kpn1-Xbal位点制备的。
含有3号序列,091-1F84的构建体是将3号序列,091-1F84的Nco1-Xbal片段亚克隆至pAcOG 1的Nco1-Xbal位点制备的。
含有5号序列,091-132Q20的构建体是将5号序列,091-132Q20的Kpn1-Xbal片段亚克隆至pAcC 13的Kpn1-Xbal位点制备的。
含有适当BRCA1调节子的杆状病毒是用上述质粒转染SF9细胞,并基本按照Pharmingen′s cat.no.21100D,BaculoGoldtm/BaculovirusDNA的方法分离相应杆状病毒而产生的。从单个噬斑分离病毒,并用来感染SF9细胞。细胞生长4天,离心分离,将细胞团溶解制备细胞提取物。简要步骤是,重组SF9细胞离心成团,在5倍体积的[20mMTris(pH8.0),1mM EDTA,分别为10ug/ml的亮抑酶肽、抑胃酶肽、pefabloc,1mM抑酶肽,1mM DTT]溶液中裂解,冰浴10分钟。然后加入NaCl至终浓度为150mM,在室温保持10分钟,离心。将所得上清液上样到含有共价交联到蛋白G-琼脂糖的小鼠Glu-Glu单克隆抗体的1ml亲和柱上。参见Grussenmyer T.等,美国国家科学院院报,82:7952(1985)。将柱子用10-15ml裂解缓冲液洗涤,用每ml同一缓冲液含100μg Glu-Glu肽(EYMPME)的溶液洗脱。收集各级分,通过十二烷基磺酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)分析,汇集峰级分,根据纯度进一步在HPLC柱上纯化,这些柱包括Resource Q、ResourceS、Resource Eth(Pharmacia)。若纯化不可溶蛋白质,特别是1号序列,091-21A31,则将重组SF9细胞离心沉淀,在5倍体积的[20mMTris(pH8.0),137mM NaCl,1mM EGTA,1.5mM MgCl2,2%SDS,分别为10ug/ml的亮抑酶肽、抑胃酶肽、pefabloc,1mM抑酶肽,1mM DTT]中裂解,室温保持20-30分钟,超速离心。取出上层液相,调节NaCl至400mM,再离心。上清液用1×TG缓冲液[20mMTris(pH8.0),137mM NaCl,1mM EGTA,1.5mM MgCl2,1%TritonX 100,10%甘油,分别为10ug/ml的亮抑酶肽、抑胃酶肽、pefabloc,1mM抑酶肽,1mM DTT]1∶10稀释,经3μm GelmanVersapore滤器过滤,上样到1ml抗Glu-Glu的亲和柱上。参见RubinfeldB.等,分子细胞生物学,12:4634-4642(1992)。亲和柱用10-15ml含400mM NaCl的1×TG缓冲液洗涤,用含1%SDS和100ug/mlGlu-Glu肽的1×TG缓冲液洗脱。各级分经SDS-PAGE分析。
实施例5
确证BRCA1调节子蛋白与BRCA1的结合
为了确证实施例1中所述的双杂合检测结果及进一步实现每个BRCA1调节子与BRCA1结合,制备两个BRCA1构建体并检测它们与BRCA1调节子的结合能力。两个BRCA1构建体是Glu-Glu标记的BRCA1 5’(1-1293)和BRCA1 3’(1293-1863)。如以上实施例所述,Glu-Glu表位标记能协助免疫亲和纯化。对照构建体包括rapGAP。该构建体制备如Rubinfeld B.和Polakis P.,“杆状病毒产生的Rap1 GTPase-激活蛋白的纯化”,酶学方法,W.E.Balch,Channing J.Der和Alan Hall编,California:Academic Press,Inc.,255:31-38中所述。BRCA1构建体的制备如下:将BRCA1 Nco1-Nhel片段亚克隆至pAcOG1S的Nco1-Nhel位点得到pAcO BRCA1 5’(1-1293)。将BRCA1的Nhel钝末端-Not1片段亚克隆至pAcO G2 Stu1-Not1l位点得到pAcO BRCA1 3’(1293-1863)。按照标准方法,将构建体转染到SF9细胞中。基本按上述实施例中所述的免疫亲和纯化方法提纯BRCA1构建体。
为了体外转录和翻译BRCA1调节子,将下列构建体亚克隆至PCANmyc中,它是pCDNA3(Invitrogen)用加工成编码起始甲硫氨酸、Myc表位标记(参见Evan G.等,分子细胞生物学,5:3610(1985))和一个多克隆位点(Rubinfeld B.等,科学,272:1023-1026(1996))的合成接头取代多接头而衍生得到的。
含有BRCA1调节子3号序列,091-1F84的质粒PCANmyc091-1F84是将3号序列,091-1F84的Spel钝末端-Xhol片段亚克隆至PCANmyc3的EcoRV-Xhol位点制备的。含有BRCA1调节子1号序列,091-21A31的质粒PCANmyc091-21A31是将1号序列,091-21A31的BamH1-Xhol片段亚克隆至PCANmyc3的BamH1-Xhol位点制备的。最后,含有BRCA1调节子5号序列,091-132Q20的质粒PCANmyc091-132Q20是将5号序列,091-132Q20的EcoR1-Xhol片段亚克隆至PCANmyc3的EcoR1-Xhol位点制备的。
为了进行体外结合分析,BRCA1调节子cDNA(3号序列,091-1F84;1号序列,091-21A31;5号序列,091-132Q20)用TNT偶联的小麦胚细胞裂解体系(Promega)在[35S]甲硫氨酸存在下进行体外转录和翻译。然后,将1-2ug纯化的重组BRCA1蛋白(Glu-Glu标记的BRCA1 5’(1-1293)或BRCA1 3’(1293-1863))与10μl抗Glu-Glu偶联的G蛋白-琼脂糖珠一起加入25μl预先澄清的裂解物中。4℃振荡温育2小时后,琼脂糖珠用1ml冰冷的B缓冲液(20mMTris(pH7.5),150mM NaCl,0.5%Nonidet P-40)洗3次,用20μlSDS-PAGE样品缓冲液洗脱,进行SDS-PAGE和荧光显影。
SDS-PAGE荧光显影显示三个BRCA1调节子都与BRCA1 5’(1-1293)构建体发生亲和沉淀,而不与BRCA1 3’(1293-1863)形成沉淀。
rapGAP对照不与任何一种BRCA1调节子发生亲和沉淀。综合上述结果证实并扩展了双杂合检测的结果,证实了BRCA1调节子与BRCA1的结合。
实施例6
制备BRCA1调节子的抗体
为了制备抗体,利用特异识别重组可溶蛋白中表达的Glu-Glu表位的固定化抗Glu-Glu抗体从杆状病毒感染的SF9昆虫细胞中免疫亲和纯化BRCA1调节子(参见Rubinfeld B.等,分子细胞生物学,12:4634-4642(1992))。简言之,将重组SF9细胞离心沉淀,在5倍体积的[20mMTris(pH8.0),1mM EDTA,分别为10ug/ml的亮抑酶肽、抑胃酶肽、pefabloc,1mM抑酶肽,1mM DTT]溶液中裂解,冰浴10分钟。加入NaCl至终浓度150mM,室温保持10分钟,离心。然后将所得上清液上样到含有共价交联到蛋白G-琼脂糖的小鼠Glu-Glu抗体的1ml亲和柱上。将柱子用10-15ml裂解缓冲液洗涤,用每毫升同一缓冲液含100ugGlu-Glu肽(EYMPME)的溶液洗脱。收集各级分,通过十二烷基磺酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)分析,汇集峰级分,根据纯度进一步在HPLC柱中纯化,该柱包括Resource Q、Resource S、ResourceEth(Pharmacia)。若纯化不可溶蛋白,特别是1号序列,091-21A31,则离心沉淀重组SF9细胞,在5倍体积的溶液[20mM Tris(pH8.0),137mM NaCl,1mM EGTA,1.5mM MgCl2,2%SDS,分别为10ug/ml的亮抑酶肽、抑胃酶肽、pefabloc,1mM抑酶肽,1mM DTT]中裂解,室温保持20-30分钟,超速离心。取出上层液相,调节NaCl至400mM,再离心。然后将澄清的上清液用1×TG缓冲液[20mMTris(pH8.0),137mM NaCl,1mM EGTA,1.5mM MgCl2,1%TritonX 100,10%甘油,分别为10ug/ml的亮抑酶肽、抑胃酶肽、pefabloc,1mM抑酶肽,1mM DTT]1∶10稀释,经3μm GelmanVersapore滤器过滤,上样到1ml抗Glu-Glu的亲和柱上。亲和柱用10-15ml含400mM NaCl的1×TG缓冲液洗涤,用含1%SDS和100ug/ml Glu-Glu肽的1×TG缓冲液洗脱。各级分进行SDS-PAGE分析,汇集,用于免疫兔子。
要制备含抗BRCA1调节子的抗体的抗血清,则用BRCA1调节子如下免疫兔子。对BRCA1调节子1号序列,091-21A31,通常要进行两次免疫;第一次皮下注射含在CFA中的0.500mg,四个星期后第二次肌内注射含在ICFA中的0.250mg。取兔血,收集抗血清,如下纯化抗体。
用偶联于载体基质上的BRCA1调节子免疫原亲和纯化BRCA1调节子抗体。简要步骤为,将BRCA1调节子1号序列,091-21A31按如下偶联到CNBr活化的Sepharose 6MB(Pharmacia)上。1ml基质按照厂商说明进行活化(即重悬于1mM HCl,在1mM HCl中用烧结玻璃滤器洗15分钟)。将1mg 1号序列,091-21A31对偶联缓冲液[0.1MNaHCO3,pH8.3,0.5M NaCl]在4℃透析过夜,换两次缓冲液。将透析得到的蛋白质与CNBr活化的Sepharose 6MB温育,于4℃振荡过夜。过量的配体用偶联缓冲液洗去,残留的任何活性基团用1M乙醇胺室温封闭反应两小时。用不同pH值的缓冲液交替洗三轮,每轮包括用0.1M醋酸缓冲液(pH4.0),0.5M NaCl洗一次,随后用0.1M Tris(pH8.0),0.5M NaCl洗一次。将偶联了蛋白质的凝胶基质重新悬浮于PBS,与5ml抗体血清在4℃振荡温育过夜。将混合液注入柱子,使其逐滴流出,每次用15ml PBS洗涤,共洗三次。用800μl 0.2M甘氨酸(pH2.5)洗脱,收集七次的洗脱液,每次洗脱液立即用200μl 1M K2HPO4中和。合并峰级分,透析到PBS叠氮化物中保存。
美国典型培养物保藏中心保藏物
编码3号序列,091-1F84;1号序列,091-21A31;5号序列,091-132Q20的cDNA克隆于1996年8月14日保藏在美国典型培养物保藏中心(ATCC),保藏号分别为98141(3号序列,091-1F84)、98142(1号序列,091-21A31)、98143(5号序列,091-132Q20)。这些保藏物是依据Budapest条约保藏的,保藏日之后至少保留30年,最近一次要求之后至少保留5年。
如上已详尽描述了本发明,有许多本领域普通技术人员显而易见的变化和修改不背离附加权利要求的精神和范围。
序列表(1)基本信息 (i)申请人:Rubinfeld,Bonnee
Polakis,Paul G.
Ligenfelter,Carol
Vuong,Terilyn T.
(ii)发明名称:BRCA1活性调节子
(iii)序列数目:6
(iv)联系地址:
(A)地址:Onyx Pharmaceuticals,Inc.
(B)街道:3031 Rsearch Drive
(C)城市:Richmond
(D)州名:CA
(E)国家:USA
(F)邮政编码:94806
(v)计算机可读形式
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release #1.0,版本#1.30
(vi)目前申请资料:
(A)申请号:美国未知
(B)递交日:
(C)分类:实用新型
(viii)律师/代理人信息:
(A)名称:Giotta,Gregory
(B)登记号:32,028
(C)参考/著录号:ONYX1024 GG
(ix)电信信息:
(A)电话:(510)262-8710
(B)传真:(510)222-9758(2)SEQ ID NO:1的信息
(i)序列特征
(A)长度:2065个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(iv)反义:否
(ix)特征:
(A)名称/关键词:CDS
(B)位置:103..1512
(xi)序列描述:SEQ ID NO:1:GTGGATCCCC CGGGCTGCAG GAATTCGGCA CGAGCGGCAC GAGTACGAAG CCGGACCTGT 60AGCAGTTTCT TTGGCTGCCT GGGCCCCTTG AGTCCAGCCA TC ATG CCT ATC CGT 114
Met Pro Ile Arg
1GCT CTG TGC ACT ATC TGC TCC GAC TTC TTC GAT CAC TCC CGC GAC GTG 162Ala Leu Cys Thr Ile Cys Ser Asp Phe Phe Asp His Ser Arg Asp Val 5 10 15 20GCC GCC ATC CAC TGC GGC CAC ACC TTC CAC TTG CAG TGC CTA ATT CAG 210Ala Ala Ile His Cys Gly His Thr Phe His Leu Gln Cys Leu Ile Gln
25 30 35TGG TTT GAG ACA GCA CCA AGT CGG ACC TGC CCA CAG TGC CGA ATC CAG 258Trp Phe Glu Thr Ala Pro Ser Arg Thr Cys Pro Gln Cys Arg Ile Gln
40 45 50GTT GGC AAA AGA ACC ATT ATC AAT AAG CTC TTC TTT GAT CTT GCC CAG 306Val Gly Lys Arg Thr Ile Ile Asn Lys Leu Phe Phe Asp Leu Ala Gln
55 60 65GAG GAG GAG AAT GTC TTG GAT GCA GAA TTC TTA AAG AAT GAA CTG GAC 354Glu Glu Glu Asn Val Leu Asp Ala Glu Phe Leu Lys Asn Glu Leu Asp
70 75 80AAT GTC AGA GCC CAG CTT TCC CAG AAA GAC AAG GAG AAA CGA GAC AGC 402Asn Val Arg Ala Gln Leu Ser Gln Lys Asp Lys Glu Lys Arg Asp Ser 85 90 95 100CAG GTC ATC ATC GAC ACT CTG CGG GAT ACG CTG GAA GAA CGC AAT GCT 450Gln Val Ile Ile Asp Thr Leu Arg Asp Thr Leu Glu Glu Arg Asn Ala
105 110 115ACT GTG GTA TCT CTG CAG CAG GCC TTG GGC AAG GCC GAG ATG CTG TGC 498Thr Val Val Ser Leu Gln Gln Ala Leu Gly Lys Ala Glu Met Leu Cys
120 125 130TCC ACA CTG AAA AAG CAG ATG AAG TAC TTA GAG CAG CAG CAG GAT GAG 546Ser Thr Leu Lys Lys Gln Met Lys Tyr Leu Glu Gln Gln Gln Asp Glu
135 140 145ACC AAA CAA GCA CAA GAG GAG GCC CGC CGG CTC AGG AGC AAG ATG AAG 594Thr Lys Gln Ala Gln Glu Glu Ala Arg Arg Leu Arg Ser Lys Met Lys
150 155 160ACC ATG GAG CAG ATT GAG CTT CTA CTC CAG AGC CAG CGC CCT GAG GTG 642Thr Met Glu Gln Ile Glu Leu Leu Leu Gln Ser Gln Arg Pro Glu Val165 170 175 180GAG GAG ATG ATC CGA GAC ATG GGT GTG GGA CAG TCA GCG GTG GAA CAG 690Glu Glu Met Ile Arg Asp Met Gly Val Gly Gln Ser Ala Val Glu Gln
185 190 195CTG GCT GTG TAC TGT GTG TCT CTC AAG AAA GAG TAC GAG AAT CTA AAA 738Leu Ala Val Tyr Cys Val Ser Leu Lys Lys Glu Tyr Glu Asn Leu Lys
200 205 210GAG GCA CGG AAG GCC TCA GGG GAG GTG GCT GAC AAG CTG AGG AAG GAT 786Glu Ala Arg Lys Ala Ser Gly Glu Val Ala Asp Lys Leu Arg Lys Asp
215 220 225TTG TTT TCC TCC AGA AGC AAG TTG CAG ACA GTC TAC TCT GAA TTG GAT 834Leu Phe Ser Ser Arg Ser Lys Leu Gln Thr Val Tyr Ser Glu Leu Asp
230 235 240CAG GCC AAG TTA GAA CTG AAG TCA GCC CAG AAG GAC TTA CAG AGT GCT 882Gln Ala Lys Leu Glu Leu Lys Ser Ala Gln Lys Asp Leu Gln Ser Ala245 250 255 260GAC AAG GAA ATC ATG AGC CTG AAA AAG AAG CTA ACG ATG CTG CAG GAA 930Asp Lys Glu Ile Met Ser Leu Lys Lys Lys Leu Thr Met Leu Gln Glu
265 270 275ACC TTG AAC CTG CCA CCA GTG GCC AGT GAG ACT GTC GAC CGC CTG GTT 978Thr Leu Asn Leu Pro Pro Val Ala Ser Glu Thr Val Asp Arg Leu Val
280 285 290TTA GAG AGC CCA GCC CCT GTG GAG GTG AAT CTG AAG CTC CGC CGG CCA 1026Leu Glu Ser Pro Ala Pro Val Glu Val Asn Leu Lys Leu Arg Arg Pro
295 300 305TCC TTC CGT GAT GAT ATT GAT CTC AAT GCT ACC TTT GAT GTG GAT ACT 1074Ser Phe Arg Asp Asp Ile Asp Leu Asn Ala Thr Phe Asp Val Asp Thr
310 315 320CCC CCA GCC CGG CCC TCC AGC TCC CAG CAT GGT TAC TAC GAA AAA CTT 1122Pro Pro Ala Arg Pro Ser Ser Ser Gln His Gly Tyr Tyr Glu Lys Leu325 330 335 340TGC CTA GAG AAG TCA CAC TCC CCA ATT CAG GAT GTC CCC AAG AAG ATA 1170Cys Leu Glu Lys Ser His Ser Pro Ile Gln Asp Val Pro Lys Lys Ile
345 350 355TGC AAA GGC CCC AGG AAG GAG TCC CAG CTC TCA CTG GGT GGC CAG AGC 1218Cys Lys Gly Pro Arg Lys Glu Ser Gln Leu Ser Leu Gly Gly Gln Ser
360 365 370TGT GCA GGA GAG CCA GAT GAG GAA CTG GTT GGT GCC TTC CCT ATT TTT 1266Cys Ala Gly Glu Pro Asp Glu Glu Leu Val Gly Ala Phe Pro Ile Phe
375 380 385GTC CGG AAT GCC ATC CTA GGC CAG AAA CAG CCC AAG AGG CCC AGG TCA 1314Val Arg Asn Ala Ile Leu Gly Gln Lys Gln Pro Lys Arg Pro Arg Ser
390 395 400GAG TCC TCT TGC AGC AAA GAT GTG GTA AGG ACA GGC TTC GAT GGG CTC 1362Glu Ser Ser Cys Ser Lys Asp Val Val Arg Thr Gly Phe Asp Gly Leu405 410 415 420GGT GGC CGG ACA AAA TTC ATC CAG CCT ACT GAC ACA GTC ATG ATC CGC 1410Gly Gly Arg Thr Lys Phe Ile Gln Pro Thr Asp Thr Val Met Ile Arg
425 430 435CCA TTG CCT GTT AAG CCC AAG ACC AAG GTT AAG CAG AGG GTG AGG GTG 1458Pro Leu Pro Val Lys Pro Lys Thr Lys Val Lys Gln Arg Val Arg Val
440 445 450AAG ACA GTG CCT TCT CTC TTC CAG GCC AAG CTG GAC ACC TTC CTG TGG 1506Lys Thr Val Pro Ser Leu Phe Gln Ala Lys Leu Asp Thr Phe Leu Trp
455 460 465TCG TGA GAACAGTGAG TCTGACCAAT GGCCAGACAC ATGCCTGCAA CTTGTAGGTC 1562Ser *
470AAGGACTGTC CAGGCAGGGG TTTTGTGGAC AGAGCCCCAC TTTCGGGACC AGCCTGAGGT 1622GTAAGGGCAG ACAAACAGGT GAGGGTGAGT GTGACACCCA GAGACTGCTC TTCCTGCCCT 1682CACCCTGCCC CACTCCTACG ACTGGGAGCT GACATGACCA GCCCACTGAT CCTGTCAGCA 1742GGTCCTGCTC CTGTTGCCAG GCTCCTGTTT ATAGCCATGA TCAGATGTGG TCAGACTCTT 1802TCTGGGCCTG GAGACCACGG TCACTTGTTG ACTGTCTCTG TGGACCAGAG TGCTTGAGGC 1862ATCTCAGGCA GCCTCAGCCC AAGCTTCTAC CTGCCTTTGA CTTGCTTCTA GGCATAGCCT 1922GGGCCAAGCA GGGTGGGGAA TGGAGGATAG CATGGGATGT ATGGAGAGGA TGGAAGATTT 1982TCATGTAAAA TAAAATTAAA AAAAAAAAAA CAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 2042AAAAAAAAAA AAAAAAACTC GAG 2065(2)SEQ ID NO:2的信息
(i)序列特征
(A)长度:470个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:2:Met Pro Ile Arg Ala Leu Cys Thr Ile Cys Ser Asp Phe Phe Asp His 1 5 10 15Ser Arg Asp Val Ala Ala Ile His Cys Gly His Thr Phe His Leu Gln
20 25 30Cys Leu Ile Gln Trp Phe Glu Thr Ala Pro Ser Arg Thr Cys Pro Gln
35 40 45Cys Arg Ile Gln Val Gly Lys Arg Thr Ile Ile Asn Lys Leu Phe Phe
50 55 60Asp Leu Ala Gln Glu Glu Glu Asn Val Leu Asp Ala Glu Phe Leu Lys 65 70 75 80Asn Glu Leu Asp Asn Val Arg Ala Gln Leu Ser Gln Lys Asp Lys Glu
85 90 95Lys Arg Asp Ser Gln Val Ile Ile Asp Thr Leu Arg Asp Thr Leu Glu
100 105 110Glu Arg Asn Ala Thr Val Val Ser Leu Gln Gln Ala Leu Gly Lys Ala
115 120 125Glu Met Leu Cys Ser Thr Leu Lys Lys Gln Met Lys Tyr Leu Glu Gln
130 135 140Gln Gln Asp Glu Thr Lys Gln Ala Gln Glu Glu Ala Arg Arg Leu Arg145 150 155 160Ser Lys Met Lys Thr Met Glu Gln Ile Glu Leu Leu Leu Gln Ser Gln
165 170 175Arg Pro Glu Val Glu Glu Met Ile Arg Asp Met Gly Val Gly Gln Ser
180 185 190Ala Val Glu Gln Leu Ala Val Tyr Cys Val Ser Leu Lys Lys Glu Tyr
195 200 205Glu Asn Leu Lys Glu Ala Arg Lys Ala Ser Gly Glu Val Ala Asp Lys
210 215 220Leu Arg Lys Asp Leu Phe Ser Ser Arg Ser Lys Leu Gln Thr Val Tyr225 230 235 240Ser Glu Leu Asp Gln Ala Lys Leu Glu Leu Lys Ser Ala Gln Lys Asp
245 250 255Leu Gln Ser Ala Asp Lys Glu Ile Met Ser Leu Lys Lys Lys Leu Thr
260 265 270Met Leu Gln Glu Thr Leu Asn Leu Pro Pro Val Ala Ser Glu Thr Val
275 280 285Asp Arg Leu Val Leu Glu Ser Pro Ala Pro Val Glu Val Asn Leu Lys
290 295 300Leu Arg Arg Pro Ser Phe Arg Asp Asp Ile Asp Leu Asn Ala Thr Phe305 310 315 320Asp Val Asp Thr Pro Pro Ala Arg Pro Ser Ser Ser Gln His Gly Tyr
325 330 335Tyr Glu Lys Leu Cys Leu Glu Lys Ser His Ser Pro Ile Gln Asp Val
340 345 350Pro Lys Lys Ile Cys Lys Gly Pro Arg Lys Glu Ser Gln Leu Ser Leu
355 360 365Gly Gly Gln Ser Cys Ala Gly Glu Pro Asp Glu Glu Leu Val Gly Ala
370 375 380Phe Pro Ile Phe Val Arg Asn Ala Ile Leu Gly Gln Lys Gln Pro Lys385 390 395 400Arg Pro Arg Ser Glu Ser Ser Cys Ser Lys Asp Val Val Arg Thr Gly
405 410 415Phe Asp Gly Leu Gly Gly Arg Thr Lys Phe Ile Gln Pro Thr Asp Thr
420 425 430Val Met Ile Arg Pro Leu Pro Val Lys Pro Lys Thr Lys Val Lys Gln
435 440 445Arg Val Arg Val Lys Thr Val Pro Ser Leu Phe Gln Ala Lys Leu Asp
45C 455 460Thr Phe Leu Trp Ser *465 470(2)SEQ ID NO:3的信息
(i)序列特征
(A)长度:3256个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(ix)特征:
(A)名称/关键词:CDS
(B)位置:34.,2541
(xi)序列描述:SEQ ID NO:3:GAACTAGTGG ATCCCCCGGG CTGCAGGAAT TCG GCA CGA GAA AGC TTA TCC CTT 54
Ala Arg Glu Ser Leu Ser Leu
1 5CCC TCG ATG CTT CGG GAT GCT GCA ATT GGC ACT ACC CCT TTC TCT ACT 102Pro Ser Met Leu Arg Asp Ala Ala Ile Gly Thr Thr Pro Phe Ser Thr
10 15 20TGC TCG GTG GGG ACT TGG TTT ACT CCT TCA GCA CCA CAG GAA AAG AGT 150Cys Ser Val Gly Thr Trp Phe Thr Pro Ser Ala Pro Gln Glu Lys Ser
25 30 35ACA AAC ACA TCC CAG ACA GGC CTG GTT GGC ACC AAG CAC AGT ACT TCT 198Thr Asn Thr Ser Gln Thr Gly Leu Val Gly Thr Lys His Ser Thr Ser 40 45 50 55GAG ACA GAG CAG CTC CTG TGT GGC CGG CCT CCA GAT CTG ACT GCC TTG 246Glu Thr Glu Gln Leu Leu Cys Gly Arg Pro Pro Asp Leu Thr Ala Leu
60 65 70TCT CGA CAT GAC TTG GAA GAT AAC CTG CTG AGC TCT CTT GTC ATT CTG 294Ser Arg His Asp Leu Glu Asp Asn Leu Leu Ser Ser Leu Val Ile Leu
75 80 85GAG GTT CTC TCC CGC CAG CTT CGG GAC TGG AAG AGC CAG CTG GCT GTC 342Glu Val Leu Ser Arg Gln Leu Arg Asp Trp Lys Ser Gln Leu Ala Val
90 95 100CCT CAC CCA GAA ACC CAG GAC AGT AGC ACA CAG ACT GAC ACA TCT CAC 390Pro His Pro Glu Thr Gln Asp Ser Ser Thr Gln Thr Asp Thr Ser His
105 110 115AGT GGG ATA ACT AAT AAA CTT CAG CAT CTT AAG GAG AGC CAT GAG ATG 438Ser Gly Ile Thr Asn Lys Leu Gln His Leu Lys Glu Ser His Glu Met120 125 130 135GGA CAG GCC CTA CAG CAG GCC AGA AAT GTC ATG CAA TCA TGG GTG CTT 486Gly Gln Ala Leu Gln Gln Ala Arg Asn Val Met Gln Ser Trp Val Leu
140 145 150ATC TCT AAA GAG CTG ATA TCC TTG CTT CAC CTA TCC CTG TTG CAT TTA 534Ile Ser Lys Glu Leu Ile Ser Leu Leu His Leu Ser Leu Leu His Leu
155 160 165GAA GAA GAT AAG ACT ACT GTG AGT CAG GAG TCT CGG CGT GCA GAA ACA 582Glu Glu Asp Lys Thr Thr Val Ser Gln Glu Ser Arg Arg Ala Glu Thr
170 175 180TTG GTC TGT TGC TGT TTT GAT TTG CTG AAG AAA TTG AGG GCA AAG CTC 630Leu Val Cys Cys Cys Phe Asp Leu Leu Lys Lys Leu Arg Ala Lys Leu
185 190 195CAG AGC CTC AAA GCA GAA AGG GAG GAG GCA AGG CAC AGA GAG GAA ATG 678Gln Ser Leu Lys Ala Glu Arg Glu Glu Ala Arg His Arg Glu Glu Met200 205 210 215GCT CTC AGA GGC AAG GAT GCG GCA GAG ATA GTG TTG GAG GCT TTC TGT 726Ala Leu Arg Gly Lys Asp Ala Ala Glu Ile Val Leu Glu Ala Phe Cys
220 225 230GCA CAC GCC AGC CAG CGC ATC AGC CAG CTG GAA CAG GAC CTA GCA TCC 774Ala His Ala Ser Gln Arg Ile Ser Gln Leu Glu Gln Asp Leu Ala Ser
235 240 245ATG CGG GAA TTC AGA GGC CTT CTG AAG GAT GCC CAG ACC CAA CTG GTA 822Met Arg Glu Phe Arg Gly Leu Leu Lys Asp Ala Gln Thr Gln Leu Val
250 255 260GGG CTT CAT GCC AAG CAA GAA GAG CTG GTT CAG CAG ACA GTG AGT CTT 870Gly Leu His Ala Lys Gln Glu Glu Leu Val Gln Gln Thr Val Ser Leu
265 270 275ACT TCT ACC TTG CAA CAA GAC TGG AGG TCC ATG CAA CTG GAT TAT ACA 918Thr Ser Thr Leu Gln Gln Asp Trp Arg Ser Met Gln Leu Asp Tyr Thr280 285 290 295ACA TGG ACA GCT TTG CTG AGT CGG TCC CGA CAA CTC ACA GAG AAA CTC 966Thr Trp Thr Ala Leu Leu Ser Arg Ser Arg Gln Leu Thr Glu Lys Leu
300 305 310ACA GTC AAG AGC CAG CAA GCC CTG CAG GAA CGT GAT GTG GCA ATT GAG 1014Thr Val Lys Ser Gln Gln Ala Leu Gln Glu Arg Asp Val Ala Ile Glu
315 320 325GAA AAG CAG GAG GTT TCT AGG GTG CTG GAA CAA GTC TCT GCC CAG TTA 1062Glu Lys Gln Glu Val Ser Arg Val Leu Glu Gln Val Ser Ala Gln Leu
330 335 340GAG GAG TGC AAA GGC CAA ACA GAA CAA CTG GAG TTG GAA AAC AGT CGT 1110Glu Glu Cys Lys Gly Gln Thr Glu Gln Leu Glu Leu Glu Asn Ser Arg
345 350 355CTA GCA ACA GAT CTC CGG GCT CAG TTG CAG ATT CTG GCC AAC ATG GAC 1158Leu Ala Thr Asp Leu Arg Ala Gln Leu Gln Ile Leu Ala Asn Met Asp360 365 370 375AGC CAG CTA AAA GAG CTA CAG AGT CAG CAT ACC CAT TGT GCC CAG GAC 1206Ser Gln Leu Lys Glu Leu Gln Ser Gln His Thr His Cys Ala Gln Asp
380 385 390CTG GCT ATG AAG GAT GAG TTA TTC TGC CAG CTT ACC CAG AGC AAT GAG 1254Leu Ala Met Lys Asp Glu Leu Phe Cys Gln Leu Thr Gln Ser Asn Glu
395 400 405GAG CAG GCT GCT CAA TGG CAA AAG GAA GAG ATG GCA CTA AAA CAC ATG 1302Glu Gln Ala Ala Gln Trp Gln Lys Glu Glu Met Ala Leu Lys His Met
410 415 420CAG GCA GAA CTG CAG CAG CAA CAA GCT GTC CTG GCC AAA GAG GTG CGG 1350Gln Ala Glu Leu Gln Gln Gln Gln Ala Val Leu Ala Lys Glu Val Arg
425 430 435GAC CTG AAA GAG ACC TTG GAG TTT GCA GAC CAG GAG AAT CAG GTT GCT 1398Asp Leu Lys Glu Thr Leu Glu Phe Ala Asp Gln Glu Asn Gln Val Ala440 445 450 455CAC CTG GAG CTG GGT CAG GTT GAG TGT CAA TTG AAA ACC ACA CTG GAA 1446His Leu Glu Leu Gly Gln Val Glu Cys Gln Leu Lys Thr Thr Leu Glu
460 465 470GTG CTC CGG GAG CGC AGC TTG CAG TGT GAG AAC CTC AAG GAC ACT GTA 1494Val Leu Arg Glu Arg Ser Leu Gln Cys Glu Asn Leu Lys Asp Thr Val
475 480 485GAG AAC CTA ACG GCT AAA CTG GCC AGC ACC ATA GCA GAT AAC CAG GAG 1542Glu Asn Leu Thr Ala Lys Leu Ala Ser Thr Ile Ala Asp Asn Gln Glu
490 495 500CAA GAT CTG GAG AAA ACA CGG CAG TAC TCT CAA AAG CTA AGG CTG CTG 1590Gln Asp Leu Glu Lys Thr Arg Gln Tyr Ser Gln Lys Leu Arg Leu Leu
505 510 515ACT GAG CAA CTA CAG AGC CTG ACT CTC TTT CTA CAG ACA AAA CTA AAG 1638Thr Glu Gln Leu Gln Ser Leu Thr Leu Phe Leu Gln Thr Lys Leu Lys520 525 530 535GAG AAG ACT GAA CAA GAG ACC CTT CTG CTG AGT ACA GCC TGT CCT CCC 1686Glu Lys Thr Glu Gln Glu Thr Leu Leu Leu Ser Thr Ala Cys Pro Pro
540 545 550ACC CAG GAA CAC CCT CTG CCT AAT GAC AGG ACC TTC CTG GGA AGC ATC 1734Thr Gln Glu His Pro Leu Pro Asn Asp Arg Thr Phe Leu Gly Ser Ile
555 560 565TTG ACA GCA GTG GCA GAT GAA GAG CCA GAA TCA ACT CCT GTG CCC TTG 1782Leu Thr Ala Val Ala Asp Glu Glu Pro Glu Ser Thr Pro Val Pro Leu
570 575 580CTT GGA AGT GAC AAG AGT GCT TTC ACC CGA GTA GCA TCA ATG GTT TCC 1830Leu Gly Ser Asp Lys Ser Ala Phe Thr Arg Val Ala Ser Met Val Ser
585 590 595CTT CAG CCC GCA GAG ACC CCA GGC ATG GAG GAG AGC CTG GCA GAA ATG 1878Leu Gln Pro Ala Glu Thr Pro Gly Met Glu Glu Ser Leu Ala Glu Met600 605 610 615AGT ATT ATG ACT ACT GAG CTT CAG AGT CTT TGT TCC CTG CTA CAA GAG 1926Ser Ile Met Thr Thr Glu Leu Gln Ser Leu Cys Ser Leu Leu Gln Glu
620 625 630TCT AAA GAA GAA GCC ATC AGG ACT CTG CAG CGA AAA ATT TGT GAG CTG 1974Ser Lys Glu Glu Ala Ile Arg Thr Leu Gln Arg Lys Ile Cys Glu Leu
635 640 645CAA GTT AGG CTG CAG GCC CAG GAA GAA CAG CAT CAG GAA GTC CAG AAG 2022Gln Val Arg Leu Gln Ala Gln Glu Glu Gln His Gln Glu Val Gln Lys
650 655 660GCA AAA GAA GCA GAC ATA GAG AAG CTG AAC CAG GCC TTG TGC TTG CGC 2070Ala Lys Glu Ala Asp Ile Glu Lys Leu Asn Gln Ala Leu Cys Leu Arg
665 670 675TAC AAG AAT GAA AAG GAG CTC CAG GAA GTG ATA CAG CAG CAG AAT GAG 2118Tyr Lys Asn Glu Lys Glu Leu Gln Glu Val Ile Gln Gln Gln Asn Glu680 685 690 695AAG ATC CTA GAA CAG ATA GAC AAG AGT GGC GAG CTC ATA AGC CTT AGA 2166Lys Ile Leu Glu Gln Ile Asp Lys Ser Gly Glu Leu Ile Ser Leu Arg
700 705 710GAG GAG GTG ACC CAC CTT ACC CGC TCA CTT CGG CGT GCG GAG ACA GAG 2214Glu Glu Val Thr His Leu Thr Arg Ser Leu Arg Arg Ala Glu Thr Glu
715 720 725ACC AAA GTG CTC CAG GAG GCC CTG GCA GGC CAG CTG GAC TCC AAC TGC 2262Thr Lys Val Leu Gln Glu Ala Leu Ala Gly Gln Leu Asp Ser Asn Cys
730 735 740CAG CCT ATG GCC ACC AAT TGG ATC CAG GAG AAA GTG TGG CTC TCT CAG 2310Gln Pro Met Ala Thr Asn Trp Ile Gln Glu Lys Val Trp Leu Ser Gln
745 750 755GAG GTG GAC AAA CTG AGA GTG ATG TTC CTG GAG ATG AAA AAT GAG AAG 2358Glu Val Asp Lys Leu Arg Val Met Phe Leu Glu Met Lys Asn Glu Lys760 765 770 775GAA AAA CTC ATG ATC AAG TTC CAG AGC CAT AGA AAT ATC CTA GAG GAG 2406Glu Lys Leu Met Ile Lys Phe Gln Ser His Arg Asn Ile Leu Glu Glu
780 785 790AAC CTT CGG CGC TCT GAC AAG GAG TTA GAA AAA CTA GAT GAC ATT GTT 2454Asn Leu Arg Arg Ser Asp Lys Glu Leu Glu Lys Leu Asp Asp Ile Val
795 800 805CAG CAT ATT TAT AAG ACC CTG CTC TCT ATT CCA GAG GTG GTG AGG GGA 2502Gln His Ile Tyr Lys Thr Leu Leu Ser Ile Pro Glu Val Val Arg Gly
810 815 820TGC AGA GAA CTA CAG GGA TTG CTG GAA TTT CTG AGC TAA GAAACTGAAA 2551Cys Arg Glu Leu Gln Gly Leu Leu Glu Phe Leu Ser
825 830 835GCCAGAATCT GCTTCACCTC TTTTTACCTG CAATACCCCC TTACCCCAAT ACCAAGACCA 2611ACTGGCATAG AGCCAACTGA GATAAATGCT ATTTAAATAA AGTGTATTTA ATGAAAACTC 2671GTGCCGAATT CGGCACGAGC GGCACGAGCG GCACGAGCTG CAGCCATGTC TCTAGTGATC 2731CCTGAAAAGT TCCAGCATAT TTTGCGAGTA CTCAACACCA ACATCGATGG GCGGCGGAAA 2791ATAGCCTTTG CCATCACTGC CATTAAGGGT GTGGGCCGAA GATATGCTCA TGTGGTGTTG 2851AGGAAAGCAG ACATTGACCT CACCAAGAGG GCGGGAGAAC TCACTGAGGA TGAGGTGGAA 2911CGTGTGATCA CCATTATGCA GAATCCACGC CAGTACAAGA TCCCAGACTG GTTCTTGAAC 2971AGACAGAAGG ATGTAAAGGA TGGAAAATAC AGCCAGGTCC TAGCCAATGG TCTGGACAAC 3031AAGCTCCGTG AAGACCTGGA GCGACTGAAG AAGATTCGGG CCCATAGAGG GCTGCGTCAC 3091TTCTGGGGCC TTCGTGTCCG AGGCCAGCAC ACCAAGACCA CTGGCCGCCG TGGCCGCACC 3151GTGGGTGTGT CCAAGAAGAA ATAAGTCTGT AGGCCTTGTC TGTTAATAAA TAGTTTATAT 3211ACCAAAAAAA AAAAAAAAAA ACTCGAGCAT GCATCTAGAG GGCCC 3256(2)SEQ ID NO:4的信息
(i)序列特征
(A)长度:836个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:4:Ala Arg Glu Ser Leu Ser Leu Pro Ser Met Leu Arg Asp Ala Ala Ile 1 5 10 15Gly Thr Thr Pro Phe Ser Thr Cys Ser Val Gly Thr Trp Phe Thr Pro
20 25 30Ser Ala Pro Gln Glu Lys Ser Thr Asn Thr Ser Gln Thr Gly Leu Val
35 40 45Gly Thr Lys His Ser Thr Ser Glu Thr Glu Gln Leu Leu Cys Gly Arg
50 55 60Pro Pro Asp Leu Thr Ala Leu Ser Arg His Asp Leu Glu Asp Asn Leu 65 70 75 80Leu Ser Ser Leu Val Ile Leu Glu Val Leu Ser Arg Gln Leu Arg Asp
85 90 95Trp Lys Ser Gln Leu Ala Val Pro His Pro Glu Thr Gln Asp Ser Ser
100 105 110Thr Gln Thr Asp Thr Ser His Ser Gly Ile Thr Asn Lys Leu Gln His
115 120 125Leu Lys Glu Ser His Glu Met Gly Gln Ala Leu Gln Gln Ala Arg Asn
130 135 140Val Met Gln Ser Trp Val Leu Ile Ser Lys Glu Leu Ile Ser Leu Leu145 150 155 160His Leu Ser Leu Leu His Leu Glu Glu Asp Lys Thr Thr Val Ser Gln
165 170 175Glu Ser Arg Arg Ala Glu Thr Leu Val Cys Cys Cys Phe Asp Leu Leu
180 185 190Lys Lys Leu Arg Ala Lys Leu Gln Ser Leu Lys Ala Glu Arg Glu Glu
195 200 205Ala Arg His Arg Glu Glu Met Ala Leu Arg Gly Lys Asp Ala Ala Glu
210 215 220Ile Val Leu Glu Ala Phe Cys Ala His Ala Ser Gln Arg Ile Ser Gln225 230 235 240Leu Glu Gln Asp Leu Ala Ser Met Arg Glu Phe Arg Gly Leu Leu Lys
245 250 255Asp Ala Gln Thr Gln Leu Val Gly Leu His Ala Lys Gln Glu Glu Leu
260 265 270Val Gln Gln Thr Val Ser Leu Thr Ser Thr Leu Gln Gln Asp Trp Arg
275 280 285Ser Met Gln Leu Asp Tyr Thr Thr Trp Thr Ala Leu Leu Ser Arg Ser
290 295 300Arg Gln Leu Thr Glu Lys Leu Thr Val Lys Ser Gln Gln Ala Leu Gln305 310 315 320Glu Arg Asp Val Ala Ile Glu Glu Lys Gln Glu Val Ser Arg Val Leu
325 330 335Glu Gln Val Ser Ala Gln Leu Glu Glu Cys Lys Gly Gln Thr Glu Gln
340 345 350Leu Glu Leu Glu Asn Ser Arg Leu Ala Thr Asp Leu Arg Ala Gln Leu
355 360 365Gln Ile Leu Ala Asn Met Asp Ser Gln Leu Lys Glu Leu Gln Ser Gln
370 375 380His Thr His Cys Ala Gln Asp Leu Ala Met Lys Asp Glu Leu Phe Cys385 390 395 400Gln Leu Thr Gln Ser Asn Glu Glu Gln Ala Ala Gln Trp Gln Lys Glu
405 410 415Glu Met Ala Leu Lys His Met Gln Ala Glu Leu Gln Gln Gln Gln Ala
420 425 430Val Leu Ala Lys Glu Val Arg Asp Leu Lys Glu Thr Leu Glu Phe Ala
435 440 445Asp Gln Glu Asn Gln Val Ala His Leu Glu Leu Gly Gln Val Glu Cys
450 455 460Gln Leu Lys Thr Thr Leu Glu Val Leu Arg Glu Arg Ser Leu Gln Cys465 470 475 480Glu Asn Leu Lys Asp Thr Val Glu Asn Leu Thr Ala Lys Leu Ala Ser
485 490 495Thr Ile Ala Asp Asn Gln Glu Gln Asp Leu Glu Lys Thr Arg Gln Tyr
500 505 510Ser Gln Lys Leu Arg Leu Leu Thr Glu Gln Leu Gln Ser Leu Thr Leu
515 520 525Phs Leu Gln Thr Lys Leu Lys Glu Lys Thr Glu Gln Glu Thr Leu Leu
530 535 540Leu Ser Thr Ala Cys Pro Pro Thr Gln Glu His Pro Leu Pro Asn Asp545 550 555 560Arg Thr Phe Leu Gly Ser Ile Leu Thr Ala Val Ala Asp Glu Glu Pro
565 570 575Glu Ser Thr Pro Val Pro Leu Leu Gly Ser Asp Lys Ser Ala Phe Thr
580 585 590Arg Val Ala Ser Met Val Ser Leu Gln Pro Ala Glu Thr Pro Gly Met
595 600 605Glu Glu Ser Leu Ala Glu Met Ser Ile Met Thr Thr Glu Leu Gln Ser
610 615 620Leu Cys Ser Leu Leu Gln Glu Ser Lys Glu Glu Ala Ile Arg Thr Leu625 630 635 640Gln Arg Lys Ile Cys Glu Leu Gln Val Arg Leu Gln Ala Gln Glu Glu
645 650 655Gln His Gln Glu Val Gln Lys Ala Lys Glu Ala Asp Ile Glu Lys Leu
660 665 670Asn Gln Ala Leu Cys Leu Arg Tyr Lys Asn Glu Lys Glu Leu Gln Glu
675 680 685Val Ile Gln Gln Gln Asn Glu Lys Ile Leu Glu Gln Ile Asp Lys Ser
690 695 700Gly Glu Leu Ile Ser Leu Arg Glu Glu Val Thr His Leu Thr Arg Ser705 710 715 720Leu Arg Arg Ala Glu Thr Glu Thr Lys Val Leu Gln Glu Ala Leu Ala
725 730 735Gly Gln Leu Asp Ser Asn Cys Gln Pro Met Ala Thr Asn Trp Ile Gln
740 745 750Glu Lys Val Trp Leu Ser Gln Glu Val Asp Lys Leu Arg Val Met Phe
755 760 765Leu Glu Met Lys Asn Glu Lys Glu Lys Leu Met Ile Lys Phe Gln Ser
770 775 780His Arg Asn Ile Leu Glu Glu Asn Leu Arg Arg Ser Asp Lys Glu Leu785 790 795 800Glu Lys Leu Asp Asp Ile Val Gln His Ile Tyr Lys Thr Leu Leu Ser
805 810 815Ile Pro Glu Val Val Arg Gly Cys Arg Glu Leu Gln Gly Leu Leu Glu
820 825 830Phe Leu Ser *
835(2)SEQ ID NO:5的信息
(i)序列特征
(A)长度:1191个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(ix)特征:
(A)名称/关键词:CDS
(B)位置:34.,1191
(xi)序列描述:SEQ ID NO:5:GAACTAGTGG ATCCCCCGGG CTGCAGGAAT TCG GCA CGA GGC GGC GCC GAA GAG 54
Ala Arg Gly Gly Ala Glu Glu
1 5GCG ACT GAG GCC GGA CGG GGC GGA CGG CGA CGC AGC CCG CGG CAG AAG 102Ala Thr Glu Ala Gly Arg Gly Gly Arg Arg Arg Ser Pro Arg Gln Lys
10 15 20TTT GAA ATT GGC ACA ATG GAA GAA GCT GGA ATT TGT GGG CTA GGG GTG 150Phe Glu Ile Gly Thr Met Glu Glu Ala Gly Ile Cys Gly Leu Gly Val
25 30 35AAA GCA GAT ATG TTG TGT AAC TCT CAA TCA AAT GAT ATT CTT CAA CAT 198Lys Ala Asp Met Leu Cys Asn Ser Gln Ser Asn Asp Ile Leu Gln His 40 45 50 55CAA GGC TCA AAT TGT GGT GGC ACA AGT AAC AAG CAT TCA TTG GAA GAG 246Gln Gly Ser Asn Cys Gly Gly Thr Ser Asn Lys His Ser Leu Glu Glu
60 65 70GAT GAA GGC AGT GAC TTT ATA ACA GAG AAC AGG AAT TTG GTG AGC CCA 294Asp Glu Gly Ser Asp Phe Ile Thr Glu Asn Arg Asn Leu Val Ser Pro
75 80 85GCA TAC TGC ACG CAA GAA TCA AGA GAG GAA ATC CCT GGG GGA GAA GCT 342Ala Tyr Cys Thr Gln Glu Ser Arg Glu Glu Ile Pro Gly Gly Glu Ala
90 95 100CGA ACA GAT CCC CCT GAT GGT CAG CAA GAT TCA GAG TGC AAC AGG AAC 390Arg Thr Asp Pro Pro Asp Gly Gln Gln Asp Ser Glu Cys Asn Arg Asn
105 110 115AAA GAA AAA ACT TTA GGA AAA GAA GTT TTA TTA CTG ATG CAA GCC CTA 438Lys Glu Lys Thr Leu Gly Lys Glu Val Leu Leu Leu Met Gln Ala Leu120 125 130 135AAC ACC CTT TCA ACC CCA GAG GAG AAG CTG GCA GCT CTC TGT AAG AAA 486Asn Thr Leu Ser Thr Pro Glu Glu Lys Leu Ala Ala Leu Cys Lys LysTAT GCT GAT CTT CTG GAG GAG AGC AGG AGT GTT CAG AAG CAA ATG AAG 534Tyr Ala Asp Leu Leu Glu Glu Ser Arg Ser Val Gln Lys Gln Met Lys
155 160 165ATC CTG CAG AAG AAG CAA GCC CAG ATT GTG AAA GAG AAA GTT CAC TTG 582Ile Leu Gln Lys Lys Gln Ala Gln Ile Val Lys Glu Lys Val His Leu
170 175 180CAG AGT GAA CAT AGC AAG GCT ATC TTG GCA AGA AGC AAG CTA GAA TCT 630Gln Ser Glu His Ser Lys Ala Ile Leu Ala Arg Ser Lys Leu Glu Ser
185 190 195CTT TGC AGA GAA CTT CAG CGT CAC AAT AAG ACG TTA AAG GAG GAA AAT 678Leu Cys Arg Glu Leu Gln Arg His Asn Lys Thr Leu Lys Glu Glu Asn200 205 210 215ATG CAG CAG GCA CGA GAG GAA GAA GAA CGA CGT ATA GAA GCA ACT GCA 726Met Gln Gln Ala Arg Glu Glu Glu Glu Arg Arg Ile Glu Ala Thr Ala
220 225 230CAT TTC CAG ATT ACC TTA AAT GAA ATT CAA GCC CAG CTG GAG CAG CAT 774His Phe Gln Ile Thr Leu Asn Glu Ile Gln Ala Gln Leu Glu Gln His
235 240 245GAC ATC CAC AAC GCC AAA CTC CGA CAG GAA AAC ATT GAG CTG GGG GAG 822Asp Ile His Asn Ala Lys Leu Arg Gln Glu Asn Ile Glu Leu Gly Glu
250 255 260AAG CTA AAG AAG CTC ATC GAA CAG TAC GCA CTG AGG GAA GAG CAC ATT 870Lys Leu Lys Lys Leu Ile Glu Gln Tyr Ala Leu Arg Glu Glu His Ile
265 270 275GAT AAG GTG TTC AAA CAT AAG GAA CTG CAA CAG CAG CTC GTG GAT GCC 918Asp Lys Val Phe Lys His Lys Glu Leu Gln Gln Gln Leu Val Asp Ala280 285 290 295AAA CTG CAG CAA ACG ACA CAA CTG ATA AAA GAA GCT GAT GAA AAA CAT 966Lys Leu Gln Gln Thr Thr Gln Leu Ile Lys Glu Ala Asp Glu Lys His
300 305 310CAG AGA GAG AGA GAG TTT TTA TTA AAA GAA GCG ACA GAA TCG AGG CAC 1014Gln Arg Glu Arg Glu Phe Leu Leu Lys Glu Ala Thr Glu Ser Arg His
315 320 325AAA TAC GAA CAA ATG AAA CAG CAA GAA GTA CAA CTA AAA CAG CAG CTT 1062Lys Tyr Glu Gln Met Lys Gln Gln Glu Val Gln Leu Lys Gln Gln Leu
330 335 340TCT CTT TAT ATG GAT AAG TTT GAA GAA TTC CAG ACT ACC ATG GCA AAA 1110Ser Leu Tyr Met Asp Lys Phe Glu Glu Phe Gln Thr Thr Met Ala Lys
345 350 355AGC AAT GAA CTG TTT ACA ACC TTC AGA CAG GAA ATG GAA AAG ATG ACA 1158Ser Asn Glu Leu Phe Thr Thr Phe Arg Gln Glu Met Glu Lys Met Thr360 365 370 375AAG AAA ATT AAA AAA AAA AAA AAA AAA CTC GAG 1191Lys Lys Ile Lys Lys Lys Lys Lys Lys Leu Glu
380 385(2)SEQ ID NO:6的信息
(i)序列特征
(A)长度:386个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:6:Ala Arg Gly Gly Ala Glu Glu Ala Thr Glu Ala Gly Arg Gly Gly Arg 1 5 10 15Arg Arg Ser Pro Arg Gln Lys Phe Glu Ile Gly Thr Met Glu Glu Ala
20 25 30Gly Ile Cys Gly Leu Gly Val Lys Ala Asp Met Leu Cys Asn Ser Gln
35 40 45Ser Asn Asp Ile Leu Gln His Gln Gly Ser Asn Cys Gly Gly Thr Ser
50 55 60Asn Lys His Ser Leu Glu Glu Asp Glu Gly Ser Asp Phe Ile Thr Glu 65 70 75 80Asn Arg Asn Leu Val Ser Pro Ala Tyr Cys Thr Gln Glu Ser Arg Glu
85 90 95Glu Ile Pro Gly Gly Glu Ala Arg Thr Asp Pro Pro Asp Gly Gln Gln
100 105 110Asp Ser Glu Cys Asn Arg Asn Lys Glu Lys Thr Leu Gly Lys Glu Val
115 120 125Leu Leu Leu Met Gln Ala Leu Asn Thr Leu Ser Thr Pro Glu Glu Lys
130 135 140Leu Ala Ala Leu Cys Lys Lys Tyr Ala Asp Leu Leu Glu Glu Ser Arg145 150 155 160Ser Val Gln Lys Gln Met Lys Ile Leu Gln Lys Lys Gln Ala Gln Ile
165 170 175Val Lys Glu Lys Val His Leu Gln Ser Glu His Ser Lys Ala Ile Leu
180 185 190Ala Arg Ser Lys Leu Glu Ser Leu Cys Arg Glu Leu Gln Arg His Asn
195 200 205Lys Thr Leu Lys Glu Glu Asn Met Gln Gln Ala Arg Glu Glu Glu Glu
210 215 220Arg Arg Ile Glu Ala Thr Ala His Phe Gln Ile Thr Leu Asn Glu Ile225 230 235 240Gln Ala Gln Leu Glu Gln His Asp Ile His Asn Ala Lys Leu Arg Gln
245 250 255Glu Asn Ile Glu Leu Gly Glu Lys Leu Lys Lys Leu Ile Glu Gln Tyr
260 265 270Ala Leu Arg Glu Glu His Ile Asp Lys Val Phe Lys His Lys Glu Leu
275 280 285Gln Gln Gln Leu Val Asp Ala Lys Leu Gln Gln Thr Thr Gln Leu Ile
290 295 300Lys Glu Ala Asp Glu Lys His Gln Arg Glu Arg Glu Phe Leu Leu Lys305 310 315 320Glu Ala Thr Glu Ser Arg His Lys Tyr Glu Gln Met Lys Gln Gln Glu
325 330 335Val Gln Leu Lys Gln Gln Leu Ser Leu Tyr Met Asp Lys Phe Glu Glu
340 345 350Phe Gln Thr Thr Met Ala Lys Ser Asn Glu Leu Phe Thr Thr Phe Arg
355 360 365Gln Glu Met Glu Lys Met Thr Lys Lys Ile Lys Lys Lys Lys Lys Lys
370 375 380Leu Glu385