说明书人G蛋白偶联受体的内源形式和非内源形式
本申请为国际申请PCT/US00/31509于2002年5月17日进入中国国家阶段、申请号为00815869.X、发明名称为“人G蛋白偶联受体的内源形式和非内源形式”的分案申请。
发明领域
本专利申请文件所公开的发明涉及跨膜受体;具体地讲,涉及与人G蛋白偶联的受体,特别是内源人GPCR;尤其强调的是已被改变从而具有或增强了受体的组成性活性的GPCR的非内源形式。优选将该被改变的GPCR用于作为有可能成为治疗剂的受体激动剂、反激动剂或部分激动剂的候选化合物的直接识别。
发明背景
尽管在人体内有很多种类的受体,但到目前为止最丰富和最与治疗有关的是G蛋白偶联受体(GPCR)。据估计,在人类基因组内有大约100,000个基因,它们中的大约2%即2,000个基因被估计用来编码GPCR。包括GPCR在内,其内源配体已被认识的受体被称为“已知”受体,内源配体尚不知晓的受体被称为“孤儿”受体。GPCR代表着药物产品开发的一个重要领域:60%的处方药物开发自100个已知GPCR中的大约20个。
GPCR都具有一个相同的基元(motif)。所有这些受体具有七个由22到24个疏水氨基酸组成的序列,它们组成七个α螺旋,每个α螺旋都跨过膜(每个跨度都以数字表示,例如,跨膜-1(TM-1)、跨膜-2(TM-2)等)。跨膜螺旋通过氨基酸链连接,在细胞膜的外部即“细胞外”一边的氨基酸链分别在跨膜-2和跨膜-3、跨膜-4和跨膜-5、跨膜-6和跨膜-7之间(这些分别被称为“细胞外”区1、2和3(EC-1、EC-2和EC-3))。在细胞膜内部即“细胞内”一边,跨膜螺旋也通过氨基酸链进行连接,这些氨基酸链分别在跨膜-1和跨膜-2、跨膜-3和跨膜-4、跨膜-5和跨膜-6之间(这些分别被称为“细胞内”区1、2和3(IC-1、IC-2和IC-3))。受体的“羧基”(“C”)端是在细胞内的区域,受体的“氨基”(“N”)端在细胞外的区域。
一般来说,当内源配体与受体结合时(经常被称为受体的“活化”),细胞内区域的构象发生变化,以容许细胞内区域和细胞内“G-蛋白”进行偶联。据报道,GPCR对于G蛋白而言是“混杂的”,也就是说,可与不只一个G蛋白相互作用。参见,Kenakin,T.,43,生命科学(LifeSciences)1095(1988)。尽管存在其他G蛋白,但当前已被识别的G蛋白是Gq、Gs、Gi、Gz和Go。内源配体活化的GPCR与G-蛋白的偶联引发一个信号级联过程(被称为“信号传导”)。在通常情形下,信号传导最终导致细胞活化或细胞抑制。据认为,受体的IC-3环与羧基端都和G蛋白相互作用。
在生理条件下,GPCR存在于细胞膜上,并在“非活化”状态和“活化”状态这两种不同构象之间保持平衡。在非活性状态下的受体不能与细胞内信号传导途径相偶联以产生生物学反应。受体构象向活性状态的转变就使它与传导途径相偶联(通过G-蛋白)并产生生物学反应。
可通过内源配体或化合物如药物将受体稳定在其活性状态。近来的发现提供了除内源配体或药物之外能够促进和稳定受体到活性状态构象的方法,这包括但不限于对受体的氨基酸序列的修饰。这些方法通过模仿与受体结合的内源配体的作用来有效地稳定活性状态的受体。通过如此的配体非依赖性方法形成的稳定被称为“组成型受体活化”。
发明概述
这里公开的是人GPCR的内源和非内源形式及其应用。
附图的简要描述
图1显示了在与对照(“CMV”)相比下内源形式的RUP12(‘RUP12’)产生的第二信使IP3。
图2是基于细胞的第二信使环AMP分析结果的图形,显示内源形式RUP13(“RUP13”)与对照载体(“CMV”)的组成型信号发送的比较结果。
图3是比较CMV、内源形式RUP13(“RUP13wt”)和非内源形式组成型活化的RUP13(“RUP13(A268K)”)信号测量结果的图示,其中使用以8XCRE-Luc报告质粒。
图4是[35S]GTPγS分析结果的示意图,显示RUP13:Gs融合蛋白(“RUP13-Gs”)和对照载体(“CMV”)的组成型信号发送的比较结果。
图5是比较CMV、内源形式RUP14(“RUP14wt”)和非内源形式组成型活化的RUP13(“RUP14(L246K)”)信号测量结果的图示,其中使用8XCRE-Luc报告质粒。
图6是比较CMV、内源形式RUP15(“RUP15wt”)和非内源形式组成型活化的RUP15(“RUP15(A398K)”)信号测量结果的图示,其中使用8XCRE-Luc报告质粒。
图7是基于细胞的第二信使环AMP分析结果的图形,显示内源形式RUP15(“RUP15wt”)、非内源形式组成型活化的RUP15(“RUP15(A398K)”)与对照载体(“CMV”)的组成型信号发送的比较结果。
图8是[35S]GTPγS分析结果的示意图,显示RUP15:Gs融合蛋白(“RUP15-Gs”)和对照载体(“CMV”)的组成型信号发送的比较结果。
图9显示与对照(“CMV”)相比之下内源形式的RUP17(“RUP17”)中产生的第二信使IP3。
图10显示与对照(“CMV”)相比之下内源形式的RUP21(“RUP21”)中产生的第二信使IP3。
图11是比较CMV、内源形式RUP23(“RUP23wt”)和非内源形式组成型活化的RUP23(“RUP23(W275K)”)信号测量结果的图示,其中使用8XCRE-Luc报告质粒。
图12是几种针对RUP13的侯选化合物的初步筛选结果示意图;孔A2中提供了“化合物A”的结果,孔G9中提供了“化合物B”的结果。
详细描述
本科学文献涉及受体并采用一些术语来描述对受体具有不同作用的配体。为了清楚和前后一致,在本发明文献中将由始至终使用下列定义。在这些定义与这些词语的其他定义冲突时,选择下列定义:
激动剂 意味着激活细胞内反应的物质(例如,配体、候选化合物),此时它们结合受体或促进GTP与膜结合。
在此应用的氨基酸缩写列于下表A:
表A 丙氨酸 ALA A
精氨酸 ARG R
天冬酰胺 ASN N
天冬氨酸 ASP D
半胱氨酸 CYS C
谷氨酸 GLU E
谷氨酰胺 GLN Q
甘氨酸 GLY G
组氨酸 HIS H
异亮氨酸 ILE I
亮氨酸 LEU L
赖氨酸 LYS K
蛋氨酸 MET M
苯丙氨酸 PHE F
脯氨酸 PRO P
丝氨酸 SER S
苏氨酸 THR T
色氨酸 TRP W
酪氨酸 TYR Y
缬氨酸 VAL V
部分激动剂 意味着这样的物质(例如,配体、候选化合物),它们与受体结合时,激活细胞内反应或者促进GTP与膜结合的程度低于激动剂。
拮抗剂 意味着这样的物质(例如,配体、候选化合物),它和激动剂在同一位点与受体竞争性地结合,但不激活由受体的活性形式引起的细胞内反应,并可因此抑制由激动剂或部分激动剂促进的细胞内反应。拮抗剂在没有激动剂或部分激动剂的情形下并不削弱基本细胞内反应。
候选化合物 意味着一个将经受筛选技术检验的分子(例如但不限于化学化合物)。优选的“候选化合物”并不包括对公众来说已知选自受体的反激动剂、激动剂或拮抗剂的化合物,它们以前已通过非直接的识别方法被确定(“非直接识别的化合物”);更优选不包括先前已经确定至少在一种哺乳动物中具有治疗效果的已被非直接识别的化合物;并且,最优选不包括先前已经确定的在人体中具有治疗用途的已被非直接识别的化合物。
组合物 是指至少包含一种成分的物质;药物组合物即是组合物的一个例子。
化合物效应 意味着一个化合物抑制或者刺激受体功能的能力的量度,它与受体结合亲和力相对。测定化合物效应的典型方法在本专利申请的实施例部分中进一步公开。
密码子 是指三个一组的核苷酸(或与核苷酸相当的词),核苷酸通常由一个核苷(腺苷(A)、鸟苷(G)、胞苷(C)、尿苷(U)和胸苷(T))偶联一个磷酸基团组成,翻译时一个密码子编码一个氨基酸。
被组成型活化的受体 意味着易受组成型受体活化的受体。被组成型活化的受体可以是内源的也可以是非内源的。
组成型受体活化 意味着不利用它的内源配体或其化学等价物与受体结合的方法而使在活性状态下的受体稳定。
接触 意味着把至少两部分放在一起,无论是在体外系统还是在体内系统中。
直接识别或被直接识别,与术语“候选化合物”相联系,意味着筛选针对组成型活化的受体、优选针对组成型活化的孤儿受体、最优选针对组成型活化的与G蛋白偶联的细胞表面孤儿受体的候选化合物。本术语在任何情形下都不应被解释或被理解为被包括或包括术语“非直接地识别”或“非直接地被识别”。
内源 意味着由哺乳动物天然产生的物质。这些只作为例证但却不是限制。与之相对比,术语“非内源”在本文中意味着不是由哺乳动物(例如但不限于人)或病毒天然产生的。相反,本文中术语“非内源”意味着并非由哺乳动物(例如但不限于人)或病毒天然产生的物质。例如,在其内源形式下并非组成型活化的受体,当对之进行操作而使之组成型活化时,此受体被最优选地指称为“非内源的被组成型活化的受体”,这只作为例证而不是限制。两个用语都可被用来描述“体内”和“体外”系统。例如,在筛选过程中,内源的或非内源的受体可被用于体外筛选系统,这也只作为例证而不是限制。作为进一步的例子而不是限制,当操作哺乳动物的基因组以包括非内源组成型活化受体时,可以通过体内系统筛选候选化合物。
在本文的上下文中,“G蛋白偶联受体融合蛋白”和“GPCR融合蛋白”是指包含着内源的组成型活化的GPCR的非内源蛋白,或与至少一个G蛋白、优选G蛋白的α亚基(它是与GTP结合的亚基)融合的非内源组成型活化的GPCR,其中的G蛋白的类型优选与在天然情况下和内源孤儿GPCR偶联的G蛋白的类型是一致的。例如(但不限制),在内源状态,如果G蛋白“Gsα”是与GPCR偶联的主要的G蛋白,基于这一具体GPCR的GPCR融合蛋白就是包含与Gsα融合的GPCR的非内源蛋白。在某些情况下,正如下文将要描述的那样,非主要的G蛋白也可以和GPCR融合。G蛋白与组成型活化的GPCR的C末端可直接融合,也可在其两者之间存在间隔子。
宿主细胞 意味着能在其中插入质粒和/或载体的细胞。在原核宿主细胞情形下,当宿主细胞复制时质粒典型地以自主分子方式复制(在一般情况下,质粒在复制后被分离出来以被引入真核宿主细胞中);在真核宿主细胞情形下,质粒被整合进宿主细胞的细胞DNA中,因而,当真核细胞复制时,质粒复制。为在此公开的本发明的目的,宿主细胞优选是真核细胞,更优选是哺乳动物细胞,最优选地是从293、293T和COS-7细胞中选择出来的细胞。
非直接地识别或非直接地被识别 意味着发现药物的传统方法,该方法涉及对内源受体特异的内源配体的识别、筛选针对受体的候选化合物、确定那些干扰或竞争配体-受体相互反应的化合物、测量化合物对至少一个与活化受体相关的第二信使途径影响的效率。
抑制,与用语“反应”相联系,意味着在一个化合物存在时一个反应被降低或阻止,这正好与该化合物不存在时相反。
反激动剂 意味着这样的物质(例如,配体、候选化合物),它们与内源受体或受体的组成型活化形式结合,并且将由受体的活性形式引发的基本细胞内反应抑制到正常基础水平以下,该活性水平是在没有激动剂或部分激动剂的情况下观察的,或者它们降低GTP与膜的结合。与在没有反激动剂情况下的基本反应相比,基本细胞内反应在反激动剂的存在下优选被抑制至少30%、更优选至少50%、最优选至少75%。。
已知受体 意味着其特异的内源配体已被识别的内源受体。
配体 意味着对内源的天然产生的受体特异的内源的天然产生的分子。
关于内源受体的核苷酸和/或氨基酸序列的突变 意味着这些内源序列的特定改造,从而使内源的非组成型活化受体的突变型能造成受体的组成型活化。对于特定序列的等价物,人受体的后续突变型被认为是人受体的首次突变的等价物,如果(a)后续突变型受体的组成型活化水平与受体的首次突变所表明的在本质上一样;和(b)在后续突变型受体和受体的首次突变之间的序列同源性的百分数是至少80%,更优选地是至少90%,最优选地是至少95%。在理想的情况下,考虑到在此公开的用于进行组成型活化的最优选的盒包括在内源和非内源型GPCR之间发生变化的单一氨基酸和/或密码子,序列同源性的百分数应是至少98%。
非孤儿受体 是指天然存在的内源分子,对天然存在的内源配体表现出特异性,配体与受体的结合使胞内信号途经得以活化。
孤儿受体 意味着这样的内源受体,其特异的内源配体尚未被识别或尚未知。
药物组合物 意味着包括至少一种活性成分的组合物,借助此活性成分可以研究该组合物可在哺乳动物(例如但不限于人体)中特定的效果。本领域的那些普通技术人员将能够理解和正确评价那些适于确定活性成分是否具有基于技术人员需要的预期效果的技术。
质粒 意味着载体和cDNA的结合体。一般,为cDNA复制和/或表达蛋白质的目的将质粒引进宿主细胞。
第二信使意味着受体激活所产生的细胞内应答。例如,第二信使包括三磷酸肌醇(IP3),二酰甘油(DAG),环AMP(cAMP),和环GMP(cGMP)。对第二信使应答的检测可以确定是否存在受体活化。此外,对第二信使应答的检测可以直接识别侯选化合物,例如包括反激动剂,激动剂,部分激动剂和拮抗剂。
刺激,与术语“反应”相联系,意味着当一种化合物存在时比当它不存在时反应增强。
针对cDNA的载体 意味着能够将至少一个cDNA掺入其中且能导入到宿主细胞中的环形DNA。
下面部分的顺序安排是为了表达效果,而不能被解释为对下面的公开或权利要求的限制。
A.引言
受体的传统研究一直是基于这样的前置假定(基于历史),即内源配体必须首先被识别,然后才能发现可以作用于受体的拮抗剂和其他分子。甚至在拮抗剂被首先发现的情况下,搜索的目光也立即延伸到查找内源配体上去。即使在发现组成型活化受体之后,这种思维模式也一直在受体研究中持续。在此之前没有被认识到的是,是受体的活性状态对发现受体的激动剂、部分激动剂和反激动剂是最有用的。对于那些因为受体的过度活化和不够活化而导致的疾病来说,希望得到的治疗药物是能分别用来减少受体的活性状态或增强受体活性的化合物,而并不需要是对抗内源配体的拮抗剂。这是因为,一个降低或增强活化态受体活性的化合物并不需要结合在和内源配体一样的位点上。因而,正如本发明的一个方法所说的那样,对治疗性化合物的任何搜索可通过筛选针对配体非依赖性活性态的化合物而开始。
B.人GPCR的识别
人类基因组计划的实施导致位于人类基因组内有关核酸序列的大量信息的识别,经过这种努力,事实上,我们无需了解或认识任何特定的基因组序列是否包含翻译人类蛋白的可读框信息,即可获得遗传序列信息,几种识别人类基因组中核酸序列的方法都是本领域普通技术人员所熟悉的,比如(但不限定),此处公开的大量人类GPCR,即是通过回顾GenBankTM数据库而发现的。下面的表B,列出了几个被我们发现的内源GPCR,以及与所公开的GPCR同源的其他GPCR。
表B 公开的人类孤 儿GPCR 入藏登记 可读框 (碱基对) 参考同源GPCR与指明的 GPCR同源性 比率
hRUP8 AL121755 1,152bpNPY2R27%
hRUP9 AC0113375 1,260bpGAL2R22%
hRUP10 AC008745 1,014bpC5aR40%
hRUP11 AC013396 1,272bpHM7436%
hRUP12 AP000808 966bpMas134%
hRUP13 AC011780 1,356bp鱼GPRX-ORYLA43%
hRUP14 AL137118 1,041bpCysLT1R35%
hRUP15 AL016468 1,527bpRE230%
hRUP16 AL136106 1,068bpGLR10137%
hRUP17 AC023078 969bpMas137%
hRUP18 AC008547 1,305bp催产素31%
hRUP19 AC026331 1,041bpHM7452%
hRUP20 AL161458 1,011bpGPR3425%
hRUP21 AC026756 1,014bpP2Y1R37%
hRUP22 AC027026 993bpRUP17Mas167%37%
hRUP23 AC007104 1,092bp大鼠GPR2631%
hRUP24 AL355388 1,125bpSALPR44%
hRUP25 AC026331 1,092bpHM7495%
hRUP26 AC023040 1,044bp兔5HT1D27%
hRUP27 AC027643 158,700MCH38%
受体同源性对于进一步了解受体在人体中的作用是有用的,在本专利申请文件的下文中,我们将公开使这些受体产生突变的技术,以便建立这些受体的非内源组成型活化的形式。
此处公开的这些技术还已经应用到本领域已知的人其他的孤儿GPCR,随着本专利申请文件的进一步描述,该技术会更加明显。
C.受体筛选
筛选出对应于此处公开的人GPCR的非内源组成型活化形式的候选化合物,可直接识别在这个细胞表面受体上起作用的候选化合物,而不需要使用受体的内源配体。利用常规的、经常是商业可得的技术,可以确定此处公开的人GPCR的内源形式在体内表达和/或过表达的区域。也有可能利用这些技术确定与受体表达和/或过表达关联的相关疾病/紊乱,这种方法在本专利申请文件中得以公开。
制造可以证明此处公开的人GPCR组成型活化的突变的技术,是基于与脯氨酸残基的距离,据估计此残基位于GPCR的TM6内部,这一算法规则公开在2000年4月20日以WO00/22129公布的普通转让的审查未决的PCT申请PCT/US99/23938中,该申请和其它此处罗列的专利文献一并引入此文作参考。该算法规则不是依据传统的序列比对来预测,而是依据与上述TM6脯氨酸残基(或也可能是这种脯氨酸残基的内源组成型替代物)的特定距离。通过使距该残基(估计位于受体的IC3区)16个氨基酸残基处的氨基酸残基发生突变,最好是突变为赖氨酸,可以获得这种活化。其他氨基酸在此位置上的突变可用来达到此目的。
D.疾病/紊乱识别和/或选择
正如下文将要详细描述的,最优选用本发明的方法识别针对非内源的组成型活化的GPCR的反激动剂和激动剂。如此的反激动剂和激动剂是治疗与这些受体有关的疾病的药物探索中先导化合物的理想候选者。因为可直接识别针对这些受体的反激动剂,因此有可能开发和搜索针对与这些受体有关的疾病和紊乱的药物组合物。例如,检查患病和正常组织样品中这些GPCR的存在,现在不仅仅是学术研究的问题,也是在识别特定GPCR的内源配体的研究道路上所致力解决的问题。可在健康和患病组织的宽广范围内进行组织检查。如此的组织检查提供了把特异受体与疾病/紊乱相联系的优选第一步骤。
优选人GPCR的DNA序列被用来制作探针,用于进行(a)针对组织mRNA的斑点印迹和(b)组织样品中所述受体表达的RT-PCR识别。在组织或疾病组织中受体的存在,或者与正常组织相比在疾病组织中受体的浓度提高,可被优选地用来识别治疗方法(包括但不限于)与那种疾病的关联。用这种方法也可很好地把受体定位于器官的区域。基于受体被定位于其中的特定组织的已知功能,受体假想的功能性角色可被推导出来。
E.候选化合物的筛选
1.一般的GPCR筛选测定技术
当一种G蛋白受体变为组成型活化时,它与G蛋白(例如,Gq、Gs、Gi、Gz、Go)偶联并刺激GTP与G蛋白结合。接着,借助受体在正常情况下失活,G蛋白作为GTP酶慢慢地把GTP水解为GDP,然而,组成型活化的受体继续把GDP转化为GTP。GTP不可水解的类似物[35S]GTPγS,可被用来监测与表达组成型活化受体的膜的结合。据报道,[35S]GTPγS可被用来监测在配体存在或不存在的情形下G蛋白与膜的偶联。在本领域中著名和可行的其他例证中有此种监测的一个例证,它由Traynor和Nahorski在1995年所报道。本测定系统的一个优选的应用是为了初步筛选候选化合物,因为本系统对所有蛋白-偶联受体一般可行,而不考虑与受体的细胞内结构域相互作用的那一种特别的G蛋白。
2.特定的GPCR筛选测定技术
一旦应用“一般”G蛋白偶联的受体测定方法(即筛选是激动剂、部分激动剂或反激动剂的化合物的方法)识别出候选化合物,优选进一步筛选以确认作用在受体位点的化合物。例如,应用“一般”测定方法识别的化合物可以不与受体结合,但也可以仅仅从细胞内结构域与G蛋白“解偶联”。
a.Gs,Gz和Gi
Gs刺激腺苷酸环化酶。另一方面,Gi(和Gz和Go)抑制该酶。腺苷酸环化酶催化ATP向cAMP的转化;因此,与Gs蛋白偶联的组成型活化的GPCR与升高的细胞内cAMP水平相关联。在另一方面,与Gi(和Gz或Go)蛋白偶联的组成型活化的GPCR与降低的细胞内cAMP水平相关联。一般情况参见“突触传导的非直接机制(IndirectMechanisms of Synaptic Transmission)”,第8章,从神经到大脑(FromNeuron To Brain)(第三版),Nichols,J.G.等编,Sinauer Associates,Inc.(1992)。因此,检测cAMP的方法可被用来确定一个竞争性的化合物是否是受体的反激动剂(即这样的一个化合物将能降低cAMP的水平)等。本领域已知的测定cAMP的不同方法可以被利用;最优选的方法依赖于在基于ELISA的方法中应用抗-cAMP的抗体。可被应用的另一类测定方法是一种全细胞第二信使报告基因系统测定法。基因上的启动子驱动由一个特别的基因所编码的蛋白质的表达。环AMP通过以下步骤促进基因的表达,即它响应促进cAMP的DNA结合蛋白或转录因子(CREB)的结合,转录因子接着在被称为cAMP效应元件的特别位点与启动子结合并驱动基因表达。报告基因系统可被构建为具有一个启动子,该启动子在报告基因的前面含有多个cAMP效应元件,例如β-半乳糖苷酶或荧光素酶。因而,一个被组成型活化的连接Gs的受体引起cAMP的积累,cAMP接着激活报告蛋白质的基因和表达。β-半乳糖苷酶或荧光素酶等报告蛋白质可用标准生化方法检测到(Chen等,1995)。
b.Go和Gq
Go和Gq与磷脂酶C的活化相联系,磷脂酶随后水解磷酸酯PIP2,并释放两种细胞内信使:二酰甘油(DAG)和肌醇-1,4,5-三磷酸(IP3)。积累增加的IP3与Gq-和Go-关联的受体相关联。一般情况参见“突触传导的非直接机制(Indirect Mechanisms of Synaptic Transmission)”,第8章,从神经到大脑(From Neuron To Brain)(第三版),Nichols,J.G.等编,Sinauer Associates,Inc.(1992)。测定IP3积累的方法可被用来确定一个候选化合物是否是例如针对Gq-或Go-关联受体等的反激动剂(即如此的化合物能降低IP3的水平)。Gq关联受体也可用AP1报告基因测定方法来检测,因为Gq依赖的磷脂酶C引起含有AP1元件的基因活化;因而,活化的Gq关联受体将导致如此基因的表达增高,而其反激动剂将导致如此表达的降低,激动剂将导致如此表达的升高。进行如此测定的商业可得的方法是可得的。
3.GPCR融合蛋白
内源组成型活化的孤儿GPCR或非内源组成型活化的孤儿GPCR,用于筛选候选化合物,直接识别反激动剂、激动剂和部分激动剂,提出了一个有意思的筛选难题,确切地说,在没有内源配体结合的情况下,受体仍有活性。因此,为了区分候选化合物存在或不存在时的非内源受体,这种区分的目的是要了解这种化合物是否是所述受体的反激动剂、激动剂、部分激动剂或对该受体根本没有影响,最好的办法就是加强这种差异,使用GPCR融合蛋白就是这样一种方法。
一般来讲,应用上述分析技术(还有其它的技术)一旦确定非内源孤儿GPCR为组成型活化的,就可能确定与内源GPCR偶联的优势G蛋白,G蛋白与GPCR的偶联提供了可被估计的信号途径。因为最好是使用哺乳动物表达系统进行筛选,就希望在这个系统中有内源G蛋白存在,确切来说,非内源组成型活化的孤儿GPCR在这个系统中持续产生信号。从这点上,优选使信号得到加强,从而在(例如)受体的反激动剂存在时,很可能更方便地区分与反激动剂接触的不同受体,特别是在筛选的整个过程中。
GPCR融合蛋白的作用是增加G蛋白与非内源GPCR偶联的效应,GPCR融合蛋白优选用于筛选非内源组成型活化的GPCR,因为这种方法增强对这样的筛选技术非常有用的信号,重要的是有助于产生很大的“信噪”比,这种大信噪比对筛选此处公开的候选化合物是特别优选的。
用于GPCR融合蛋白表达的构建体的构建技术是本领域普通技术人员所熟悉,商业可获得的表达载体和系统为实验者提供了各种可以满足特殊需要的方法,这种GPCR融合蛋白构建体重要的衡量标准,就是内源GPCR序列与G蛋白序列都符合读框(最好是,内源GPCR的序列位于G蛋白序列上游),以及必须去除或替代GPCR的“终止”密码子,从而随着GPCR的表达,G蛋白也能表达。GPCR可以直接连到G蛋白上,或在两者之间存在间隔残基(最好不超过12个,虽然本领域的普通技术人员可以很方便得知这一数字)。我们喜欢使用间隔子(基于方便),表达中不被有效利用的限制位点组成了间隔子。在制造GPCR融合蛋白构建体之前,优选首先确认与非内源GPCR偶联的G蛋白,因为只有很少的G蛋白已被识别,所以优选包含G蛋白序列(如通用G蛋白构建体)的构建体可在其中插入内源GPCR序列,这样可有效地大规模筛选大量具有不同序列的内源GPCR。
如上所述,预计与Gi、Gz和Go偶联的组成型活化GPCR抑制cAMP的形成,这就需要人们找到基于这些类型GPCR的分析方法(如,cAMP信号随活化降低,这样使得直接识别(例如)反激动剂(进一步减弱这种信号)更加有趣,正如本文所公开的,我们已经证实,对于这些类型的受体,有可能制造不基于内源GPCR的内源G蛋白的GPCR融合蛋白,尽力建立可行的以环化酶为基础的分析方法。举例来说,内源Gi偶联受体可以与Gs蛋白融合-我们相信这样的融合构建体在表达时,“驱动”或“推动”内源GPCR与如Gs而不是“天然”的Gi蛋白偶联,从而能够建立以环化酶为基础的分析方法。对与Gi、Gz、Go偶联的受体,当使用GPCR融合蛋白并且分析是以腺苷酸环化酶活性测定为基础时,我们优选用Gs(或刺激腺苷酸环化酶形成的G蛋白类似物)来建立融合构建体。
Gq蛋白与Gs、Gi、Gz或Go蛋白融合的G蛋白融合构建体也同样有效。更优选的是Gq蛋白缺失G蛋白α亚单位(“Gαq”)的前六个氨基酸,并且Gαq的C末端后五个氨基酸被目的G蛋白α亚单位的相应氨基酸替代所获得的融合构建体。例如,融合构建体可能是Gq(缺失6个氨基酸)和Gi蛋白的融合,产生“Gq/Gi融合构建体”。我们相信该融合构建体可以推动内源Gi偶联受体与其非内源G蛋白-Gq偶联,从而可对第二信使(例如,三磷酸肌醇或二酰甘油)而非cAMP的产生进行检测。
4.与靶Gi偶联的GPCR和与信号增强子Gs偶联的GPCR共转染(基于cAMP的分析)
已知Gi偶联的受体抑制腺苷酸环化酶,并因此降低cAMP的产量,这导致难以评估cAMP的水平。检测作为在激活时主要偶联Gi的受体组成型活化指示的cAMP产量的降低可以通过偶联GPCR的Gi与一个信号增强子(如在激活时主要偶联Gs的非内源性组成型活化受体,如以下公布的TSHR-A623I)共转染得以实现。显然,Gs偶联受体的组成型活化可基于cAMP产量的增加而判定。Gi偶联受体的组成型活化导致cAMP的产量降低。因此,这种共转染的方法意在有效地利用这些“相对立”的效果。例如,Gs偶联的非内源组成型活化受体(“信号增强子”)和内源性Gi偶联受体(“靶受体”)共转染提供了基本的cAMP信号(即,尽管Gi偶联的受体降低cAMP的水平,但这种降低的效果与组成型活化的Gs偶联的信号增强子所导致cAMP的显著增加相关联)。从而,通过信号增强子与组成型活化的靶受体共转染,Gi靶的活性增加(即,降低cAMP水平),预计cAMP水平将进一步降低(相对于基本水平)。
然后,利用基于cAMP的分析对侯选化合物进行分析将成为可能,但有两个限制性条件:首先相对于Gi偶联的靶受体,可产生“相反”的效应,即,Gi偶联靶受体的反激动剂将增强被测定的cAMP信号,而Gi偶联靶受体的激动剂将降低该信号;第二,在以下也会表现,利用这种方法直接识别的侯选化合物应单独地评估,以确保其对信号增强性受体无靶向作用(这可在针对共转染受体进行筛选之前或以后进行)。
F.药物化学
在一般但并非经常的情况下对候选化合物直接识别与通过组合化学技术产生的化合物联合使用,其中随机制备几千种化合物用于此分析。如此筛选的结果一般将是具有独特中心结构的化合物;其后,这些化合物围绕着一个优选的中心结构而被优选进行额外的化学修饰,以进一步加强其药用性质。这样的技术在该领域中是已知的,并不需要在本专利文件中详细描述。
G.药物组合物
为进一步开发而选择出的候选化合物可应用本领域周知的技术制剂成药物组合物。适宜的药物可接受的载体在本领域中是可得的;例如,参见Remington’s Pharmaceuctical Sciences,第16版,1980,MackPublishing Co.(Oslo等编)。
H.其他应用
尽管公开的非内源人GPCR的一个优选的应用是为了直接识别作为反激动剂、激动剂或部分激动剂(优选地作为药物使用)的候选化合物,人GPCR的这些形式也可被用于研究之用。例如,带有GPCR的体外或体内系统可被用来阐释和理解这些受体在正常和患病的人体状况中的作用,也可理解当它应用于理解信号级联反应时组成型活化的角色。这些非内源的人GPCR的价值由于其独特的特点是它们作为研究工具的用途被强化,公开的受体可被用来理解这些受体在人体中的作用,即使在其内源配体被识别之前。公开的受体的其他应用对于本领域的技术人员将是明显的,特别是当他们阅读了本申请文件之后。
实施例
下面提供的实施例,目的是要阐明而不是限制本发明。特异的核酸序列和氨基酸序列在此公开时,本领域的普通技术人员能够对这些序列进行较小的修饰,并且得到与下面报告的相同或基本相似的结果。使用或了解一个又一个序列框(如从鼠的受体到人的受体或从人的受体A到人的受体B)的传统方式一般是基于序列对比技术,通过把序列排列对比来尽量确定共同的区域。此处公开的突变方法不依赖于这种方式,而是基于算法规则和与位于人GPCR TM6区中保守脯氨酸残基相隔的位置距离。一但这种方式可靠,相信本领域的普通技术人员能够进行较小修饰以便得到与此处公开的基本相同的结果(如:组成型活化)。认为这些修饰均在本公开的范围内。
实施例1
内源人GPCR
1人GPCR的识别
在浏览GenBankTM数据库信息的基础上,识别了一些已公开的内源人GPCR。在检索数据库的同时,下列cDNA克隆也得以识别,列表如下(表C)。
表C已公开的人孤儿GPCR 入藏 登记号 DNA全序列 (碱基对) 可读框 (碱基对) 核酸序列 SEQ.ID.NO.: 氨基酸序列 SEQ.ID.NO.
hRUP8 AL121755 147,566bp 1,152bp 1 2
hRUP9 AC0113375 143,181bp 1,260bp 3 4
hRUP10 AC008745 94,194bp 1,014bp 5 6
hRUP11 AC013396 155,086bp 1,272bp 7 8
hRUP12 AP000808 177,764bp 966bp 9 10
hRUP13 AC011780 167,819bp 1,356bp 11 12
hRUP14 AL137118 168,297bp 1,041bp 13 14
hRUP15 AL016468 138,828bp 1,527bp 15 16
hRUP16 AL136106 208,042bp 1,068bp 17 18
hRUP17 AC023078 161,735bp 969bp 19 20
hRUP18 AC008547 117,304bp 1,305bp 21 22
hRUP19 AC026331 145,183bp 1,041bp 23 24
hRUP20 AL161458 163,511bp 1,011bp 25 26
hRUP21 AC026756 156,534bp 1,014bp 27 28
hRUP22 AC027026 151,811bp 993bp 29 30
hRUP23 AC007104 200,000bp 1,092bp 31 32
hRUP24 AL355388 190,538bp 1,125bp 33 34
hRUP25 AC026331 145,183bp 1,092bp 35 36
hRUP26 AC023040 178,508bp 1,044bp 37 38
hRUP27 AC027643 158,700bp 1,020bp 39 40
2.全长克隆
a.hRUP8(Seq.Id.Nos.1&2)
公布的人RUP8通过使用EST数据库信息(dbEST)得以识别。在dbEST中搜索时发现一个入藏号为AL121755的cDNA克隆编码一个新的GPCR。以下的PCR引物用于以人睾丸Marathon-Ready cDNA(Clontech)为模板的RT-PCR克隆:
5’-CTTGCAGACATCACCATGGCAGCC-3’(SEQ.ID.NO.:41;正义)和
5’-GTGATGCTCTGAGTACTGGACTGG-3’(SEQ.ID.NO.:42;反义)
用Advantage cDNA多聚酶(Clontech;按商家说明进行操作)在50μl反应液中进行PCR,程序为:94℃ 30秒;94℃ 10秒;65℃ 20秒,72℃ 1.5分钟,72℃ 7分钟,从第二步到第四步循环35次。
分离出一个1.2kb的PCR片段,克隆到pCRII-TOPO(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)测序。见SEQ.ID.NO.:1,可能的RUP8氨基酸序列在SEQ.ID.NO.:2中表现。
b.hRUP9(Seq.Id.Nos.3&4)
公布的人RUP9基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC011375的cDNA克隆来自5号染色体的人基因组序列。该全长RUP9通过以下引物进行PCR克隆:
5’-GAAGCTGTGAAGAGTGATGC-3’(SEQ.ID.NO.:43;正义)和
5’-GTCAGCAATATTGATAAGCAGCAG-3’(SEQ.ID.NO.:44;反义),
并以人基因组DNA(Promega)作为模板。使用Taq Plus Precision多聚酶(Stratagene)在含有5%DMSO的100μl反应液中扩增。程序为:94℃ 1分钟;94℃ 30秒;56℃ 30秒;72℃ 2分钟;72℃ 5分钟,从第二步到第四步循环35次。
从1%的琼脂糖凝胶中分离1.3kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)完全测序。见SEQ.ID.NO.:3,可能的RUP8氨基酸序列在SEQ.ID.NO.:4中表现。从人基因组DNA分离的RUP9克隆的序列与从信息库中所获序列相符。
c.hRUP10(Seq.Id.Nos.5&6)
公布的人RUP10基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC008754的cDNA克隆为来自19号染色体的人基因组序列。该全长RUP10通过以下引物进行PCR克隆:
5’-CCATGGGGAACGATTCTGTCAGCTACG-3’(SEQ.ID.NO.:45;正义)和
5’-GCTATGCCTGAAGCCAGTCTTGTG-3’(SEQ.ID.NO.:46;反义),
并以人白细胞Marathon-Ready cDNA(Clontech)为模板。用Advantage cDNA多聚酶(Clontech)在50μl反应液中进行PCR。程序为:94℃ 30秒;94℃ 10秒;62℃ 20秒,72℃ 1.5分钟,72℃ 7分钟,从第二步到第四步循环35次。分离出1.0kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)测序。这种新的人受体RUP10的核酸序列在SEQ.ID.NO.:5中进行阐明,其可能的氨基酸序列见SEQ.ID.NO.:6。
d.hRUP11(Seq.Id.Nos.7&8)
公布的人RUP11基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC013396的cDNA克隆为来自2号染色体的人基因组序列。该全长RUP11克隆通过以下引物进行PCR克隆:
5’-CCAGGATGTTGTGTCACCGTGGTGGC-3’(SEQ.ID.NO.:47;正义)和
5’-CACAGCGCTGCAGCCCTGCAGCTGGC-3’(SEQ.ID.NO.:48;反义),
并以人基因组DNA(Clontech)为模板。使用TaqPlus Precision DNA多聚酶(Stratagene)在50μl反应液中扩增。程序为:94℃ 3分钟;94℃20秒;67℃ 20秒;72℃ 1.5分钟;72℃ 7分钟,从第二步到第四步循环35次。分离出1.3kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)测序。这种新的人受体RUP11的核酸序列在SEQ.ID.NO.:7中进行阐明,其可能的氨基酸序列见SEQ.ID.NO.:8。
e.hRUP12(Seq.Id.Nos.9&10)
公布的人RUP12基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AP000808的cDNA克隆编码一个新的GPCR,其具有与大鼠RTA和人mas1癌基因GPCR的显著同源性。该全长RUP12通过以下引物进行PCR克隆:
5’-CTTCCTCTCGTAGGGATGAACCAGAC-3’(SEQ.ID.NO.:49;正义)和
5’-CTCGCACAGGTGGGAAGCACCTGTGG-3’(SEQ.ID.NO.:50;反义),
并以人基因组cDNA(Clontech)为模板。使用TaqPlus PrecisionDNA多聚酶(Stratagene)扩增。程序为:94℃ 3分钟;94℃ 20秒;65℃ 20秒;72℃ 2分钟;72℃ 7分钟,从第二步到第四步循环35次。分离出1.0kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)完全测序(其核苷酸序列在SEQ.ID.NO.:9中进行阐明,其可能的氨基酸序列见SEQ.ID.NO.:10)。
f.hRUP13(Seq.Id.Nos.11&12)
公布的人RUP13基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC011780的cDNA克隆编码一个新的GPCR,其具有与GPCR鱼GPRX-ORYLA的显著同源性。该全长RUP13通过以下引物进行PCR克隆:
5’-GCCTGTGACAGGAGGTACCCTGG-3’(SEQ.ID.NO.:51;正义)和
5’-CATATCCCTCCGAGTGTCCAGCGGC-3’(SEQ.ID.NO.:52;反义),
并以人基因组cDNA(Clontech)为模板。使用TaqPlus PrecisionDNA多聚酶(Stratagene)扩增。程序为:94℃ 3分钟;94℃ 20秒;65℃ 20秒;72℃ 2分钟;72℃ 7分钟,从第二步到第四步循环35次。分离出1.35kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)完全测序(其核苷酸序列见SEQ.ID.NO.:11,可能的氨基酸序列见SEQ.ID.NO.:12)。
g.hRUP14(Seq.Id.Nos.13&14)
公布的人RUP14基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AL137118的cDNA克隆为来自第13号染色体的人基因组序列。该全长RUP14通过以下引物进行PCR克隆:
5’-GCATGGAGAGAAAATTTATGTCCTTGCAACC-3’(SEQ.ID.NO.:53;正义)和
5’-CAAGAACAGGTCTCATCTAAGAGCTCC-3’(SEQ.ID.NO.:54;反义),
并以人基因组DNA(Promega)为模板。使用TaqPlus Precision多聚酶(Stratagene)和5%DMSO扩增。程序为:94℃ 3分钟;94℃ 20秒;58℃ 2分钟;72℃ 10分钟,从第二步到第三步循环35次。
分离出1.1kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)测序。(其核苷酸序列见SEQ.ID.NO.:13,可能的氨基酸序列见SEQ.ID.NO.:14。)从人基因组DNA中分离的RUP14克隆序列与从信息库中获得的序列相符。
h.hRUP15(Seq.Id.Nos.15&16)
公布的人RUP15基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC016468的cDNA克隆为人基因组序列。该全长RUP15通过以下引物进行PCR克隆:
5’-GCTGTTGCCATGACGTCCACCTGCAC-3’(SEQ.ID.NO.:55;正义)和
5’-GGACAGTTCAAGGTTTGCCTTAGAAC-3’(SEQ.ID.NO.:56;反义),
并以人基因组DNA(Promega)为模板。使用TaqPlus Precision多聚酶(Stratagene)扩增。程序为:94℃ 3分钟;94℃ 20秒;65℃ 20秒;72℃ 2分钟;72℃ 7分钟,从第二步到第四步循环35次。
分离出1.5kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)完全测序。(其核苷酸序列见SEQ.ID.NO.:15,可能的氨基酸序列见SEQ.ID.NO.:16。)从人基因组DNA中分离的RUP15克隆序列与从信息库中获得的序列相符。
i.hRUP16(Seq.Id.Nos.17&18)
公布的人RUP16基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AL136106的cDNA克隆为来自第13号染色体的人基因组序列。该全长RUP16通过以下引物进行PCR克隆:
5’-CTTTCGATACTGCTCCTATGCTC-3’(SEQ.ID.NO.:57;正义,启始密码子的5’端)和
5’-GTAGTCCACTGAAAGTCCAGTGATCC-3’(SEQ.ID.NO.:58;反义,终止密码子的3’端),
并以人骨骼肌Marathon-Ready cDNA(Clontech)为模板。用Advantage cDNA多聚酶试剂盒在50μl反应液中进行PCR(Clontech)。程序为:94℃ 30秒;94℃ 5秒;69℃ 15秒;72℃ 1分钟;72℃ 5分钟,从第二步到第四步循环35次。
分离出1.1kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用T7测序酶试剂盒(Amsham)完全测序。(其核苷酸序列见SEQ.ID.NO.:17,可能的氨基酸序列见SEQ.ID.NO.:18)。RUP16克隆序列与AL136106的四个非顺序区段相符,表明RUP16的cDNA含有4个外显子。
j.hRUP17(Seq.Id.Nos.19&20)
公布的人RUP17基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC023078的cDNA克隆为来自第11号染色体的人基因组序列。该全长RUP17通过以下引物进行PCR克隆:
5’-TTTCTGAGCATGGATCCAACCATCTC-3’(SEQ.ID.NO.:59;正义,含启始密码子)和
5’-CTGTCTGACAGGGCAGAGGCTCTTC-3’(SEQ.ID.NO.:60;反义链,终止密码子的3’端),
并以人基因组DNA(Promega)为模板。用Advantage cDNA多聚酶混合物与5%DMSO在100μl反应液中进行PCR(Clontech)。程序为:94℃ 1分钟;94℃ 15秒;67℃ 20秒;72℃ 1分钟又30秒;72℃ 5分钟,从第二步到第四步循环30次。
从1%琼脂糖凝胶中分离出970bp的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Termiantor试剂盒(P.E.Biosystem)测序。(其核苷酸序列见SEQ.ID.NO.:19,可能的氨基酸序列见SEQ.ID.NO.:20)。
k.hRUP18(Seq.Id.Nos.21&22)
公布的人RUP18基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC008547的cDNA克隆为来自第5号染色体的人基因组序列。该全长RUP18通过以下引物进行PCR克隆:
5’-GGAACTCGTATAGACCCAGCGTCGCTCC-3’(SEQ.ID.NO.:61;正义,启始密码子的5’端)和
5’-GGAGGTTGCGCCTTAGCGACAGATGACC-3’(SEQ.ID.NO.:62;反义,终止密码子的3’端),
并以人基因组DNA(Promega)为模板。用TaqPlus精确DNA多聚酶(Stratagene)与5%DMSO在100μl反应液中进行PCR(Clontech)。程序为:95℃ 5分钟;95℃ 30秒;65℃ 30秒;72℃ 2分钟;72℃ 5分钟,从第二步到第四步循环35次。
从1%琼脂糖凝胶中分离出1.3kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Termiantor试剂盒(P.E.Biosystem)测序。(其核苷酸序列见SEQ.ID.NO.:21,可能的氨基酸序列见SEQ.ID.NO.:22)。
1.hRUP19(Seq.Id.Nos.23&24)
公布的人RUP19基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC026331的cDNA克隆为来自第12号染色体的人基因组序列。该全长RUP19通过以下引物进行PCR克隆:
5’-CTGCACCCGGACACTTGCTCTG-3’(SEQ.ID.NO.:63;正义,启始密码子的5’端)和
5’-GTCTGCTTGTTCAGTGCCACTCAAC-3’(SEQ.ID.NO.:64;反义,含终止密码子),
并以人基因组DNA(Promega)为模板。用TaqPlus Precision DNA多聚酶(Stratagene)与5%DMSO在100μl反应液中进行扩增。程序为:94℃ 1分钟;94℃ 15秒;70℃ 20秒;72℃ 1分钟30秒;72℃ 5分钟,从第二步到第四步循环35次。
从1%琼脂糖凝胶中分离出1.1kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Termiantor试剂盒(P.E.Biosystem)完全测序。其核苷酸序列见SEQ.ID.NO.:23,可能的氨基酸序列见SEQ.ID.NO.:24)。
m.hRUP20(Seq.Id.Nos.25&26)
公布的人RUP20基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AL161458的cDNA克隆为来自第1号染色体的人基因组序列。该全长RUP20通过以下引物进行PCR:
5’-TATCTGCAATTCTATTCTAGCTCCTG-3’(SEQ.ID.NO.:65;正义,启始密码子5’端)和
5’-TGTCCCTAATAAAGTCACATGAATGC-3’(SEQ.ID.NO.:66;反义,终止密码子3’端),
并以人基因组DNA(Promega)为模板。用Advantage cDNA多聚酶混合物(Clonetech)与5%DMSO进行扩增。程序为:94℃ 1分钟;94℃ 15秒;60℃ 20秒;72℃ 1分钟30秒;72℃ 5分钟,从第二步到第四步循环35次。
从1%琼脂糖凝胶中分离出1.0kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Termiantor试剂盒(P.E.Biosystem)测序。(其核苷酸序列见SEQ.ID.NO.:25,可能的氨基酸序列见SEQ.ID.NO.:26)。
n.hRUP21(Seq.Id.Nos.27&28)
公布的人RUP21基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC026756的cDNA克隆为来自第13号染色体的人基因组序列。该全长RUP21通过以下引物进行PCR克隆:
5’-GGAGACAACCATGAATGAGCCAC-3’(SEQ.ID.NO.:67;正义)和
5’-TATTTCAAGGGTTGTTTGAGTAAC-3’(SEQ.ID.NO.:68;反义链),
并以人基因组DNA(Promega)为模板。用TaqPlus Precision多聚酶(Stratagene)与5%DMSO在100μl反应液中进行扩增。程序为:94℃1分钟;94℃ 15秒;55℃ 20秒;72℃ 1分钟30秒;72℃ 5分钟,从第二步到第四步循环30次。
从1%琼脂糖凝胶中分离出1014bp的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Termiantor试剂盒(P.E.Biosystem)测序。(其核苷酸序列见SEQ.ID.NO.:27,可能的氨基酸序列见SEQ.ID.NO.:28)。
o.hRUP22(Seq.Id.Nos.29&30)
公布的人RUP22基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC027026的cDNA克隆为来自第11号染色体的人基因组序列。该全长RUP22通过以下引物进行PCR克隆:
5’-GGCACCAGTGGAGGTTTTCTGAGCATG-3’(SEQ.ID.NO.:69;正义,含启始密码子)和
5’-CTGATGGAAGTAGAGGCTGTCCATCTC-3’(SEQ.ID.NO.:70;反义,终止密码子3’端),
并以人基因组DNA(Promega)为模板。用TaqPlus Precision DNA多聚酶(Stratagene)与5%DMSO在100μl反应液中进行扩增。程序为:94℃ 1分钟;94℃ 15秒;55℃ 20秒;72℃ 1分钟30秒;72℃ 5分钟,从第二步到第四步循环30次。
从1%琼脂糖凝胶中分离出970bp的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Termiantor试剂盒(P.E.Biosystem)完全测序。(其核苷酸序列见SEQ.ID.NO.29,可能的氨基酸序列见SEQ.ID.NO.30)。
p.hRUP23(Seq.Id.Nos.31&32)
公布的人RUP23基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC007104的cDNA克隆为来自第4号染色体的人基因组序列。该全长RUP23通过以下引物进行PCR:
5’-CCTGGCGAGCCGCTAGCGCCATG-3’(SEQ.ID.NO.71;正义,ATG为启始密码子)和
5’-ATGAGCCCTGCCAGGCCCTCAGT-3’(SEQ.ID.NO.72;反义,TCA为终止密码子),
并以人胎盘Marathon-Ready cDNA(Clontech)为模板。用Advantage cDNA多聚酶(Clontech)在50μl反应液中进行扩增。程序为:95℃ 30秒;95℃ 15秒;66℃ 20秒;72℃ 1分钟20秒;72℃ 5分钟,从第二步到第四步循环35次。
从1%琼脂糖凝胶中分离出1.0kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)完全测序。(其核苷酸序列见SEQ.ID.NO.31,可能的氨基酸序列见SEQ.ID.NO.32)。
q.HRUP24(Seq.Id.Nos.33&34)
公布的人RUP25基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC026331的cDNA克隆为来自第12号染色体的人基因组序列。该全长RUP25通过以下引物进行PCR克隆:
5’-GCTGGAGCATTCACTAGGCGAG-3’(SEQ.ID.NO.73;正义,启始密码子5’端)和
5’-AGATCCTGGTTCTTGGTGACAATG-3’(SEQ.ID.NO.74;反义,终止密码子3’端),
并以人基因组DNA(Promega)为模板。用Advantage cDNA多聚酶混合物(Clontech)与5%DMSO在100μl反应液中进行PCR。程序为:94℃ 1分钟;94℃ 15秒;56℃ 20秒;72℃ 1分钟30秒;72℃5分钟,从第二步到第四步循环35次。
从1%琼脂糖凝胶中分离出1.2kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)完全测序。(其核苷酸序列见SEQ.ID.NO.33,可能的氨基酸序列见SEQ.ID.NO.34)。
r.hRUP25(Seq.Id.Nos.35&36)
公布的人RUP25基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC026331的cDNA克隆为来自第12号染色体的人基因组序列。该全长RUP25通过以下引物进行PCR克隆:
5’-GCTGGAGCATTCACTAGGCGAG-3’(SEQ.ID.NO.75;正义,启始密码子5’端)和
5’-AGATCCTGGTTCTTGGTGACAATG-3’(SEQ.ID.NO.76;反义,终止密码子3’端),
并以人基因组DNA(Promega)为模板。用Advantage cDNA多聚酶混合物(Clontech)与5%DMSO进行扩增,程序为:94℃ 1分钟;94℃ 15秒;56℃ 20秒;72℃ 1分钟30秒;72℃ 5分钟,从第二步到第四步循环35次。
从1%琼脂糖凝胶中分离出1.2kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)完全测序。(其核苷酸序列见SEQ.ID.NO.35,可能的氨基酸序列见SEQ.ID.NO.36)。
s.hRUP 26(Seq.Id.Nos.37&38)
公布的人RUP26基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC023040的cDNA克隆为来自第2号染色体的人基因组序列。该全长RUP26通过RUP26特异性引物进行RT-PCR克隆:
5’-AGCCATCCCTGCCAGGAAGCATGG-3’(SEQ.ID.NO.77;正义,含启始密码子)和
5’-CCAGACTGTGGACTCAAGAACTCTAGG-3’(SEQ.ID.NO.78;反义,含终止密码子),
并以人胰脏Marathon-Ready cDNA(Clontech)为模板。用Advantage cDNA多聚酶混合物(Clontech)与5%DMSO在100μl反应液中进行PCR(Clontech)。程序为:94℃ 5分钟;95℃ 30秒;65℃ 30秒;72℃ 2分钟;72℃ 5分钟,从第二步到第四步循环35次。
从1%琼脂糖凝胶中分离出1.1kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Termiantor试剂盒(P.E.Biosystem)完全测序。(其核苷酸序列见SEQ.ID.NO.37,可能的氨基酸序列见SEQ.ID.NO.38)。
t.hRUP27(Seq.Id.Nos.39&40)
公布的人RUP27基于GenBank的信息得以识别。搜索数据库中发现一个入藏号为AC027643的cDNA克隆为来自第12号染色体的人基因组序列。该全长RUP27用RUP27特异性引物进行PCR克隆:
5’-AGTCCACGAACAATGAATCCATTTCATG-3’(SEQ.ID.NO.79;正义,含启始密码子)和
5’-ATCATGTCTAGACTCATGGTGATCC-3’(SEQ.ID.NO.80;反义,终止密码子3’端),
并以成人脑Marathon-Ready cDNA(Clontech)为模板。用Advantage cDNA多聚酶混合物(Clontech)与5%DMSO在50μl反应液中进行PCR。程序为:94℃ 1分钟;94℃ 10秒;58℃ 20秒;72℃ 1分钟30秒;72℃ 5分钟,从第二步到第四步循环35次。
从1%琼脂糖凝胶中分离出1.1kb的PCR片段,克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Termiantor试剂盒(P.E.Biosystem)完全测序。(其核苷酸序列见SEQ.ID.NO.35,可能的氨基酸序列见SEQ.ID.NO.36)。从人脑中分离的RUP27的cDNA克隆序列被判定与AC027643的五个非顺序区段相符,表明RUP27的cDNA含有5个外显子。
实施例2
制备非内源组成型活化的GPCR
相信本领域的普通技术人员有能力选择用于核酸序列突变的技术,下面提供的就是用于制造以上所公开的几种人GPCR非内源形式的方法。下面公开的突变是基于算法规则方法,由此第16位氨基酸(位于GPCR的IC3区域)由保守的脯氨酸(或其内源保守替代物)残基(位于GPCR的TM6区域,接近TM6/IC3交界处)发生突变,更优选突变为丙氨酸、组氨酸、精氨酸或赖氨酸残基,最优选突变为赖氨酸残基。
1.Transformer Sited-DirectedTM诱变
利用Transformer Sited-DirectedTM诱变试剂盒按商家说明,由人GPCR制备非内源人GPCR可得以实现。使用两个诱变引物,首先优选的是产生赖氨酸突变的赖氨酸诱变寡核苷酸,及一个选择标记寡核苷酸。出于方便的原因,掺入人GPCR中的密码子突变用标准方式标示出来(表D):
表D 受体名称 密码子突变
hRUP8 V274K
hRUP9 T249K
hRUP10 R232K
hRUP11 M294K
hRUP12 F220K
hRUP16 A238K
hRUP17 Y215K
hRUP18 L294K
hRUP19 T219K
hRUP20 K248A K248H K248R
hRUP21 R240K
hRUP22 Y222K
hRUP24 A245K
hRUP25 I230K
hRUP26 V285K
hRUP27 T248K
2.QuikChangeTM Site-DirectedTM诱变
利用QuikChangeTM Sited-DirectedTM诱变试剂盒(Stratagene,按商家说明),制备非内源人GPCR可得以实现。优选以内源GPCR为模板并使用两个诱变引物,同样优选的是赖氨酸诱变寡核苷酸及一个选择标记寡核苷酸(试剂盒中自带)。出于方便的原因,掺入新的人GPCR中的密码子突变及个别的寡核苷酸用标准方式标示出来(表E):
表E受体名称密码子突变5′-3′方向(有义),(SEQ.ID.NO.)突变序列下划线5′-3′方向(反义)(SEQ.ID.NO.) 循环条件,(分’ 秒”)从2-4步 循环16次
hRUP13A268KGGGGAGGGAAAGCAAAGGTGGTCCTCCTGG(81)CCAGGAGAACCACCTTTGCTTTCCCTCCCC(82) 98°2’ 98°30” 56℃ 30” 72°11’40” 72°5’
hRUP14L246KCAGGAAGGCAAAGACCACCATCATCATC(85)GATGATGATGGTGGTCTTTGCCTTCCTG(86) 98°2’ 98°30” 55℃ 30” 72°11’40” 72°5’
hRUP15A398KCCAGTGCAAAGCTAAGAAAGTGATCTTC(89)GAAGATCACTTTCTTAGCTTTGCACTGG(90) 98°2’ 98°30” 55℃ 30” 72°11’40” 72°5’
hRUP23W275KGCCGCCACCGCGCCAAGAGGAAGATTGGC(93)GCCAATCTTCCTCTTGGCGCGGTGGCGGC(94) 98°2’ 98°30” 56℃ 30” 72°11’40” 72°5’
然后对非内源人GPCR测序,将获得并证实的核酸和氨基酸序列列入本专利申请文件所附的“序列表”中,并以下面的表F作为概括。
表F 非内源人GPCR 核酸序列表 氨基酸序列表
hRUP13 SEQ.ID.NO.:83 SEQ.ID.NO.:84
hRUP14 SEQ.ID.NO.:87 SEQ.ID.NO.:88
hRUP15 SEQ.ID.NO.:91 SEQ.ID.NO.:92
hRUP23 SEQ.ID.NO.:95 SEQ.ID.NO.:96
实施例3
受体表达
尽管在本领域中有多种细胞可用于蛋白质的表达,但最优选应用的是哺乳动物细胞。据预测,其基本原因是实用性,即例如表达GPCR的酵母细胞的应用,有可能把一种非哺乳动物细胞引入到程序中,此细胞可能不(其实,对于酵母来说,是不)包括偶联受体、遗传机制和分泌途径,而这些是经过进化用于哺乳动物系统的。因此,在非哺乳动物细胞中得到的结果,尽管是可能有用的,但并不如从哺乳动物细胞中得到的结果优选。在哺乳动物细胞中,COS-7、293和293T细胞是特别优选的,尽管应用的特定哺乳动物细胞可按技术人员的特别需要而被判定。
a.瞬时转染
第一天,将6×106个293细胞接种到10cm的培养板上。第二天,准备两支试管(比例是每板用于一支试管):通过混合4μg DNA(例如pCMV载体、带有受体cDNA的pCMV载体等)在0.5ml无血清的DMEM(Gibco BRL)中来制备试管A;通过混合24μl lipofectamine(Gibco BRL)在0.5ml无血清DMEM中制备试管B。把试管A和B互倾混合(几次),然后在室温下温育30-45分钟。组合物被称为“转染组合物”。植出的293T细胞用1XPBS洗涤,然后加入5ml无血清的DMEM。把1ml转染组合物加入到细胞中去,然后在37℃/5%CO2下温育4小时。接着通过抽吸移去转染组合物,然后加入10ml的DMEM/10%胎牛血清。接着细胞在37℃/5%CO2温育。48小时后收获细胞并用来进行分析。
b.稳定的细胞系:Gs融合蛋白
将约12×106个293细胞接种到15cm的组织培养平板上。在含有10%胎牛血清和1%丙酮酸钠,L-谷氨酰胺,抗生素的DME高葡萄糖培养基中生长。293细胞铺板后24小时其汇合水平达到~80%,细胞用12μgDNA进行转染。该12μgDNA与60μl lipofectamine和2ml无血清的DME高葡萄糖培养基混合。从培养平板中吸去培养基,用无血清培养基润洗细胞一次。DNA,lipofectamine和培养基的混合物与10ml无血清培养基一同加入平板。37℃培养4-5小时后,吸去培养基,加入25ml含血清的培养基。转染24小时后,又一次吸去培养基,加入新鲜的含血清培养基。转染48小时后,吸去培养基,加入含遗传霉素(G418药物,终浓度为500μg/ml)的培养基。含有G418抗性基因的阳性转染细胞在这时受到选择。选择时每4到5小时替换一次培养基。选择过程中,细胞生长并产生稳定的细胞组,或细胞分裂进行稳定的克隆选择。
实施例4
确定非内源GPCR组成型活性的分析
多种方法可用来评估非内源人GPCR的组成型活性,下面的举例是说明性的;本领域的普通技术人员有能力决定那些对他们所需最有益的技术。
1.细胞膜结合分析:[35S]GTPγS分析
当G蛋白偶联受体在其活性状态,并作为配体结合或者作为组成型活化的结果时,受体与G蛋白偶联并刺激GDP的释放和其后GTP与G蛋白的结合。G蛋白-受体复合物的α亚基作为GTP酶并慢慢地水解GTP为GDP,在此点受体通常发生失活。组成型活化受体继续把GDP转化为GTP。不可水解的GTP类似物[35S]GTPγS,可被用来展示[35S]GTPγS与表达组成型活化受体的膜的增强的结合。应用[35S]GTPγS结合测定组成型活化的优点是:(a)它对所有G蛋白偶联受体是普遍适用的;(b)它邻近细胞膜表面,在此处较少可能拣到遇到影响细胞内级联反应的分子。
此试验利用G蛋白偶联受体的刺激[35S]GTPγS与表达相关受体的细胞膜结合的能力。因此本测定可用于直接识别法去筛选针对已知、孤儿和组成型活化G蛋白偶联受体的候选化合物。本测定是普遍的并可用于针对所有G蛋白偶联受体的药物发现。
[35S]GTPγS试验:在20mM HEPES、1至大约20mM的MgCl2(尽管20mM是优选的,但这个剂量可针对结果的最优化进行调整)、pH7.4、含有在0.3和1.2nM之间的[35S]GTPγS(尽管1.2是优选的,但这个剂量可针对结果的最优进行调整)、12.5到75μg膜蛋白(例如,表达Gs融合蛋白的293细胞;本剂量可为最优化进行调整)和10μM GDP(这个剂量可针对结果的最优化进行改造)的结合缓冲液中温育一小时。接着加入麦胚凝集素小珠(25μl,Amersham),组合物在室温下再温育30分钟,然后试管在1500×g、室温下离心5分钟,并在闪烁计数器上记数。
2.腺苷酸环化酶
设计用来进行基于细胞的测定的Flash PlateTM腺苷酸环化酶试剂盒(New England Nuclear;目录号SMP004A)被改进以应用于未加工的质膜。闪烁板的孔含有闪烁剂包被层,其中含有识别cAMP的特异抗体。在孔中产生的cAMP可通过直接和放射性cAMP示踪物竞争与cAMP抗体结合而被定量。下面是对测量表达受体的整个细胞中cAMP水平变化程序的简短描述。
在瞬时转染后大约24小时收获转染的细胞。小心抽吸培养液并弃去。向各细胞培养皿中轻缓加入10ml PBS,然后小心地抽吸。每板加入1ml Sigma细胞解离缓冲液和3ml PBS。将细胞从平板中吸出,将收获的细胞悬液加入50毫升的锥型离心管,然后在室温1100rpm离心5分钟。以适当量的PBS小心地重悬细胞沉淀(每板约3ml)。细胞用血细胞计数器计数,并用额外的PBS调整到适当的细胞数量(最终的体积约为每孔50μl)。
按照制造商的指令制备和维持cAMP标准品和检测缓冲液(含有1μCi示踪物[125I cAMP(50μl)]的11ml检测缓冲液)。为筛选用的分析缓冲液被新鲜制备,它含有50μl刺激缓冲液,3μl的实验化合物(终浓度为12mM)和50μl的细胞;分析缓冲液可在冰上贮存备用。首先向合适的孔中加入50μl的cAMP标准品、接着加入50μl PBSA到孔H-11和H-12。在所有的孔内加入50μl刺激缓冲液,使用可分散3μl化合物落液的针形工具将DMSO(或选定的侯选化合物)加入适当的孔中,实验化合物的终浓度为12mM,实验总体积为100μl。然后将细胞加入孔中,室温培养60分钟,然后加入100μl含示踪cAMP的检测混合物。培养板接着再温育2小时,然后用Wallac MicroBeta液闪计数器记数。cAMP/孔的数值从标准cAMP曲线外推,该曲线包括在每个测定板之内。
3.Gi偶联靶GPCR的基于细胞的cAMP分析
TSHR是一种Gs偶联的GPCR,当活化时引起cAMP的累积。将氨基酸残基623突变(即,将丙氨酸残基变为异亮氨酸残基)可使TSHR组成型活化。预期Gi偶联受体抑制腺苷酸环化酶,并因此降低cAMP的水平,从而使cAMP水平的评估有难度。检测作为组成型活化Gi偶联受体指示的cAMP产量的降低,一种有效手段是通过共转染来实现的,更优选的,是通过以非内源的组成型活化TSHR(TSHR-A623I)(或一个内源组成型活化的Gs偶联受体)为“信号增强子”,和Gi偶联的靶GPCR共转染,确立cAMP的基准水平。在产生非内源性Gi偶联受体后,非内源的靶GPCR与信号增强子共转染,并用做筛选的材料。在使用cAMP分析时,我们将利用这一方法有效地产生信号;该方法优选地用于针对Gi偶联受体的侯选化合物的直接识别。要注意的是,对于Gi偶联GPCR,使用该方法时,该靶GPCR的反激动剂会增加cAMP信号而激动剂会降低cAMP信号。
第一天,293和293细胞以每孔2×104个细胞的密度植于板上。第二天,准备两支试管(比例是每板用于一支试管):通过混合总共4μgDNA的各受体DNA 2μg(例如pCMV载体;带有突变THSR的pCMV载体(TSHR-A623I);TSHR-A623和GPCR等)在1.2ml无血清的DMEM(Irvine Scientific,Irvine,CA)中来制备试管A;通过混合120μllipofectamine(Gibco BRL)在1.2ml无血清DMEM中制备试管B。把试管A和B互倾混合(几次),然后在室温下温育30-45分钟。组合物被称为“转染组合物”。植出的293细胞用1XPBS洗涤,然后加入10ml无血清的DMEM。把2.4ml转染组合物加入到细胞中去,然后在37℃/5%CO2下温育4小时。接着通过抽吸移去转染组合物,然后加入25ml的DMEM/10%胎牛血清。接着细胞在37℃/5%CO2温育。24小时后收获细胞并用来进行分析。
设计用来基于细胞进行测定的Flash PlateTM腺苷酸环化酶试剂盒(New England Nuclear;目录号SMP004A),可根据本领域熟练技术人员的需要,被改进以应用于未加工的质膜。闪烁板的孔含有闪烁剂包被层,其中含有识别cAMP的特异抗体。在孔中产生的cAMP通过直接和放射性cAMP示踪物竞争与cAMP抗体结合而被定量。下面是对测量在表达受体的全细胞中cAMP水平变化程序的简短描述。
在瞬时转染后大约24小时,收获转染的细胞。小心抽吸培养液并弃去。向每一细胞培养皿中轻缓加入10ml PBS。每板加入1ml Sigma细胞解离缓冲液和3ml PBS。将细胞从平板中吸出,将收获的细胞悬液加入50毫升的锥型离心管,然后在室温1100rpm离心5分钟。以适当量的PBS小心地重悬细胞沉淀(每板约3ml)。用血细胞计数器计数,并用额外的PBS调整到适当的细胞数量(最终的体积约为每孔50μl)。
按照制造商的指令制备和维持cAMP标准品和检测缓冲液(含有1μCi示踪物[125I cAMP(50μl)]的11ml检测缓冲液)。为筛选用的分析缓冲液被新鲜制备,它含有50μl刺激缓冲液,3μl的实验化合物(终浓度为12mM)和50μl的细胞;分析缓冲液可在冰上贮存备用。首先向适当的孔中加入50μl的cAMP标准品、接着加入50μl PBSA到孔H-11和H-12。在所有的孔内加入50μl刺激缓冲液,使用可分散3μl混合液的针具将选定的化合物(如TSH)加入适当的孔中,实验化合物的终浓度为12μM,实验总体积为100μl。然后将细胞加入孔中,室温培养60分钟,然后加入100μl含示踪cAMP的检测混合物。培养板接着再温育2小时,然后用Wallac MicroBeta液闪计数器记数。cAMP/孔的数值从标准cAMP曲线外推,该曲线包括在每个测定板之内。
4.基于报告基因的测定
a.CRE-Luc报告基因测定(Gs相关的受体)
293和293T细胞以每孔2×104个细胞的密度植于96孔板上,第二天按商家说明用Lipofectamine试剂(BRL)进行转染,每6孔转染制备DNA/脂质混合物如下:100μl DMEM中的260ng质粒DNA温和地与100μl DMEM中的2μl脂质混和(260ng质粒DNA由以下组成,200ng8×CRE-Luc报告质粒,50ng包含内源受体或非内源受体的pCMV,或单独的pCMV,以及10ng GPRS表达质粒(GPRS在pcDNA3(Invitrogen)中))。8×CRE-Luc报告质粒的制备如下:在pβgal-基本载体(Clontech)的BglV-HindIII位点克隆鼠促生长素抑制素的启动子(-71/+51),获得SRIF-β-gal载体,8拷贝的cAMP应答元件通过PCR由腺病毒模板AdpCF126CCRE8获得(参见,7人基因疗法(Human GeneTherapy)1883(1996)),将之克隆到SRIF-β-gal载体的Kpn-BglV位点中,产生8×CRE-β-gal报告载体,用荧光素酶基因取代8×CRE-β-gal报告载体中的β-半乳糖苷酶基因,产生8×CRE-Luc报告质粒,所述荧光素酶基因取自pGL3-基本载体(Promega)的HindIII-BamHI位点。室温下放置30分钟后,DNA/脂质混合物用400μl DMEM稀释,每孔加入100μl稀释的混合物,在细胞培养箱中培养4小时后每孔中加入100μl含10%FCS的DMEM。第二天,转染的细胞每孔换成200μl含10%FCS的DMEM,8小时后,用PBS清洗一次,各样品孔改为100μl不含酚红的DMEM。次日按商家说明用LucLiteTM报告基因分析试剂盒(Packard)测定荧光素酶活性并在1450 MicroBetaTM闪烁发光计数器(Wallac)上读数。
b.AP1报告基因分析(Gq相关受体)
测定Gq刺激依赖的方法依赖于Gq依赖的磷脂酶C已知的特性,即它可引起在其启动子含有AP1元件的基因活化。按照上述CREB报告基因测定所说的程序,使用PathdetectTM AP-1 cis-Reporting System(Stratagene,Catalogue#219073),其中只是将磷酸钙沉淀的组分改为410ng pAP1-Luc、80ng pCMV-受体表达质粒和20ng CMV-SEAP。
c.SRF-Luc报告基因分析(Gq相关受体)
检测Gq刺激的一个方法凭借Gq依赖性磷脂酶C的已知特性,引起启动子中包含血清应答因子的基因活化。PathdetectTM SRF-Luc报告系统(Stratagene)可用来分析Gq偶联的活性,比如在COS7细胞中分析Gq偶联的活性。应用Mammalian TransfectionTM试剂盒(Stratagene,Catalogue#200285),用该系统中各种质粒及标明的编码内源或非内源GPCR的表达质粒,按商家说明转染细胞。简单地讲,410ng SRF-Luc、80ng pCMV受体表达质粒和20ng CMV-SEAP(分泌碱性磷酸酶的表达质粒;测定转染细胞培养基中碱性磷酸酶活性以控制样品间转染效率的差别),依各个商家的说明与磷酸钙沉淀组合在一起,一半的沉淀物等量地分配到96孔板的3个孔中,使细胞在无血清培养基中保持24小时。按要求,在最后5个小时细胞与1μM血管紧张素一起培养,然后溶解细胞,使用LucLiteTM试剂盒(Packard,cat#6016911)和“Trilax1450 Microbeta”液体闪烁发光计数器(Wallac),按各个商家的说明分析荧光素酶活性,数据用GraphPad PrismTM 2.0a软件分析(GraphPadSoftware Inc.)。
d.胞内IP3积累分析(Gq相关受体)
在第一天,含有该受体(内源的和/或非内源的)的细胞被接种于24孔培养板上,一般是1×105细胞/孔(虽然该数还可优化)。在第二天转染细胞,首先混合在50μl/孔无血清DMEM中的0.25μg DNA和在50μl/孔无血清DMEM中的2μl lipofectamine。轻轻地混合溶液并在室温下温育15-30分钟。用0.5ml PBS洗涤细胞,把400μl无血清培养基与转染培养基混合并加到细胞中。然后在37℃/5%CO2下温育细胞3-4小时,再移去转染培养基,替换为1ml/孔常规培养基。在第三天,用3H-肌醇标记细胞。简短地说,移去培养基,细胞用0.5ml PBS洗涤,接着加入0.5ml/孔无肌醇/无血清培养基(GIBCO BRL)和0.25μCi/孔3H-肌醇,在37℃/5%CO2下温育细胞16-18小时。在第四天,用0.5ml PBS洗涤细胞,加入0.45ml试验培养基,其中含有无肌醇/无血清培养基10μM巴吉林10mM氯化锂或0.4ml试验培养基和50μl 10×ketaserin(ket)以得到10μM的终浓度。然后在37℃温育细胞30分钟。用0.5ml PBS洗涤细胞,加入200μl/孔新鲜的/冰冷的终止液(1M KOH、18mM硼酸钠、3.8mM EDTA)。溶液在冰上放置5-10分钟或直到细胞被溶解,然后用200μl新鲜的/冰冷的中和液(7.5%HCl)中和。然后把裂解物转移到1.5ml离心管中,加入1ml/管氯仿/甲醇(1∶2)。然后使溶液涡旋15秒钟,把上层上样至Biorad AG1-X8TM阴离子交换树脂(100-200目)。首先,树脂以1∶1.25 W/V的比例用水洗涤,向柱中加载0.9ml的上层溶液。用10ml 5mM肌醇和10ml 5mM的硼酸钠/60mM甲酸钠洗涤柱子。肌醇三磷酸酯被洗提入液闪管中,其中含有10ml液闪鸡尾,它有2ml0.1M甲酸/1M甲酸铵。通过用10ml 0.1M甲酸/3M甲酸铵洗涤和用ddH2O洗涤两次来再生交换柱,柱子贮存在4℃的水中。
典型的结果列入下面表G:
表G
N/A=未应用
如以上实施例4(1)所示,GTPγS检测组成型活化分析的典型结果是利用人RUP13和人RUP15上的Gs:融合蛋白构建体得以实现的。以下表H中列出了该分析所产生的信号以及信号间的差异:
表H
实施例5
融合蛋白的制备
a.GPCR:Gs融合构建体
组成型活化的GPCR-G蛋白融合构建体的设计如下完成:建造大鼠G蛋Gsα(长式;ltoch,H.等,83 PNAS 3776(1986))的5′和3′端,使之包括HindIII(5′-AAGCTT-3′)序列。正确的序列(包括HindIII的侧翼序列)确认之后,通过利用该载体的HindIII限制性位点进行亚克隆,将完整的序列插入pcDNA3.1(-)(Invitrogen,cat.no.V795-20)。亚克隆进入pcDNA3.1(-)之后,确认Gsα序列的正确方向,然后证实在HindIII序列上带有大鼠Gsα基因的该经修饰的pcDNA3.1(-),该载体现在可用作“通用的”Gsα蛋白载体。pcDNA3.1(-)载在HindIII位点的上游含有一系列已知的限制性位点,这样能够有利地在Gs蛋白上游插入内源组成型活化GPCR的编码序列。可以应用同样的方法创造其他“通用的”G蛋白载体,当然,可以应用其他可买到的或本领域技术人员已知的载体----重要的标准是GPCR序列处G蛋白序列的上游并与G蛋白序列符合读框。
RUP13经Gs偶联,对于下列典型的GPCR融合蛋白,实现了与Gsα的融合。
RUP13-Gsα融合蛋白构建体的制备如下:
引物设计如下:
5′-gatc[TCTAGAAT]GGAGTCCTCACCCATCCCCCAG-3′(SEQ.ID.NO.:97;有义)
5′-gcta[GATATC]CGTGACTCCAGCCGGGGTGAGGCGGC-3′(SEQ.ID.NO.:98,反义)
小写的核苷酸作为间隔子包含在G蛋白与RUP13间的限制性位点(方括号)中,有义和反义引物分别包含了XbaI和EcoRV限制性位点,间隔子(对限制性位点有贡献)存在于该G蛋白和RUP15之间。
然后应用PCR得到各个受体序列,用于上面公开的Gsα通用载体中的融合,各PCR使用以下程序:100ng RUP15 cDNA加到不同的管中,其中各管含有每个引物(有义和反义)2μl,3μl 10mM dNTP,10μl10×TaqPlusTM精确缓冲液,1μl TaqPlusTM精确聚合酶(Stratagene:#600211),及80μl水。用于RUP15的反应温度和循环时间如下:在94℃下进行1分钟,然后进行94℃ 30秒;62℃ 20秒;72℃ 1分钟40秒; 72℃下进行5分钟,从第2步到第4步循环35次。PCR产物走1%琼脂糖凝胶,然后纯化(数据未显示),纯化产物用XbaI的EcoRV酶切,所需的插入片段经纯化连接到Gs通用载体中各自的限制性位点。转化后分离阳性克隆并用限制性酶酶切确认;用293细胞按下述程序实现表达,对RUP15-Gs融合蛋白的每个阳性克隆进行测序以证实正确性。(核酸序列见SEQ.ID.NO.:99,氨基酸序列见SEQ.ID.NO.:100)。
RUP15经Gs偶联,对于下列典型的GPCR融合蛋白,实现了与Gsα的融合。
RUP15-Gsα融合蛋白构建体的制备如下:
引物设计如下:
5′-TCTAGAATGACGTCCACCTGCACCAACAGC-3′(SEQ.ID.NO.:101;有义)
5′-gatatcGCAGGAAAAGTAGCAGAATCGTAGGAAG-3′(SEQ.ID.NO.:102,反义)
小写的核苷酸作为间隔子包含在G蛋白与RUP15间的限制性位点中,有义和反义引物分别包含了EcoRV和XbaI限制性位点,间隔子(对限制性位点有贡献)存在于该G蛋白和RUP15之间。
然后应用PCR得到各个受体序列,用于上面公开的Gsα通用载体中的融合,各PCR使用以下程序:100ng RUP15 cDNA加到不同的管中,其中各管含有每个引物(有义和反义)2μl,3μl 10mM dNTP,10μl10×TaqPlusTM精确缓冲液,1μl TaqPlusTM精确聚合酶(Stratagene:#600211),及80μl水。用于RUP15的反应温度和循环时间如下:在94℃下进行1分钟,然后进行94℃ 30秒;62℃ 20秒;72℃ 1分钟40秒;72℃下进行5分钟,从第2步到第4步循环35次。PCR产物走1%琼脂糖凝胶,然后纯化(数据未显示)。消化经纯化的产物。纯化产物用EcoRV和XbaI酶切,所需的插入片段经纯化连接到Gs通用载体中各自的限制性位点。转化后分离阳性克隆并用限制性酶酶切确认;用293细胞按下述程序实现表达,对RUP15-Gs融合蛋白的每个阳性克隆进行测序以证实正确性。(核苷酸序列见SEQ.ID.NO.:103,氨基酸序列见SEQ.ID.NO.:104)。
b.Gq(6个氨基酸缺失)/Gi融合构建体
Gq(缺失)/Gi融合构建体的设计如下:Gαq亚单位的N末端6个氨基酸(从2到7位的氨基酸,序列为TLESIM(SEQ.ID.NO.:129))被缺失,其C末端的5个氨基酸(序列为EYNLV,SEQ.ID.NO.:130)被Gαi蛋白的相应氨基酸(序列为DCGLF,SEQ.ID.NO.:131)替代。该融合构建体用以下引物进行PCR克隆:
5′-gatcaagcttcCATGGCGTGCTGCCTGAGCGAGGAG-3′(SEQ.ID.NO.:132)和
5′-gatcggatccTTAGAACAGGCCGCAGTCCTTCAGGTTCAGCTGCAGGATGGTG-3′(SEQ.ID.NO.:133)
以及带有血凝素标签的小鼠野生型Gαq的质粒63313为模板。小写的核苷酸是间隔子。
使用TaqPlus精确DNA聚合酶(Stratagene)进行以下循环扩增反应:95℃ 2分钟;95℃ 20秒;56℃ 20秒;72℃ 2分钟;72℃下进行7分钟,从第2步到第4步循环35次。PCR产物克隆到pCRII-TOPO载体(Invitrogen)中,并用ABI Big Dye Terminator试剂盒(P.E.Biosystem)测序。来自含有该融合构建体序列的TOPO克隆的插入片段,通过两步克隆,可被穿梭地转移到表达载体pcDNA3.1(+)的HindIII/BamHI位点处。
实施例6
公开的人GPCR的组织分布:RT-PCR
应用RT-PCR确证是否表达,以及几种新的人GPCR在组织中的分布。使用的寡核苷酸是GPCR特异性的,以人多种组织cDNA作为模板(MTC,Clontech)。使用Taq DNA多聚酶(Stratagene)在40μl反应液中进行扩增,依照生产商的说明使用。将20μl反应液进行1.5%的琼脂糖凝胶电泳,分析RT-PCR产物。以下的表J列出了受体,循环反应条件以及使用的引物。
表J 受体种 类 循环条件(分’秒”) 从2-4步循环30 次 5′引物 (SEQ.ID.NO) 3′引物 (SEQ.ID.NO) DNA 片段 组织表达
hRUP10 94°30” 94°10” 62°20” 72°1’ 72°7’ *2-4步循环 35次 CATGTATGC CAGCGTCCT GCTCC(105) GCTATGCCTG AAGCCAGTC TTGTG(106) 730bp 肾脏, 白细胞, 肝脏, 胎盘, 脾脏
hRUP11 94°2’ 94°15” 67°15” 72°45” 72°5’ GCACCTGCT CCTGAGCAC CTTCTCC(107) CACAGCGCT GCAGCCCTG CAGCTGGC(108) 630bp 肝脏,肾脏, 胰脏,结肠小肠, 脾脏,和前列腺
hRUP12 94°2’ 94°15” 66°15” 72°45” 72°5’ CCAGTGATG ACTCTGTCC AGCCTG(109) CAGACACTT GGCAGGGAC GAGGTG(110) 490bp 脑,心脏,肾脏,结肠, 白细胞,胰脏,前列 腺,小肠,脾脏,睾丸, 和胸腺
hRUP13 94°1’ 94°15” 68°20” 72°1’45” 72°5’ CTTGTGGTCT ACTGCAGCA TGTTCCG(111) CATAACCCTC CGAGTGTCC AGCGGC(112) 700bp 胎盘和肺
hRUP14 94°1’ 94°15” 68°20” 72°1’45” 72°5’ ATGGATCCT TATCATGGC TTCCTC(113) CAAGAACAG GTCTCATCTA AGAGCTCC(114) 700bp 未知
hRUP16 94°30” 94°5” 69°15” 72°30” 72°5’ CTCTGATGC CATCTGCTG GATTCCTG(11 5) GTAGTCCACT GAAAGTCCA GTGATCC(116) 370bp 胎儿脑,胎儿肾脏, 和胎儿骨骼肌
hRUP18 94°2’ 94°15” 60°20” 72°1’ 72°5’ TGGTGGCGA TGGCCAACA GCGCTC(117) GTTGCGCCTT AGCGACAGA TGACC(118) 330bp 胰脏
hRUP21 94°1’ 94°15” 56°20” 72°40” *2-3步循环 30次 TCAACCTGT ATAGCAGCA TCCTC(119) AAGGAGTAG CAGAATGGT TAGCC(120) 肾脏,肺和睾丸
hRUP22 94°30” 94°15” 69°20” 72°40” *2-3步循环 30次 GACACCTGT CAGCGGTCG TGTGTG(121) CTGATGGAA GTAGAGGCT GTCCATCTC (122) 睾丸,胸腺和脾脏
hRUP23 94°2’ 94°15” 60°20” 72°1’ 72°5’ GCGCTGAGC GCAGACCAG TGGCTG(123) CACGGTGAC GAAGGGCAC GAGCTC(124) 520bp 胎盘
hRUP26 94°2’ 94°15” 65°20” 72°1’ 72°5’ AGCCATCCC TGCCAGGAA GCATGG(125) CCAGGTAGG TGTGCAGCA CAATGGC(126) 470bp 胰脏
hRUP27 94°30” 94°10” 55°20” 72°1’ 72°3’ *2-4步循环 35次 CTGTTCAAC AGGGCTGGT TGGCAAC(127) ATCATGTCTA GACTCATGGT GATCC(128) 890bp 脑
实施例7
规程:直接识别反激动剂和激动剂
A:[35S]GTPγS分析
虽然我们已将内源组成型活性的GPCR用于直接识别(例如)作为如反激动剂的候选化合物,由于不完全了解的原因,分析内的误差会变得加重。那么,如上公开的GPCR融合蛋白也优选与非内源组成型活化的GPCR一起应用。我们已经确定使用这样的蛋白,分析内误差看起来基本稳定,因此获得有效的信噪比。这有利于对候选化合物进行更加充分的识别。因此,对于直接识别,比较好的是使用GPCR融合蛋白,并且在用时,优选用到下面的分析规程。
1.膜制备
包含目的组成型活性孤儿GPCR融合蛋白的膜和用于直接识别作为反激动剂、激动剂或部分激动剂的候选化合物的膜,优选按如下步骤制备如下:
a.材料
“膜提取缓冲液”由20mM HEPES和10mM EDTA组成,pH7.4;“膜清洗缓冲液”由20mM HEPES和0.1mM EDTA组成,pH7.4;“结合缓冲液”由20mM HEPES、100mM NaCl及10mM MgCl2组成,pH7.4。
b.步骤
整个过程中所有材料均置于冰上。首先,将培养基从汇合的单层细胞中吸去,随后用10ml冷的PBS清洗,随后吸掉,这之后将5ml膜提取缓冲液加到提取细胞上,随后将细胞提取物转移到50ml离心管中(4℃下20,000rpm离心17分钟),这之后吸出上清液,将沉淀重悬于30ml膜清洗缓冲液,随后4℃下20,000rpm离心17分钟,然后吸出上清液,沉淀重悬于结合缓冲液中,然后用Brinkman polytronTM均化器进行均化(15-20秒剧烈振动直到所有材料处悬浮状态),此处称之为“膜蛋白”。
2.Bradford蛋白分析
均化以后,这些膜的蛋白浓度用Bradford蛋白分析确定。(蛋白可以稀释成大约1.5mg/ml,等份分装和冷冻(-80℃)备用;冷冻状态下,所用规程如下:分析的当天,将冷冻的膜蛋白室温下溶化,随后用涡旋振荡器,然后用polytron以大约12×1000rpm均化约5~10秒;请注意,对于多次制备,不同制备物的均化之间应该彻底洗净均化器。
a.材料
结合缓冲液(如上);Bradford染色试剂,Bradford蛋白标准物,按商家说明使用(Biorad,cat.no.500-0006)。
b.步骤
准备两个试管,一个含有膜,一个作为“空白”对照。每管装入800μl结合缓冲液,之后将10μl Bradford蛋白标准物(1mg/ml)加到每个试管中,然后10μl膜蛋白只加到一个试管中(空白管中不加),这之后200μl Bradford染色试剂加到每个试管中,随后每个试管经涡旋振荡,5分钟后,试管再次涡旋振荡,将其中的材料转移到比色杯中,然后比色杯用CECIL 3041分光光度计在595波长下读数。
3.直接识别分析
a.材料
GDP缓冲液由37.5ml结合缓冲液和2mg GDP(Sigma,cat.no.G.7127)组成,随后用结合缓冲液作一系列稀释以得到0.2μM GDP(每孔中GDP的终浓度为0.1μM GDP);每孔含有一种候选化合物,终体积为200μl,其中有100μl GDP缓冲液(终浓度0.1μM GDP),50μl悬浮于结合缓冲液中的膜蛋白,及50μl溶于结合缓冲液中的[35S]GTPγS(0.6nM)(每10ml结合缓冲液2.5μl[35S]GTPγS)。
b.步骤
候选化合物最是用96-孔板筛选(可以在-80℃冷冻),将膜蛋白(或带有除了GPCR融合蛋白的表达载体的膜,作为对照)简单地均化至悬浮状态,然后用上述的Bradford蛋白分析确定蛋白浓度。然后膜蛋白(和对照)用结合缓冲液稀释成0.25mg/ml(最终分析浓度,12.5μg/孔),这之后,100μl GDP缓冲液加到Wallac ScintistripTM(Wallac)的每个样品孔中,然后用5μl针具将5μl候选化合物转移到这些样品孔中(5μl在200μl总分析体积中为1∶40比例因而候选化合物最终的筛选浓度10μM)。再有,为避免污染,每次转移步骤后,针具应该清洗三次:包括水(1X),乙醇(1X)和水(2X)----多余液体在每次清洗后甩掉,用纸和kimwipe干燥。这之后50μl膜蛋白加到每个样品孔中(对照样品孔含有不带GPCR融合蛋白的膜),室温下预育5-10分钟,这之后,50μl结合缓冲液中的[35S]GTPγS(0.6nM)加到每个样品孔中,随后室温下于摇床上温育60分钟(再有,本实施例中,培养板用金属箔盖住。然后将板以4000RPM22℃下旋转15分钟终止分析,然后用8道支管吸净板,用板盖盖住,最后板用设置在“Prot.#37”档(依各商家说明)的Wallac 1450读数。
B.环AMP分析
另一种直接识别侯选化合物的分析方法是基于环化酶的分析。除了直接识别以外,这种方法也可用做独立的方法,证实上述[35S]GTPγS分析所得的结果。
最好是应用经改进的Flash PlateTM腺苷酸环化酶试剂盒(NewEngland Nuclear;Cat.no.SMP004A),按下面的规程直接识别出候选化合物为组成型活化的孤儿GPCR的反激动剂和激动剂。
转染后大约三天收集转染细胞,在含有20mM HEPES(pH7.4)和10mM MgCl2的缓冲液中,通过将悬浮的细胞均化来制备膜,用Brinkman PolytronTM在冰上进行均化大约10秒,产生的匀浆4℃下49,000×g离心15分钟,然后产生的沉淀重悬于含有20mM HEPES(pH7.4)和0.1mM EDTA的缓冲液中,均化10秒,随后4℃下49,000×g离心15分钟,产生的沉淀-80℃保存备用。直接识别筛选当天,将膜沉淀于室温下缓慢融化,并重悬于含有20mM HEPES(pH7.4)和10mMMgCl2的缓冲液中,产生0.6mg/ml的最终蛋白浓度(重悬的膜置于冰上备用)。
cAMP标准物和测定缓冲液(2μCi示踪物[125I cAMP 100μl]加到11ml测定缓冲液中),根据商家说明制备并保管。制备新鲜的分析缓冲液用于筛选,其中包含20mM HEPES(pH7.4),10mM MgCl2,20mM磷酸肌酸(Sigma),0.1单位/ml肌酸磷酸激酶(Sigma),50μM GTP(Sigma),及0.2mM ATP(Sigma);分析缓冲液可在冰上保存备用。
优选将以上识别的候选化合物(如冷冻,室温下融化)加到96孔板的样品孔中(3μl/孔,12μM的分析终浓度),与40μl膜蛋白(30μg/孔)和50μl分析缓冲液合在一起。然后将该混合物在室温下温育30分钟,同时轻轻摇动。
温育完成后,100μl测定缓冲液加到每个样品孔中,随后放置2~4小时,然后板在Wallac MicroBetaTM读板器中用“Prot.#31”档计数(依各商家说明操作)。
在图12中显示了一个具有代表性的筛选分析平板(96孔板)。每条代表各孔中不同化合物,和以上实施例5(a)中制备的RUP13-Gsα融合蛋白构建体的结果。图12中的典型结果也提供了标准偏差,其获得是基于各平板平均值(“m”),平均值连同两个从初步筛选过程中随机选取作为“先导”的反激动剂,包括选择出这样的候选化合物,其反应降低率至少为平均反应值减去两倍的标准偏差。相反的,从初步筛选过程中任意优先选取作为“先导”的激动剂,包括选择出这样的候选化合物,其反应增加率至少为平均反应值加两倍的标准偏差。基于以上的选择程序,以下孔中的侯选化合物可分别作为孔A2和G9中RUP13的可能的反激动剂(化合物A)和激动剂(化合物B)被直接识别。参见图12。为了清楚起见特别说明:这些化合物在未知该GPCR内源配体的情况下被直接识别。通过这种基于受体功能而非化合物的结合亲和性的分析技术,我们可以确认能够降低受体功能活性的化合物(化合物A),也能确认可增加受体功能活性的化合物(化合物B)。基于这些受体在肺部的定位(见,例如实施例6中的hRUP13和hRUP21),可以发明对治疗肺癌有潜在疗效的药剂。
本专利申请文件中提到的每个文献,包括共同未决的申请及相关专利申请在内,除非有特别说明,均以其全文引入本申请作参考。在本领域技术人员理解范围内的针对所公开之发明进行的修改和延伸均在上述公开及所附权利要求的范围之内。
虽然本领域的普通技术人员可以得到许多不同的载体为内源和非内源GPCR的目的使用,但最好是用pCMV载体。按照国际承认用于专利程序的微生物保藏布达佩斯条约,该载体于1998年10月13日保藏在美国典型培养物保藏中心(American Type Culture Collection)(ATCC)(University Blvd,Manassas,VA20110-2209 USA7)。其DNA经ATCC测定并经确认处于存活状态,ATCC为pCMV给出了下列保藏号ATCC#203351。
序列表
<110>阿瑞那制药公司(Arena Pharmaceuticals,Inc.)
陈若平(Ruoping CHEN);邓杭(Huong T.DANG);凯文·P·洛斯(Kevin P.LOWITZ)
<120>非内源组成型活化的人G蛋白偶联受体
(Non-Endogenous,Constitutively Activated Human G Protein-Coupled Receptors)
<130>SPI064359-47
<150>60/166,088
<151>1999-11-17
<150>60/166,369
<151>1999-11-17
<150>60/166,099
<151>1999-11-17
<150>60/171,902
<151>1999-12-23
<150>60/171,901
<151>1999-12-23
<150>60/171,900
<151>1999-12-23
<150>60/181,749
<151>2000-02-11
<150>60/189,258
<151>2000-03-14
<150>60/189,259
<151>2000-03-14
<150>60/195,899
<151>2000-04-10
<150>60/196,078
<151>2000-04-10
<150>60/195,898
<151>2000-04-10
<150>60/200,419
<151>2000-04-28
<150>60/203,630
<151>2000-05-12
<150>60/210,741
<151>2000-06-12
<150>60/210,982
<151>2000-06-12
<150>60/226,760
<151>2000-08-21
<150>60/235,779
<151>2000-09-26
<150>60/235,418
<151>2000-09-26
<150>60/242,332
<151>2000-10-20
<150>60/242,343
<151>2000-10-20
<150>60/243,019
<151>2000-10-24
<160>133
<170>PatentIn version 3.1
<210>1
<211>1155
<212>DNA
<213>智人(Homo sapiens)
<400>1
atggcagccc agaatggaaa caccagtttc acacccaact ttaatccacc ccaagaccat 60
gcctcctccc tctcctttaa cttcagttat ggtgattatg acctccctat ggatgaggat 120
gaggacatga ccaagacccg gaccttcttc gcagccaaga tcgtcattgg cattgcactg 180
gcaggcatca tgctggtctg cggcatcggt aactttgtct ttatcgctgc cctcacccgc 240
tataagaagt tgcgcaacct caccaatctg ctcattgcca acctggccat ctccgacttc 300
ctggtggcca tcatctgctg ccccttcgag atggactact acgtggtacg gcagctctcc 360
tgggagcatg gccacgtgct ctgtgcctcc gtcaactacc tgcgcaccgt ctccctctac 420
gtctccacca atgccttgct ggccattgcc attgacagat atctcgccat cgttcacccc 480
ttgaaaccac ggatgaatta tcaaacggcc tccttcctga tcgccttggt ctggatggtg 540
tccattctca ttgccatccc atcggcttac tttgcaacag aaacggtcct ctttattgtc 600
aagagccagg agaagatctt ctgtggccag atctggcctg tggatcagca gctctactac 660
aagtcctact tcctcttcat ctttggtgtc gagttcgtgg gccctgtggt caccatgacc 720
ctgtgctatg ccaggatctc ccgggagctc tggttcaagg cagtccctgg gttccagacg 780
gagcagattc gcaagcggct gcgctgccgc aggaagacgg tcctggtgct catgtgcatt 840
ctcacggcct atgtgctgtg ctgggcaccc ttctacggtt tcaccatcgt tcgtgacttc 900
ttccccactg tgttcgtgaa ggaaaagcac tacctcactg ccttctacgt ggtcgagtgc 960
atcgccatga gcaacagcat gatcaacacc gtgtgcttcg tgacggtcaa gaacaacacc 1020
atgaagtact tcaagaagat gatgctgctg cactggcgtc cctcccagcg ggggagcaag 1080
tccagtgctg accttgacct cagaaccaac ggggtgccca ccacagaaga ggtggactgt 1140
atcaggctga agtga 1155
<210>2
<211>384
<212>PRT
<213>智人(Homo sapiens)
<400>2
Met Ala Ala Gln Asn Gly Asn Thr Ser Phe Thr Pro Asn Phe Asn Pro
1 5 10 15
Pro Gln Asp His Ala Ser Ser Leu Ser Phe Asn Phe Ser Tyr Gly Asp
20 25 30
Tyr Asp Leu Pro Met Asp Glu Asp Glu Asp Met Thr Lys Thr Arg Thr
35 40 45
Phe Phe Ala Ala Lys Ile Val Ile Gly Ile Ala Leu Ala Gly Ile Met
50 55 60
Leu Val Cys Gly Ile Gly Asn Phe Val Phe Ile Ala Ala Leu Thr Arg
65 70 75 80
Tyr Lys Lys Leu Arg Asn Leu Thr Asn Leu Leu Ile Ala Asn Leu Ala
85 90 95
Ile Ser Asp Phe Leu Val Ala Ile Ile Cys Cys Pro Phe Glu Met Asp
100 105 110
Tyr Tyr Val Val Arg Gln Leu Ser Trp Glu His Gly His Val Leu Cys
115 120 125
Ala Ser Val Asn Tyr Leu Arg Thr Val Ser Leu Tyr Val Ser Thr Asn
130 135 140
Ala Leu Leu Ala Ile Ala Ile Asp Arg Tyr Leu Ala Ile Val His Pro
145 150 155 160
Leu Lys Pro Arg Met Asn Tyr Gln Thr Ala Ser Phe Leu Ile Ala Leu
165 170 175
Val Trp Met Val Ser Ile Leu Ile Ala Ile Pro Ser Ala Tyr Phe Ala
180 185 190
Thr Glu Thr Val Leu Phe Ile Val Lys Ser Gln Glu Lys Ile Phe Cys
195 200 205
Gly Gln Ile Trp Pro Val Asp Gln Gln Leu Tyr Tyr Lys Ser Tyr Phe
210 215 220
Leu Phe Ile Phe Gly Val Glu Phe Val Gly Pro Val Val Thr Met Thr
225 230 235 240
Leu Cys Tyr Ala Arg Ile Ser Arg Glu Leu Trp Phe Lys Ala Val Pro
245 250 255
Gly Phe Gln Thr Glu Gln Ile Arg Lys Arg Leu Arg Cys Arg Arg Lys
260 265 270
Thr Val Leu Val Leu Met Cys Ile Leu Thr Ala Tyr Val Leu Cys Trp
275 280 285
Ala Pro Phe Tyr Gly Phe Thr Ile Val Arg Asp Phe Phe Pro Thr Val
290 295 300
Phe Val Lys Glu Lys His Tyr Leu Thr Ala Phe Tyr Val Val Glu Cys
305 310 315 320
Ile Ala Met Ser Asn Ser Met Ile Asn Thr Val Cys Phe Val Thr Val
325 330 335
Lys Asn Asn Thr Met Lys Tyr Phe Lys Lys Met Met Leu Leu His Trp
340 345 350
Arg Pro Ser Gln Arg Gly Ser Lys Ser Ser Ala Asp Leu Asp Leu Arg
355 360 365
Thr Asn Gly Val Pro Thr Thr Glu Glu Val Asp Cys Ile Arg Leu Lys
370 375 380
<210>3
<211>1260
<212>DNA
<213>智人(Homo sapiens)
<400>3
atgctggcag ctgcctttgc agactctaac tccagcagca tgaatgtgtc ctttgctcac 60
ctccactttg ccggagggta cctgccctct gattcccagg actggagaac catcatcccg 120
gctctcttgg tggctgtctg cctggtgggc ttcgtgggaa acctgtgtgt gattggcatc 180
ctccttcaca atgcttggaa aggaaagcca tccatgatcc actccctgat tctgaatctc 240
agcctggctg atctctccct cctgctgttt tctgcaccta tccgagctac ggcgtactcc 300
aaaagtgttt gggatctagg ctggtttgtc tgcaagtcct ctgactggtt tatccacaca 360
tgcatggcag ccaagagcct gacaatcgtt gtggtggcca aagtatgctt catgtatgca 420
agtgacccag ccaagcaagt gagtatccac aactacacca tctggtcagt gctggtggcc 480
atctggactg tggctagcct gttacccctg ccggaatggt tctttagcac catcaggcat 540
catgaaggtg tggaaatgtg cctcgtggat gtaccagctg tggctgaaga gtttatgtcg 600
atgtttggta agctctaccc actcctggca tttggccttc cattattttt tgccagcttt 660
tatttctgga gagcttatga ccaatgtaaa aaacgaggaa ctaagactca aaatcttaga 720
aaccagatac gctcaaagca agtcacagtg atgctgctga gcattgccat catctctgct 780
ctcttgtggc tccccgaatg ggtagcttgg ctgtgggtat ggcatctgaa ggctgcaggc 840
ccggccccac cacaaggttt catagccctg tctcaagtct tgatgttttc catctcttca 900
gcaaatcctc tcatttttct tgtgatgtcg gaagagttca gggaaggctt gaaaggtgta 960
tggaaatgga tgataaccaa aaaacctcca actgtctcag agtctcagga aacaccagct 1020
ggcaactcag agggtcttcc tgacaaggtt ccatctccag aatccccagc atccatacca 1080
gaaaaagaga aacccagctc tccctcctct ggcaaaggga aaactgagaa ggcagagatt 1140
cccatccttc ctgacgtaga gcagttttgg catgagaggg acacagtccc ttctgtacag 1200
gacaatgacc ctatcccctg ggaacatgaa gatcaagaga caggggaagg tgttaaatag 1260
<210>4
<211>419
<212>PRT
<213>智人(Homo sapiens)
<400>4
Met Leu Ala Ala Ala Phe Ala Asp Ser Asn Ser Ser Ser Met Asn Val
1 5 10 15
Ser Phe Ala His Leu His Phe Ala Gly Gly Tyr Leu Pro Ser Asp Ser
20 25 30
Gln Asp Trp Arg Thr Ile Ile Pro Ala Leu Leu Val Ala Val Cys Leu
35 40 45
Val Gly Phe Val Gly Asn Leu Cys Val Ile Gly Ile Leu Leu His Asn
50 55 60
Ala Trp Lys Gly Lys Pro Ser Met Ile His Ser Leu Ile Leu Asn Leu
65 70 75 80
Ser Leu Ala Asp Leu Ser Leu Leu Leu Phe Ser Ala Pro Ile Arg Ala
85 90 95
Thr Ala Tyr Ser Lys Ser Val Trp Asp Leu Gly Trp Phe Val Cys Lys
100 105 110
Ser Ser Asp Trp Phe Ile His Thr Cys Met Ala Ala Lys Ser Leu Thr
115 120 125
Ile Val Val Val Ala Lys Val Cys Phe Met Tyr Ala Ser Asp Pro Ala
130 135 140
Lys Gln Val Ser Ile His Asn Tyr Thr Ile Trp Ser Val Leu Val Ala
145 150 155 160
Ile Trp Thr Val Ala Ser Leu Leu Pro Leu Pro Glu Trp Phe Phe Ser
165 170 175
Thr Ile Arg His His Glu Gly Val Glu Met Cys Leu Val Asp Val Pro
180 185 190
Ala Val Ala Glu Glu Phe Met Ser Met Phe Gly Lys Leu Tyr Pro Leu
195 200 205
Leu Ala Phe Gly Leu Pro Leu Phe Phe Ala Ser Phe Tyr Phe Trp Arg
210 215 220
Ala Tyr Asp Gln Cys Lys Lys Arg Gly Thr Lys Thr Gln Asn Leu Arg
225 230 235 240
Asn Gln Ile Arg Ser Lys Gln Val Thr Val Met Leu Leu Ser Ile Ala
245 250 255
Ile Ile Ser Ala Leu Leu Trp Leu Pro Glu Trp Val Ala Trp Leu Trp
260 265 270
Val Trp His Leu Lys Ala Ala Gly Pro Ala Pro Pro Gln Gly Phe Ile
275 280 285
Ala Leu Ser Gln Val Leu Met Phe Ser Ile Ser Ser Ala Asn Pro Leu
290 295 300
Ile Phe Leu Val Met Ser Glu Glu Phe Arg Glu Gly Leu Lys Gly Val
305 310 315 320
Trp Lys Trp Met Ile Thr Lys Lys Pro Pro Thr Val Ser Glu Ser Gln
325 330 335
Glu Thr Pro Ala Gly Asn Ser Glu Gly Leu Pro Asp Lys Val Pro Ser
340 345 350
Pro Glu Ser Pro Ala Ser Ile Pro Glu Lys Glu Lys Pro Ser Ser Pro
355 360 365
Ser Ser Gly Lys Gly Lys Thr Glu Lys Ala Glu Ile Pro Ile Leu Pro
370 375 380
Asp Val Glu Gln Phe Trp His Glu Arg Asp Thr Val Pro Ser Val Gln
385 390 395 400
Asp Asn Asp Pro Ile Pro Trp Glu His Glu Asp Gln Glu Thr Gly Glu
405 410 415
Gly Val Lys
<210>5
<211>1014
<212>DNA
<213>智人(Homo sapiens)
<400>5
atggggaacg attctgtcag ctacgagtat ggggattaca gcgacctctc ggaccgccct 60
gtggactgcc tggatggcgc ctgcctggcc atcgacccgc tgcgcgtggc cccgctccca 120
ctgtatgccg ccatcttcct ggtgggggtg ccgggcaatg ccatggtggc ctgggtggct 180
gggaaggtgg cccgccggag ggtgggtgcc acctggttgc tccacctggc cgtggcggat 240
ttgctgtgct gtttgtctct gcccatcctg gcagtgccca ttgcccgtgg aggccactgg 300
ccgtatggtg cagtgggctg tcgggcgctg ccctccatca tcctgctgac catgtatgcc 360
agcgtcctgc tcctggcagc tctcagtgcc gacctctgct tcctggctct cgggcctgcc 420
tggtggtcta cggttcagcg ggcgtgcggg gtgcaggtgg cctgtggggc agcctggaca 480
ctggccttgc tgctcaccgt gccctccgcc atctaccgcc ggctgcacca ggagcacttc 540
ccagcccggc tgcagtgtgt ggtggactac ggcggctcct ccagcaccga gaatgcggtg 600
actgccatcc ggtttctttt tggcttcctg gggcccctgg tggccgtggc cagctgccac 660
agtgccctcc tgtgctgggc agcccgacgc tgccggccgc tgggcacagc cattgtggtg 720
gggttttttg tctgctgggc accctaccac ctgctggggc tggtgctcac tgtggcggcc 780
ccgaactccg cactcctggc cagggccctg cgggctgaac ccctcatcgt gggccttgcc 840
ctcgctcaca gctgcctcaa tcccatgctc ttcctgtatt ttgggagggc tcaactccgc 900
cggtcactgc cagctgcctg tcactgggcc ctgagggagt cccagggcca ggacgaaagt 960
gtggacagca agaaatccac cagccatgac ctggtctcgg agatggaggt gtag 1014
<210>6
<211>337
<212>PRT
<213>智人(Homo sapiens)
<400>6
Met Gly Asn Asp Ser Val Ser Tyr Glu Tyr Gly Asp Tyr Ser Asp Leu
1 5 10 15
Ser Asp Arg Pro Val Asp Cys Leu Asp Gly Ala Cys Leu Ala Ile Asp
20 25 30
Pro Leu Arg Val Ala Pro Leu Pro Leu Tyr Ala Ala Ile Phe Leu Val
35 40 45
Gly Val Pro Gly Asn Ala Met Val Ala Trp Val Ala Gly Lys Val Ala
50 55 60
Arg Arg Arg Val Gly Ala Thr Trp Leu Leu His Leu Ala Val Ala Asp
65 70 75 80
Leu Leu Cys Cys Leu Ser Leu Pro Ile Leu Ala Val Pro Ile Ala Arg
85 90 95
Gly Gly His Trp Pro Tyr Gly Ala Val Gly Cys Arg Ala Leu Pro Ser
100 105 110
Ile Ile Leu Leu Thr Met Tyr Ala Ser Val Leu Leu Leu Ala Ala Leu
115 120 125
Ser Ala Asp Leu Cys Phe Leu Ala Leu Gly Pro Ala Trp Trp Ser Thr
130 135 140
Val Gln Arg Ala Cys Gly Val Gln Val Ala Cys Gly Ala Ala Trp Thr
145 150 155 160
Leu Ala Leu Leu Leu Thr Val Pro Ser Ala Ile Tyr Arg Arg Leu His
165 170 175
Gln Glu His Phe Pro Ala Arg Leu Gln Cys Val Val Asp Tyr Gly Gly
180 185 190
Ser Ser Ser Thr Glu Asn Ala Val Thr Ala Ile Arg Phe Leu Phe Gly
195 200 205
Phe Leu Gly Pro Leu Val Ala Val Ala Ser Cys His Ser Ala Leu Leu
210 215 220
Cys Trp Ala Ala Arg Arg Cys Arg Pro Leu Gly Thr Ala Ile Val Val
225 230 235 240
Gly Phe Phe Val Cys Trp Ala Pro Tyr His Leu Leu Gly Leu Val Leu
245 250 255
Thr Val Ala Ala Pro Asn Ser Ala Leu Leu Ala Arg Ala Leu Arg Ala
260 265 270
Glu Pro Leu Ile Val Gly Leu Ala Leu Ala His Ser Cys Leu Asn Pro
275 280 285
Met Leu Phe Leu Tyr Phe Gly Arg Ala Gln Leu Arg Arg Ser Leu Pro
290 295 300
Ala Ala Cys His Trp Ala Leu Arg Glu Ser Gln Gly Gln Asp Glu Ser
305 310 315 320
Val Asp Ser Lys Lys Ser Thr Ser His Asp Leu Val Ser Glu Met Glu
325 330 335
Val
<210>7
<211>1272
<212>DNA
<213>智人(Homo sapiens)
<400>7
atgttgtgtc accgtggtgg ccagctgata gtgccaatca tcccactttg ccctgagcac 60
tcctgcaggg gtagaagact ccagaacctt ctctcaggcc catggcccaa gcagcccatg 120
gaacttcata acctgagctc tccatctccc tctctctcct cctctgttct ccctccctcc 180
ttctctccct caccctcctc tgctccctct gcctttacca ctgtgggggg gtcctctgga 240
gggccctgcc accccacctc ttcctcgctg gtgtctgcct tcctggcacc aatcctggcc 300
ctggagtttg tcctgggcct ggtggggaac agtttggccc tcttcatctt ctgcatccac 360
acgcggccct ggacctccaa cacggtgttc ctggtcagcc tggtggccgc tgacttcctc 420
ctgatcagca acctgcccct ccgcgtggac tactacctcc tccatgagac ctggcgcttt 480
ggggctgctg cctgcaaagt caacctcttc atgctgtcca ccaaccgcac ggccagcgtt 540
gtcttcctca cagccatcgc actcaaccgc tacctgaagg tggtgcagcc ccaccacgtg 600
ctgagccgtg cttccgtggg ggcagctgcc cgggtggccg ggggactctg ggtgggcatc 660
ctgctcctca acgggcacct gctcctgagc accttctccg gcccctcctg cctcagctac 720
agggtgggca cgaagccctc ggcctcgctc cgctggcacc aggcactgta cctgctggag 780
ttcttcctgc cactggcgct catcctcttt gctattgtga gcattgggct caccatccgg 840
aaccgtggtc tgggcgggca ggcaggcccg cagagggcca tgcgtgtgct ggccatggtg 900
gtggccgtct acaccatctg cttcttgccc agcatcatct ttggcatggc ttccatggtg 960
gctttctggc tgtccgcctg ccgatccctg gacctctgca cacagctctt ccatggctcc 1020
ctggccttca cctacctcaa cagtgtcctg gaccccgtgc tctactgctt ctctagcccc 1080
aacttcctcc accagagccg ggccttgctg ggcctcacgc ggggccggca gggcccagtg 1140
agcgacgaga gctcctacca accctccagg cagtggcgct accgggaggc ctctaggaag 1200
gcggaggcca tagggaagct gaaagtgcag ggcgaggtct ctctggaaaa ggaaggctcc 1260
tcccagggct ga 1272
<210>8
<211>423
<212>PRT
<213>智人(Homo sapiens)
<400>8
Met Leu Cys His Arg Gly Gly Gln Leu Ile Val Pro Ile Ile Pro Leu
1 5 10 15
Cys Pro Glu His Ser Cys Arg Gly Arg Arg Leu Gln Asn Leu Leu Ser
20 25 30
Gly Pro Trp Pro Lys Gln Pro Met Glu Leu His Asn Leu Ser Ser Pro
35 40 45
Ser Pro Ser Leu Ser Ser Ser Val Leu Pro Pro Ser Phe Ser Pro Ser
50 55 60
Pro Ser Ser Ala Pro Ser Ala Phe Thr Thr Val Gly Gly Ser Ser Gly
65 70 75 80
Gly Pro Cys His Pro Thr Ser Ser Ser Leu Val Ser Ala Phe Leu Ala
85 90 95
Pro Ile Leu Ala Leu Glu Phe Val Leu Gly Leu Val Gly Asn Ser Leu
100 105 110
Ala Leu Phe Ile Phe Cys Ile His Thr Arg Pro Trp Thr Ser Asn Thr
115 120 125
Val Phe Leu Val Ser Leu Val Ala Ala Asp Phe Leu Leu Ile Ser Asn
130 135 140
Leu Pro Leu Arg Val Asp Tyr Tyr Leu Leu His Glu Thr Trp Arg Phe
145 150 155 160
Gly Ala Ala Ala Cys Lys Val Asn Leu Phe Met Leu Ser Thr Asn Arg
165 170 175
Thr Ala Ser Val Val Phe Leu Thr Ala Ile Ala Leu Asn Arg Tyr Leu
180 185 190
Lys Val Val Gln Pro His His Val Leu Ser Arg Ala Ser Val Gly Ala
195 200 205
Ala Ala Arg Val Ala Gly Gly Leu Trp Val Gly Ile Leu Leu Leu Asn
210 215 220
Gly His Leu Leu Leu Ser Thr Phe Ser Gly Pro Ser Cys Leu Ser Tyr
225 230 235 240
Arg Val Gly Thr Lys Pro Ser Ala Ser Leu Arg Trp His Gln Ala Leu
245 250 255
Tyr Leu Leu Glu Phe Phe Leu Pro Leu Ala Leu Ile Leu Phe Ala Ile
260 265 270
Val Ser Ile Gly Leu Thr Ile Arg Asn Arg Gly Leu Gly Gly Gln Ala
275 280 285
Gly Pro Gln Arg Ala Met Arg Val Leu Ala Met Val Val Ala Val Tyr
290 295 300
Thr Ile Cys Phe Leu Pro Ser Ile Ile Phe Gly Met Ala Ser Met Val
305 310 315 320
Ala Phe Trp Leu Ser Ala Cys Arg Ser Leu Asp Leu Cys Thr Gln Leu
325 330 335
Phe His Gly Ser Leu Ala Phe Thr Tyr Leu Asn Ser Val Leu Asp Pro
340 345 350
Val Leu Tyr Cys Phe Ser Ser Pro Asn Phe Leu His Gln Ser Arg Ala
355 360 365
Leu Leu Gly Leu Thr Arg Gly Arg Gln Gly Pro Val Ser Asp Glu Ser
370 375 380
Ser Tyr Gln Pro Ser Arg Gln Trp Arg Tyr Arg Glu Ala Ser Arg Lys
385 390 395 400
Ala Glu Ala Ile Gly Lys Leu Lys Val Gln Gly Glu Val Ser Leu Glu
405 410 415
Lys Glu Gly Ser Ser Gln Gly
420
<210>9
<211>966
<212>DNA
<213>智人(Homo sapiens)
<400>9
atgaaccaga ctttgaatag cagtgggacc gtggagtcag ccctaaacta ttccagaggg 60
agcacagtgc acacggccta cctggtgctg agctccctgg ccatgttcac ctgcctgtgc 120
gggatggcag gcaacagcat ggtgatctgg ctgctgggct ttcgaatgca caggaacccc 180
ttctgcatct atatcctcaa cctggcggca gccgacctcc tcttcctctt cagcatggct 240
tccacgctca gcctggaaac ccagcccctg gtcaatacca ctgacaaggt ccacgagctg 300
atgaagagac tgatgtactt tgcctacaca gtgggcctga gcctgctgac ggccatcagc 360
acccagcgct gtctctctgt cctcttccct atctggttca agtgtcaccg gcccaggcac 420
ctgtcagcct gggtgtgtgg cctgctgtgg acactctgtc tcctgatgaa cgggttgacc 480
tcttccttct gcagcaagtt cttgaaattc aatgaagatc ggtgcttcag ggtggacatg 540
gtccaggccg ccctcatcat gggggtctta accccagtga tgactctgtc cagcctgacc 600
ctctttgtct gggtgcggag gagctcccag cagtggcggc ggcagcccac acggctgttc 660
gtggtggtcc tggcctctgt cctggtgttc ctcatctgtt ccctgcctct gagcatctac 720
tggtttgtgc tctactggtt gagcctgccg cccgagatgc aggtcctgtg cttcagcttg 780
tcacgcctct cctcgtccgt aagcagcagc gccaaccccg tcatctactt cctggtgggc 840
agccggagga gccacaggct gcccaccagg tccctgggga ctgtgctcca acaggcgctt 900
cgcgaggagc ccgagctgga aggtggggag acgcccaccg tgggcaccaa tgagatgggg 960
gcttga 966
<210>10
<211>321
<212>PRT
<213>智人(Homo sapiens)
<400>10
Met Asn Gln Thr Leu Asn Ser Ser Gly Thr Val Glu Ser Ala Leu Asn
1 5 10 15
Tyr Ser Arg Gly Ser Thr Val His Thr Ala Tyr Leu Val Leu Ser Ser
20 25 30
Leu Ala Met Phe Thr Cys Leu Cys Gly Met Ala Gly Asn Ser Met Val
35 40 45
Ile Trp Leu Leu Gly Phe Arg Met His Arg Asn Pro Phe Cys Ile Tyr
50 55 60
Ile Leu Asn Leu Ala Ala Ala Asp Leu Leu Phe Leu Phe Ser Met Ala
65 70 75 80
Ser Thr Leu Ser Leu Glu Thr Gln Pro Leu Val Asn Thr Thr Asp Lys
85 90 95
Val His Glu Leu Met Lys Arg Leu Met Tyr Phe Ala Tyr Thr Val Gly
100 105 110
Leu Ser Leu Leu Thr Ala Ile Ser Thr Gln Arg Cys Leu Ser Val Leu
115 120 125
Phe Pro Ile Trp Phe Lys Cys His Arg Pro Arg His Leu Ser Ala Trp
130 135 140
Val Cys Gly Leu Leu Trp Thr Leu Cys Leu Leu Met Asn Gly Leu Thr
145 150 155 160
Ser Ser Phe Cys Ser Lys Phe Leu Lys Phe Asn Glu Asp Arg Cys Phe
165 170 175
Arg Val Asp Met Val Gln Ala Ala Leu Ile Met Gly Val Leu Thr Pro
180 185 190
Val Met Thr Leu Ser Ser Leu Thr Leu Phe Val Trp Val Arg Arg Ser
195 200 205
Ser Gln Gln Trp Arg Arg Gln Pro Thr Arg Leu Phe Val Val Val Leu
210 215 220
Ala Ser Val Leu Val Phe Leu Ile Cys Ser Leu Pro Leu Ser Ile Tyr
225 230 235 240
Trp Phe Val Leu Tyr Trp Leu Ser Leu Pro Pro Glu Met Gln Val Leu
245 250 255
Cys Phe Ser Leu Ser Arg Leu Ser Ser Ser Val Ser Ser Ser Ala Asn
260 265 270
Pro Val Ile Tyr Phe Leu Val Gly Ser Arg Arg Ser His Arg Leu Pro
275 280 285
Thr Arg Ser Leu Gly Thr Val Leu Gln Gln Ala Leu Arg Glu Glu Pro
290 295 300
Glu Leu Glu Gly Gly Glu Thr Pro Thr Val Gly Thr Asn Glu Met Gly
305 310 315 320
Ala
<210>11
<211>1356
<212>DNA
<213>智人(Homo sapiens)
<400>11
atggagtcct cacccatccc ccagtcatca gggaactctt ccactttggg gagggtccct 60
caaaccccag gtccctctac tgccagtggg gtcccggagg tggggctacg ggatgttgct 120
tcggaatctg tggccctctt cttcatgctc ctgctggact tgactgctgt ggctggcaat 180
gccgctgtga tggccgtgat cgccaagacg cctgccctcc gaaaatttgt cttcgtcttc 240
cacctctgcc tggtggacct gctggctgcc ctgaccctca tgcccctggc catgctctcc 300
agctctgccc tctttgacca cgccctcttt ggggaggtgg cctgccgcct ctacttgttt 360
ctgagcgtgt gctttgtcag cctggccatc ctctcggtgt cagccatcaa tgtggagcgc 420
tactattacg tagtccaccc catgcgctac gaggtgcgca tgacgctggg gctggtggcc 480
tctgtgctgg tgggtgtgtg ggtgaaggcc ttggccatgg cttctgtgcc agtgttggga 540
agggtctcct gggaggaagg agctcccagt gtccccccag gctgttcact ccagtggagc 600
cacagtgcct actgccagct ttttgtggtg gtctttgctg tcctttactt tctgttgccc 660
ctgctcctca tacttgtggt ctactgcagc atgttccgag tggcccgcgt ggctgccatg 720
cagcacgggc cgctgcccac gtggatggag acaccccggc aacgctccga atctctcagc 780
agccgctcca cgatggtcac cagctcgggg gccccccaga ccaccccaca ccggacgttt 840
gggggaggga aagcagcagt ggttctcctg gctgtggggg gacagttcct gctctgttgg 900
ttgccctact tctctttcca cctctatgtt gccctgagtg ctcagcccat ttcaactggg 960
caggtggaga gtgtggtcac ctggattggc tacttttgct tcacttccaa ccctttcttc 1020
tatggatgtc tcaaccggca gatccggggg gagctcagca agcagtttgt ctgcttcttc 1080
aagccagctc cagaggagga gctgaggctg cctagccggg agggctccat tgaggagaac 1140
ttcctgcagt tccttcaggg gactggctgt ccttctgagt cctgggtttc ccgaccccta 1200
cccagcccca agcaggagcc acctgctgtt gactttcgaa tcccaggcca gatagctgag 1260
gagacctctg agttcctgga gcagcaactc accagcgaca tcatcatgtc agacagctac 1320
ctccgtcctg ccgcctcacc ccggctggag tcatga 1356
<210>12
<211>451
<212>PRT
<213>智人(Homo sapiens)
<400>12
Met Glu Ser Ser Pro Ile Pro Gln Ser Ser Gly Asn Ser Ser Thr Leu
1 5 10 15
Gly Arg Val Pro Gln Thr Pro Gly Pro Ser Thr Ala Ser Gly Val Pro
20 25 30
Glu Val Gly Leu Arg Asp Val Ala Ser Glu Ser Val Ala Leu Phe Phe
35 40 45
Met Leu Leu Leu Asp Leu Thr Ala Val Ala Gly Asn Ala Ala Val Met
50 55 60
Ala Val Ile Ala Lys Thr Pro Ala Leu Arg Lys Phe Val Phe Val Phe
65 70 75 80
His Leu Cys Leu Val Asp Leu Leu Ala Ala Leu Thr Leu Met Pro Leu
85 90 95
Ala Met Leu Ser Ser Ser Ala Leu Phe Asp His Ala Leu Phe Gly Glu
100 105 110
Val Ala Cys Arg Leu Tyr Leu Phe Leu Ser Val Cys Phe Val Ser Leu
115 120 125
Ala Ile Leu Ser Val Ser Ala Ile Asn Val Glu Arg Tyr Tyr Tyr Val
130 135 140
Val His Pro Met Arg Tyr Glu Val Arg Met Thr Leu Gly Leu Val Ala
145 150 155 160
Ser Val Leu Val Gly Val Trp Val Lys Ala Leu Ala Met Ala Ser Val
165 170 175
Pro Val Leu Gly Arg Val Ser Trp Glu Glu Gly Ala Pro Ser Val Pro
180 185 190
Pro Gly Cys Ser Leu Gln Trp Ser His Ser Ala Tyr Cys Gln Leu Phe
195 200 205
Val Val Val Phe Ala Val Leu Tyr Phe Leu Leu Pro Leu Leu Leu Ile
210 215 220
Leu Val Val Tyr Cys Ser Met Phe Arg Val Ala Arg Val Ala Ala Met
225 230 235 240
Gln His Gly Pro Leu Pro Thr Trp Met Glu Thr Pro Arg Gln Arg Ser
245 250 255
Glu Ser Leu Ser Ser Arg Ser Thr Met Val Thr Ser Ser Gly Ala Pro
260 265 270
Gln Thr Thr Pro His Arg Thr Phe Gly Gly Gly Lys Ala Ala Val Val
275 280 285
Leu Leu Ala Val Gly Gly Gln Phe Leu Leu Cys Trp Leu Pro Tyr Phe
290 295 300
Ser Phe His Leu Tyr Val Ala Leu Ser Ala Gln Pro Ile Ser Thr Gly
305 310 315 320
Gln Val Glu Ser Val Val Thr Trp Ile Gly Tyr Phe Cys Phe Thr Ser
325 330 335
Asn Pro Phe Phe Tyr Gly Cys Leu Asn Arg Gln Ile Arg Gly Glu Leu
340 345 350
Ser Lys Gln Phe Val Cys Phe Phe Lys Pro Ala Pro Glu Glu Glu Leu
355 360 365
Arg Leu Pro Ser Arg Glu Gly Ser Ile Glu Glu Asn Phe Leu Gln Phe
370 375 380
Leu Gln Gly Thr Gly Cys Pro Ser Glu Ser Trp Val Ser Arg Pro Leu
385 390 395 400
Pro Ser Pro Lys Gln Glu Pro Pro Ala Val Asp Phe Arg Ile Pro Gly
405 410 415
Gln Ile Ala Glu Glu Thr Ser Glu Phe Leu Glu Gln Gln Leu Thr Ser
420 425 430
Asp Ile Ile Met Ser Asp Ser Tyr Leu Arg Pro Ala Ala Ser Pro Arg
435 440 445
Leu Glu Ser
450
<210>13
<211>1041
<212>DNA
<213>智人(Homo sapiens)
<400>13
atggagagaa aatttatgtc cttgcaacca tccatctccg tatcagaaat ggaaccaaat 60
ggcaccttca gcaataacaa cagcaggaac tgcacaattg aaaacttcaa gagagaattt 120
ttcccaattg tatatctgat aatatttttc tggggagtct tgggaaatgg gttgtccata 180
tatgttttcc tgcagcctta taagaagtcc acatctgtga acgttttcat gctaaatctg 240
gccatttcag atctcctgtt cataagcacg cttcccttca gggctgacta ttatcttaga 300
ggctccaatt ggatatttgg agacctggcc tgcaggatta tgtcttattc cttgtatgtc 360
aacatgtaca gcagtattta tttcctgacc gtgctgagtg ttgtgcgttt cctggcaatg 420
gttcacccct ttcggcttct gcatgtcacc agcatcagga gtgcctggat cctctgtggg 480
atcatatgga tccttatcat ggcttcctca ataatgctcc tggacagtgg ctctgagcag 540
aacggcagtg tcacatcatg cttagagctg aatctctata aaattgctaa gctgcagacc 600
atgaactata ttgccttggt ggtgggctgc ctgctgccat ttttcacact cagcatctgt 660
tatctgctga tcattcgggt tctgttaaaa gtggaggtcc cagaatcggg gctgcgggtt 720
tctcacagga aggcactgac caccatcatc atcaccttga tcatcttctt cttgtgtttc 780
ctgccctatc acacactgag gaccgtccac ttgacgacat ggaaagtggg tttatgcaaa 840
gacagactgc ataaagcttt ggttatcaca ctggccttgg cagcagccaa tgcctgcttc 900
aatcctctgc tctattactt tgctggggag aattttaagg acagactaaa gtctgcactc 960
agaaaaggcc atccacagaa ggcaaagaca aagtgtgttt tccctgttag tgtgtggttg 1020
agaaaggaaa caagagtata a 1041
<210>14
<211>346
<212>PRT
<213>智人(Homo sapiens)
<400>14
Met Glu Arg Lys Phe Met Ser Leu Gln Pro Ser Ile Ser Val Ser Glu
1 5 10 15
Met Glu Pro Asn Gly Thr Phe Ser Asn Asn Asn Ser Arg Asn Cys Thr
20 25 30
Ile Glu Asn Phe Lys Arg Glu Phe Phe Pro Ile Val Tyr Leu Ile Ile
35 40 45
Phe Phe Trp Gly Val Leu Gly Asn Gly Leu Ser Ile Tyr Val Phe Leu
50 55 60
Gln Pro Tyr Lys Lys Ser Thr Ser Val Asn Val Phe Met Leu Asn Leu
65 70 75 80
Ala Ile Ser Asp Leu Leu Phe Ile Ser Thr Leu Pro Phe Arg Ala Asp
85 90 95
Tyr Tyr Leu Arg Gly Ser Asn Trp Ile Phe Gly Asp Leu Ala Cys Arg
100 105 110
Ile Met Ser Tyr Ser Leu Tyr Val Asn Met Tyr Ser Ser Ile Tyr Phe
115 120 125
Leu Thr Val Leu Ser Val Val Arg Phe Leu Ala Met Val His Pro Phe
130 135 140
Arg Leu Leu His Val Thr Ser Ile Arg Ser Ala Trp Ile Leu Cys Gly
145 150 155 160
Ile Ile Trp Ile Leu Ile Met Ala Ser Ser Ile Met Leu Leu Asp Ser
165 170 175
Gly Ser Glu Gln Asn Gly Ser Val Thr Ser Cys Leu Glu Leu Asn Leu
180 185 190
Tyr Lys Ile Ala Lys Leu Gln Thr Met Asn Tyr Ile Ala Leu Val Val
195 200 205
Gly Cys Leu Leu Pro Phe Phe Thr Leu Ser Ile Cys Tyr Leu Leu Ile
210 215 220
Ile Arg Val Leu Leu Lys Val Glu Val Pro Glu Ser Gly Leu Arg Val
225 230 235 240
Ser His Arg Lys Ala Leu Thr Thr Ile Ile Ile Thr Leu Ile Ile Phe
245 250 255
Phe Leu Cys Phe Leu Pro Tyr His Thr Leu Arg Thr Val His Leu Thr
260 265 270
Thr Trp Lys Val Gly Leu Cys Lys Asp Arg Leu His Lys Ala Leu Val
275 280 285
Ile Thr Leu Ala Leu Ala Ala Ala Asn Ala Cys Phe Asn Pro Leu Leu
290 295 300
Tyr Tyr Phe Ala Gly Glu Asn Phe Lys Asp Arg Leu Lys Ser Ala Leu
305 310 315 320
Arg Lys Gly His Pro Gln Lys Ala Lys Thr Lys Cys Val Phe Pro Val
325 330 335
Ser Val Trp Leu Arg Lys Glu Thr Arg Val
340 345
<210>15
<211>1527
<212>DNA
<213>智人(Homo sapiens)
<400>15
atgacgtcca cctgcaccaa cagcacgcgc gagagtaaca gcagccacac gtgcatgccc 60
ctctccaaaa tgcccatcag cctggcccac ggcatcatcc gctcaaccgt gctggttatc 120
ttcctcgccg cctctttcgt cggcaacata gtgctggcgc tagtgttgca gcgcaagccg 180
cagctgctgc aggtgaccaa ccgttttatc tttaacctcc tcgtcaccga cctgctgcag 240
atttcgctcg tggccccctg ggtggtggcc acctctgtgc ctctcttctg gcccctcaac 300
agccacttct gcacggccct ggttagcctc acccacctgt tcgccttcgc cagcgtcaac 360
accattgtcg tggtgtcagt ggatcgctac ttgtccatca tccaccctct ctcctacccg 420
tccaagatga cccagcgccg cggttacctg ctcctctatg gcacctggat tgtggccatc 480
ctgcagagca ctcctccact ctacggctgg ggccaggctg cctttgatga gcgcaatgct 540
ctctgctcca tgatctgggg ggccagcccc agctacacta ttctcagcgt ggtgtccttc 600
atcgtcattc cactgattgt catgattgcc tgctactccg tggtgttctg tgcagcccgg 660
aggcagcatg ctctgctgta caatgtcaag agacacagct tggaagtgcg agtcaaggac 720
tgtgtggaga atgaggatga agagggagca gagaagaagg aggagttcca ggatgagagt 780
gagtttcgcc gccagcatga aggtgaggtc aaggccaagg agggcagaat ggaagccaag 840
gacggcagcc tgaaggccaa ggaaggaagc acggggacca gtgagagtag tgtagaggcc 900
aggggcagcg aggaggtcag agagagcagc acggtggcca gcgacggcag catggagggt 960
aaggaaggca gcaccaaagt tgaggagaac agcatgaagg cagacaaggg tcgcacagag 1020
gtcaaccagt gcagcattga cttgggtgaa gatgacatgg agtttggtga agacgacatc 1080
aatttcagtg aggatgacgt cgaggcagtg aacatcccgg agagcctccc acccagtcgt 1140
cgtaacagca acagcaaccc tcctctgccc aggtgctacc agtgcaaagc tgctaaagtg 1200
atcttcatca tcattttctc ctatgtgcta tccctggggc cctactgctt tttagcagtc 1260
ctggccgtgt gggtggatgt cgaaacccag gtaccccagt gggtgatcac cataatcatc 1320
tggcttttct tcctgcagtg ctgcatccac ccctatgtct atggctacat gcacaagacc 1380
attaagaagg aaatccagga catgctgaag aagttcttct gcaaggaaaa gcccccgaaa 1440
gaagatagcc acccagacct gcccggaaca gagggtggga ctgaaggcaa gattgtccct 1500
tcctacgatt ctgctacttt tccttga 1527
<210>16
<211>508
<212>PRT
<213>智人(Homo sapiens)
<400>16
Met Thr Ser Thr Cys Thr Asn Ser Thr Arg Glu Ser Asn Ser Ser His
1 5 10 15
Thr Cys Met Pro Leu Ser Lys Met Pro Ile Ser Leu Ala His Gly Ile
20 25 30
Ile Arg Ser Thr Val Leu Val Ile Phe Leu Ala Ala Ser Phe Val Gly
35 40 45
Asn Ile Val Leu Ala Leu Val Leu Gln Arg Lys Pro Gln Leu Leu Gln
50 55 60
Val Thr Asn Arg Phe Ile Phe Asn Leu Leu Val Thr Asp Leu Leu Gln
65 70 75 80
Ile Ser Leu Val Ala Pro Trp Val Val Ala Thr Ser Val Pro Leu Phe
85 90 95
Trp Pro Leu Asn Ser His Phe Cys Thr Ala Leu Val Ser Leu Thr His
100 105 110
Leu Phe Ala Phe Ala Ser Val Asn Thr Ile Val Val Val Ser Val Asp
115 120 125
Arg Tyr Leu Ser Ile Ile His Pro Leu Ser Tyr Pro Ser Lys Met Thr
130 135 140
Gln Arg Arg Gly Tyr Leu Leu Leu Tyr Gly Thr Trp Ile Val Ala Ile
145 150 155 160
Leu Gln Ser Thr Pro Pro Leu Tyr Gly Trp Gly Gln Ala Ala Phe Asp
165 170 175
Glu Arg Asn Ala Leu Cys Ser Met Ile Trp Gly Ala Ser Pro Ser Tyr
180 185 190
Thr Ile Leu Ser Val Val Ser Phe Ile Val Ile Pro Leu Ile Val Met
195 200 205
Ile Ala Cys Tyr Ser Val Val Phe Cys Ala Ala Arg Arg Gln His Ala
210 215 220
Leu Leu Tyr Asn Val Lys Arg His Ser Leu Glu Val Arg Val Lys Asp
225 230 235 240
Cys Val Glu Asn Glu Asp Glu Glu Gly Ala Glu Lys Lys Glu Glu Phe
245 250 255
Gln Asp Glu Ser Glu Phe Arg Arg Gln His Glu Gly Glu Val Lys Ala
260 265 270
Lys Glu Gly Arg Met Glu Ala Lys Asp Gly Ser Leu Lys Ala Lys Glu
275 280 285
Gly Ser Thr Gly Thr Ser Glu Ser Ser Val Glu Ala Arg Gly Ser Glu
290 295 300
Glu Val Arg Glu Ser Ser Thr Val Ala Ser Asp Gly Ser Met Glu Gly
305 310 315 320
Lys Glu Gly Ser Thr Lys Val Glu Glu Asn Ser Met Lys Ala Asp Lys
325 330 335
Gly Arg Thr Glu Val Asn Gln Cys Ser Ile Asp Leu Gly Glu Asp Asp
340 345 350
Met Glu Phe Gly Glu Asp Asp Ile Asn Phe Ser Glu Asp Asp Val Glu
355 360 365
Ala Val Asn Ile Pro Glu Ser Leu Pro Pro Ser Arg Arg Asn Ser Asn
370 375 380
Ser Asn Pro Pro Leu Pro Arg Cys Tyr Gln Cys Lys Ala Ala Lys Val
385 390 395 400
Ile Phe Ile Ile Ile Phe Ser Tyr Val Leu Ser Leu Gly Pro Tyr Cys
405 410 415
Phe Leu Ala Val Leu Ala Val Trp Val Asp Val Glu Thr Gln Val Pro
420 425 430
Gln Trp Val Ile Thr Ile Ile Ile Trp Leu Phe Phe Leu Gln Cys Cys
435 440 445
Ile His Pro Tyr Val Tyr Gly Tyr Met His Lys Thr Ile Lys Lys Glu
450 455 460
Ile Gln Asp Met Leu Lys Lys Phe Phe Cys Lys Glu Lys Pro Pro Lys
465 470 475 480
Glu Asp Ser His Pro Asp Leu Pro Gly Thr Glu Gly Gly Thr Glu Gly
485 490 495
Lys Ile Val Pro Ser Tyr Asp Ser Ala Thr Phe Pro
500 505
<210>17
<211>1068
<212>DNA
<213>智人(Homo sapiens)
<400>17
atgcccttga cggacggcat ttcttcattt gaggacctct tggctaacaa tatcctcaga 60
atatttgtct gggttatagc tttcattacc tgctttggaa atctttttgt cattggcatg 120
agatctttca ttaaagctga aaatacaact cacgctatgt ccatcaaaat cctttgttgc 180
gctgattgcc tgatgggtgt ttacttgttc tttgttggca ttttcgatat aaaataccga 240
gggcagtatc agaagtatgc cttgctgtgg atggagagcg tgcagtgccg cctcatgggg 300
ttcctggcca tgctgtccac cgaagtctct gttctgctac tgacctactt gactttggag 360
aagttcctgg tcattgtctt ccccttcagt aacattcgac ctggaaaacg gcagacctca 420
gtcatcctca tttgcatctg gatggcggga tttttaatag ctgtaattcc attttggaat 480
aaggattatt ttggaaactt ttatgggaaa aatggagtat gtttcccact ttattatgac 540
caaacagaag atattggaag caaagggtat tctcttggaa ttttcctagg tgtgaacttg 600
ctggcttttc tcatcattgt gttttcctat attactatgt tctgttccat tcaaaaaacc 660
gccttgcaga ccacagaagt aaggaattgt tttggaagag aggtggctgt tgcaaatcgt 720
ttctttttta tagtgttctc tgatgccatc tgctggattc ctgtatttgt agttaaaatc 780
ctttccctct tccgggtgga aataccagac acaatgactt cctggatagt gatttttttc 840
cttccagtta acagtgcttt gaatccaatc ctctatactc tcacaaccaa cttttttaag 900
gacaagttga aacagctgct gcacaaacat cagaggaaat caattttcaa aattaaaaaa 960
aaaagtttat ctacatccat tgtgtggata gaggactcct cttccctgaa acttggggtt 1020
ttgaacaaaa taacacttgg agacagtata atgaaaccag tttcctag 1068
<210>18
<211>355
<212>PRT
<213>智人(Homo sapiens)
<400>18
Met Pro Leu Thr Asp Gly Ile Ser Ser Phe Glu Asp Leu Leu Ala Asn
1 5 10 15
Asn Ile Leu Arg Ile Phe Val Trp Val Ile Ala Phe Ile Thr Cys Phe
20 25 30
Gly Asn Leu Phe Val Ile Gly Met Arg Ser Phe Ile Lys Ala Glu Asn
35 40 45
Thr Thr His Ala Met Ser Ile Lys Ile Leu Cys Cys Ala Asp Cys Leu
50 55 60
Met Gly Val Tyr Leu Phe Phe Val Gly Ile Phe Asp Ile Lys Tyr Arg
65 70 75 80
Gly Gln Tyr Gln Lys Tyr Ala Leu Leu Trp Met Glu Ser Val Gln Cys
85 90 95
Arg Leu Met Gly Phe Leu Ala Met Leu Ser Thr Glu Val Ser Val Leu
100 105 110
Leu Leu Thr Tyr Leu Thr Leu Glu Lys Phe Leu Val Ile Val Phe Pro
115 120 125
Phe Ser Asn Ile Arg Pro Gly Lys Arg Gln Thr Ser Val Ile Leu Ile
130 135 140
Cys Ile Trp Met Ala Gly Phe Leu Ile Ala Val Ile Pro Phe Trp Asn
145 150 155 160
Lys Asp Tyr Phe Gly Asn Phe Tyr Gly Lys Asn Gly Val Cys Phe Pro
165 170 175
Leu Tyr Tyr Asp Gln Thr Glu Asp Ile Gly Ser Lys Gly Tyr Ser Leu
180 185 190
Gly Ile Phe Leu Gly Val Asn Leu Leu Ala Phe Leu Ile Ile Val Phe
195 200 205
Ser Tyr Ile Thr Met Phe Cys Ser Ile Gln Lys Thr Ala Leu Gln Thr
210 215 220
Thr Glu Val Arg Asn Cys Phe Gly Arg Glu Val Ala Val Ala Asn Arg
225 230 235 240
Phe Phe Phe Ile Val Phe Ser Asp Ala Ile Cys Trp Ile Pro Val Phe
245 250 255
Val Val Lys Ile Leu Ser Leu Phe Arg Val Glu Ile Pro Asp Thr Met
260 265 270
Thr Ser Trp Ile Val Ile Phe Phe Leu Pro Val Asn Ser Ala Leu Asn
275 280 285
Pro Ile Leu Tyr Thr Leu Thr Thr Asn Phe Phe Lys Asp Lys Leu Lys
290 295 300
Gln Leu Leu His Lys His Gln Arg Lys Ser Ile Phe Lys Ile Lys Lys
305 310 315 320
Lys Ser Leu Ser Thr Ser Ile Val Trp Ile Glu Asp Ser Ser Ser Leu
325 330 335
Lys Leu Gly Val Leu Asn Lys Ile Thr Leu Gly Asp Ser Ile Met Lys
340 345 350
Pro Val Ser
355
<210>19
<211>969
<212>DNA
<213>智人(Homo sapiens)
<400>19
atggatccaa ccatctcaac cttggacaca gaactgacac caatcaacgg aactgaggag 60
actctttgct acaagcagac cttgagcctc acggtgctga cgtgcatcgt ttcccttgtc 120
gggctgacag gaaacgcagt tgtgctctgg ctcctgggct gccgcatgcg caggaacgcc 180
ttctccatct acatcctcaa cttggccgca gcagacttcc tcttcctcag cggccgcctt 240
atatattccc tgttaagctt catcagtatc ccccatacca tctctaaaat cctctatcct 300
gtgatgatgt tttcctactt tgcaggcctg agctttctga gtgccgtgag caccgagcgc 360
tgcctgtccg tcctgtggcc catctggtac cgctgccacc gccccacaca cctgtcagcg 420
gtggtgtgtg tcctgctctg ggccctgtcc ctgctgcgga gcatcctgga gtggatgtta 480
tgtggcttcc tgttcagtgg tgctgattct gcttggtgtc aaacatcaga tttcatcaca 540
gtcgcgtggc tgattttttt atgtgtggtt ctctgtgggt ccagcctggt cctgctgatc 600
aggattctct gtggatcccg gaagataccg ctgaccaggc tgtacgtgac catcctgctc 660
acagtactgg tcttcctcct ctgtggcctg ccctttggca ttcagttttt cctattttta 720
tggatccacg tggacaggga agtcttattt tgtcatgttc atctagtttc tattttcctg 780
tccgctctta acagcagtgc caaccccatc atttacttct tcgtgggctc ctttaggcag 840
cgtcaaaata ggcagaacct gaagctggtt ctccagaggg ctctgcagga cgcgtctgag 900
gtggatgaag gtggagggca gcttcctgag gaaatcctgg agctgtcggg aagcagattg 960
gagcagtga 969
<210>20
<211>322
<212>PRT
<213>智人(Homo sapiens)
<400>20
Met Asp Pro Thr Ile Ser Thr Leu Asp Thr Glu Leu Thr Pro Ile Asn
1 5 10 15
Gly Thr Glu Glu Thr Leu Cys Tyr Lys Gln Thr Leu Ser Leu Thr Val
20 25 30
Leu Thr Cys Ile Val Ser Leu Val Gly Leu Thr Gly Asn Ala Val Val
35 40 45
Leu Trp Leu Leu Gly Cys Arg Met Arg Arg Asn Ala Phe Ser Ile Tyr
50 55 60
Ile Leu Asn Leu Ala Ala Ala Asp Phe Leu Phe Leu Ser Gly Arg Leu
65 70 75 80
Ile Tyr Ser Leu Leu Ser Phe Ile Ser Ile Pro His Thr Ile Ser Lys
85 90 95
Ile Leu Tyr Pro Val Met Met Phe Ser Tyr Phe Ala Gly Leu Ser Phe
100 105 110
Leu Ser Ala Val Ser Thr Glu Arg Cys Leu Ser Val Leu Trp Pro Ile
115 120 125
Trp Tyr Arg Cys His Arg Pro Thr His Leu Ser Ala Val Val Cys Val
130 135 140
Leu Leu Trp Ala Leu Ser Leu Leu Arg Ser Ile Leu Glu Trp Met Leu
145 150 155 160
Cys Gly Phe Leu Phe Ser Gly Ala Asp Ser Ala Trp Cys Gln Thr Ser
165 170 175
Asp Phe Ile Thr Val Ala Trp Leu Ile Phe Leu Cys Val Val Leu Cys
180 185 190
Gly Ser Ser Leu Val Leu Leu Ile Arg Ile Leu Cys Gly Ser Arg Lys
195 200 205
Ile Pro Leu Thr Arg Leu Tyr Val Thr Ile Leu Leu Thr Val Leu Val
210 215 220
Phe Leu Leu Cys Gly Leu Pro Phe Gly Ile Gln Phe Phe Leu Phe Leu
225 230 235 240
Trp Ile His Val Asp Arg Glu Val Leu Phe Cys His Val His Leu Val
245 250 255
Ser Ile Phe Leu Ser Ala Leu Asn Ser Ser Ala Asn Pro Ile Ile Tyr
260 265 270
Phe Phe Val Gly Ser Phe Arg Gln Arg Gln Asn Arg Gln Asn Leu Lys
275 280 285
Leu Val Leu Gln Arg Ala Leu Gln Asp Ala Ser Glu Val Asp Glu Gly
290 295 300
Gly Gly Gln Leu Pro Glu Glu Ile Leu Glu Leu Ser Gly Ser Arg Leu
305 310 315 320
Glu Gln
<210>21
<211>1305
<212>DNA
<213>智人(Homo sapiens)
<400>21
atggaggatc tctttagccc ctcaattctg ccgccggcgc ccaacatttc cgtgcccatc 60
ttgctgggct ggggtctcaa cctgaccttg gggcaaggag cccctgcctc tgggccgccc 120
agccgccgcg tccgcctggt gttcctgggg gtcatcctgg tggtggcggt ggcaggcaac 180
accacagtgc tgtgccgcct gtgcggcggc ggcgggccct gggcgggccc caagcgtcgc 240
aagatggact tcctgctggt gcagctggcc ctggcggacc tgtacgcgtg cgggggcacg 300
gcgctgtcac agctggcctg ggaactgctg ggcgagcccc gcgcggccac gggggacctg 360
gcgtgccgct tcctgcagct gctgcaggca tccgggcggg gcgcctcggc ccacctcgtg 420
gtgctcatcg ccctcgagcg ccggcgcgcg gtgcgtcttc cgcacggccg gccgctgccc 480
gcgcgtgccc tcgccgccct gggctggctg ctggcactgc tgctggcgct gcccccggcc 540
ttcgtggtgc gcggggactc cccctcgccg ctgccgccgc cgccgccgcc aacgtccctg 600
cagccaggcg cgcccccggc cgcccgcgcc tggccggggg agcgtcgctg ccacgggatc 660
ttcgcgcccc tgccgcgctg gcacctgcag gtctacgcgt tctacgaggc cgtcgcgggc 720
ttcgtcgcgc ctgttacggt cctgggcgtc gcttgcggcc acctactctc cgtctggtgg 780
cggcaccggc cgcaggcccc cgcggctgca gcgccctggt cggcgagccc aggtcgagcc 840
cctgcgccca gcgcgctgcc ccgcgccaag gtgcagagcc tgaagatgag cctgctgctg 900
gcgctgctgt tcgtgggctg cgagctgccc tactttgccg cccggctggc ggccgcgtgg 960
tcgtccgggc ccgcgggaga ctgggaggga gagggcctgt cggcggcgct gcgcgtggtg 1020
gcgatggcca acagcgctct caatcccttc gtctacctct tcttccaggc gggcgactgc 1080
cggctccggc gacagctgcg gaagcggctg ggctctctgt gctgcgcgcc gcagggaggc 1140
gcggaggacg aggaggggcc ccggggccac caggcgctct accgccaacg ctggccccac 1200
cctcattatc accatgctcg gcgggaaccg ctggacgagg gcggcttgcg cccaccccct 1260
ccgcgcccca gacccctgcc ttgctcctgc gaaagtgcct tctag 1305
<210>22
<211>434
<212>PRT
<213>智人(Homo sapiens)
<400>22
Met Glu Asp Leu Phe Ser Pro Ser Ile Leu Pro Pro Ala Pro Asn Ile
1 5 10 15
Ser Val Pro Ile Leu Leu Gly Trp Gly Leu Asn Leu Thr Leu Gly Gln
20 25 30
Gly Ala Pro Ala Ser Gly Pro Pro Ser Arg Arg Val Arg Leu Val Phe
35 40 45
Leu Gly Val Ile Leu Val Val Ala Val Ala Gly Asn Thr Thr Val Leu
50 55 60
Cys Arg Leu Cys Gly Gly Gly Gly Pro Trp Ala Gly Pro Lys Arg Arg
65 70 75 80
Lys Met Asp Phe Leu Leu Val Gln Leu Ala Leu Ala Asp Leu Tyr Ala
85 90 95
Cys Gly Gly Thr Ala Leu Ser Gln Leu Ala Trp Glu Leu Leu Gly Glu
100 105 110
Pro Arg Ala Ala Thr Gly Asp Leu Ala Cys Arg Phe Leu Gln Leu Leu
115 120 125
Gln Ala Ser Gly Arg Gly Ala Ser Ala His Leu Val Val Leu Ile Ala
130 135 140
Leu Glu Arg Arg Arg Ala Val Arg Leu Pro His Gly Arg Pro Leu Pro
145 150 155 160
Ala Arg Ala Leu Ala Ala Leu Gly Trp Leu Leu Ala Leu Leu Leu Ala
165 170 175
Leu Pro Pro Ala Phe Val Val Arg Gly Asp Ser Pro Ser Pro Leu Pro
180 185 190
Pro Pro Pro Pro Pro Thr Ser Leu Gln Pro Gly Ala Pro Pro Ala Ala
195 200 205
Arg Ala Trp Pro Gly Glu Arg Arg Cys His Gly Ile Phe Ala Pro Leu
210 215 220
Pro Arg Trp His Leu Gln Val Tyr Ala Phe Tyr Glu Ala Val Ala Gly
225 230 235 240
Phe Val Ala Pro Val Thr Val Leu Gly Val Ala Cys Gly His Leu Leu
245 250 255
Ser Val Trp Trp Arg His Arg Pro Gln Ala Pro Ala Ala Ala Ala Pro
260 265 270
Trp Ser Ala Ser Pro Gly Arg Ala Pro Ala Pro Ser Ala Leu Pro Arg
275 280 285
Ala Lys Val Gln Ser Leu Lys Met Ser Leu Leu Leu Ala Leu Leu Phe
290 295 300
Val Gly Cys Glu Leu Pro Tyr Phe Ala Ala Arg Leu Ala Ala Ala Trp
305 310 315 320
Ser Ser Gly Pro Ala Gly Asp Trp Glu Gly Glu Gly Leu Ser Ala Ala
325 330 335
Leu Arg Val Val Ala Met Ala Asn Ser Ala Leu Asn Pro Phe Val Tyr
340 345 350
Leu Phe Phe Gln Ala Gly Asp Cys Arg Leu Arg Arg Gln Leu Arg Lys
355 360 365
Arg Leu Gly Ser Leu Cys Cys Ala Pro Gln Gly Gly Ala Glu Asp Glu
370 375 380
Glu Gly Pro Arg Gly His Gln Ala Leu Tyr Arg Gln Arg Trp Pro His
385 390 395 400
Pro His Tyr His His Ala Arg Arg Glu Pro Leu Asp Glu Gly Gly Leu
405 410 415
Arg Pro Pro Pro Pro Arg Pro Arg Pro Leu Pro Cys Ser Cys Glu Ser
420 425 430
Ala Phe
<210>23
<211>1041
<212>DNA
<213>智人(Homo sapiens)
<400>23
atgtacaacg ggtcgtgctg ccgcatcgag ggggacacca tctcccaggt gatgccgccg 60
ctgctcattg tggcctttgt gctgggcgca ctaggcaatg gggtcgccct gtgtggtttc 120
tgcttccaca tgaagacctg gaagcccagc actgtttacc ttttcaattt ggccgtggct 180
gatttcctcc ttatgatctg cctgcctttt cggacagact attacctcag acgtagacac 240
tgggcttttg gggacattcc ctgccgagtg gggctcttca cgttggccat gaacagggcc 300
gggagcatcg tgttccttac ggtggtggct gcggacaggt atttcaaagt ggtccacccc 360
caccacgcgg tgaacactat ctccacccgg gtggcggctg gcatcgtctg caccctgtgg 420
gccctggtca tcctgggaac agtgtatctt ttgctggaga accatctctg cgtgcaagag 480
acggccgtct cctgtgagag cttcatcatg gagtcggcca atggctggca tgacatcatg 540
ttccagctgg agttctttat gcccctcggc atcatcttat tttgctcctt caagattgtt 600
tggagcctga ggcggaggca gcagctggcc agacaggctc ggatgaagaa ggcgacccgg 660
ttcatcatgg tggtggcaat tgtgttcatc acatgctacc tgcccagcgt gtctgctaga 720
ctctatttcc tctggacggt gccctcgagt gcctgcgatc cctctgtcca tggggccctg 780
cacataaccc tcagcttcac ctacatgaac agcatgctgg atcccctggt gtattatttt 840
tcaagcccct cctttcccaa attctacaac aagctcaaaa tctgcagtct gaaacccaag 900
cagccaggac actcaaaaac acaaaggccg gaagagatgc caatttcgaa cctcggtcgc 960
aggagttgca tcagtgtggc aaatagtttc caaagccagt ctgatgggca atgggatccc 1020
cacattgttg agtggcactg a 1041
<210>24
<211>346
<212>PRT
<213>智人(Homo sapiens)
<400>24
Met Tyr Asn Gly Ser Cys Cys Arg Ile Glu Gly Asp Thr Ile Ser Gln
1 5 10 15
Val Met Pro Pro Leu Leu Ile Val Ala Phe Val Leu Gly Ala Leu Gly
20 25 30
Asn Gly Val Ala Leu Cys Gly Phe Cys Phe His Met Lys Thr Trp Lys
35 40 45
Pro Ser Thr Val Tyr Leu Phe Asn Leu Ala Val Ala Asp Phe Leu Leu
50 55 60
Met Ile Cys Leu Pro Phe Arg Thr Asp Tyr Tyr Leu Arg Arg Arg His
65 70 75 80
Trp Ala Phe Gly Asp Ile Pro Cys Arg Val Gly Leu Phe Thr Leu Ala
85 90 95
Met Asn Arg Ala Gly Ser Ile Val Phe Leu Thr Val Val Ala Ala Asp
100 105 110
Arg Tyr Phe Lys Val Val His Pro His His Ala Val Asn Thr Ile Ser
115 120 125
Thr Arg Val Ala Ala Gly Ile Val Cys Thr Leu Trp Ala Leu Val Ile
130 135 140
Leu Gly Thr Val Tyr Leu Leu Leu Glu Asn His Leu Cys Val Gln Glu
145 150 155 160
Thr Ala Val Ser Cys Glu Ser Phe Ile Met Glu Ser Ala Asn Gly Trp
165 170 175
His Asp Ile Met Phe Gln Leu Glu Phe Phe Met Pro Leu Gly Ile Ile
180 185 190
Leu Phe Cys Ser Phe Lys Ile Val Trp Ser Leu Arg Arg Arg Gln Gln
195 200 205
Leu Ala Arg Gln Ala Arg Met Lys Lys Ala Thr Arg Phe Ile Met Val
210 215 220
Val Ala Ile Val Phe Ile Thr Cys Tyr Leu Pro Ser Val SerAla Arg
225 230 235 240
Leu Tyr Phe Leu Trp Thr Val Pro Ser Ser Ala Cys Asp Pro Ser Val
245 250 255
His Gly Ala Leu His Ile Thr Leu Ser Phe Thr Tyr Met Asn Ser Met
260 265 270
Leu Asp Pro Leu Val Tyr Tyr Phe Ser Ser Pro Ser Phe Pro Lys Phe
275 280 285
Tyr Asn Lys Leu Lys Ile Cys Ser Leu Lys Pro Lys Gln Pro Gly His
290 295 300
Ser Lys Thr Gln Arg Pro Glu Glu Met Pro Ile Ser Asn Leu Gly Arg
305 310 315 320
Arg Ser Cys Ile Ser Val Ala Asn Ser Phe Gln Ser Gln Ser Asp Gly
325 330 335
Gln Trp Asp Pro His Ile Val Glu Trp His
340 345
<210>25
<211>1011
<212>DNA
<213>智人(Homo sapiens)
<400>25
atgaacaaca atacaacatg tattcaacca tctatgatct cttccatggc tttaccaatc 60
atttacatcc tcctttgtat tgttggtgtt tttggaaaca ctctctctca atggatattt 120
ttaacaaaaa taggtaaaaa aacatcaacg cacatctacc tgtcacacct tgtgactgca 180
aacttacttg tgtgcagtgc catgcctttc atgagtatct atttcctgaa aggtttccaa 240
tgggaatatc aatctgctca atgcagagtg gtcaattttc tgggaactct atccatgcat 300
gcaagtatgt ttgtcagtct cttaatttta agttggattg ccataagccg ctatgctacc 360
ttaatgcaaa aggattcctc gcaagagact acttcatgct atgagaaaat attttatggc 420
catttactga aaaaatttcg ccagcccaac tttgctagaa aactatgcat ttacatatgg 480
ggagttgtac tgggcataat cattccagtt accgtatact actcagtcat agaggctaca 540
gaaggagaag agagcctatg ctacaatcgg cagatggaac taggagccat gatctctcag 600
attgcaggtc tcattggaac cacatttatt ggattttcct ttttagtagt actaacatca 660
tactactctt ttgtaagcca tctgagaaaa ataagaacct gtacgtccat tatggagaaa 720
gatttgactt acagttctgt gaaaagacat cttttggtca tccagattct actaatagtt 780
tgcttccttc cttatagtat ttttaaaccc attttttatg ttctacacca aagagataac 840
tgtcagcaat tgaattattt aatagaaaca aaaaacattc tcacctgtct tgcttcggcc 900
agaagtagca cagaccccat tatatttctt ttattagata aaacattcaa gaagacacta 960
tataatctct ttacaaagtc taattcagca catatgcaat catatggttg a 1011
<210>26
<211>336
<212>PRT
<213>智人(Homo sapiens)
<400>26
Met Asn Asn Asn Thr Thr Cys Ile Gln Pro Ser Met Ile Ser Ser Met
1 5 10 15
Ala Leu Pro Ile Ile Tyr Ile Leu Leu Cys Ile Val Gly Val Phe Gly
20 25 30
Asn Thr Leu Ser Gln Trp Ile Phe Leu Thr Lys Ile Gly Lys Lys Thr
35 40 45
Ser Thr His Ile Tyr Leu Ser His Leu Val Thr Ala Asn Leu Leu Val
50 55 60
Cys Ser Ala Met Pro Phe Met Ser Ile Tyr Phe Leu Lys Gly Phe Gln
65 70 75 80
Trp Glu Tyr Gln Ser Ala Gln Cys Arg Val Val Asn Phe Leu Gly Thr
85 90 95
Leu Ser Met His Ala Ser Met Phe Val Ser Leu Leu Ile Leu Ser Trp
100 105 110
Ile Ala Ile Ser Arg Tyr Ala Thr Leu Met Gln Lys Asp Ser Ser Gln
115 120 125
Glu Thr Thr Ser Cys Tyr Glu Lys Ile Phe Tyr Gly His Leu Leu Lys
130 135 140
Lys Phe Arg Gln Pro Asn Phe Ala Arg Lys Leu Cys Ile Tyr Ile Trp
145 150 155 160
Gly Val Val Leu Gly Ile Ile Ile Pro Val Thr Val Tyr Tyr Ser Val
165 170 175
Ile Glu Ala Thr Glu Gly Glu Glu Ser Leu Cys Tyr Asn Arg Gln Met
180 185 190
Glu Leu Gly Ala Met Ile Ser Gln Ile Ala Gly Leu Ile Gly Thr Thr
195 200 205
Phe Ile Gly Phe Ser Phe Leu Val Val Leu Thr Ser Tyr Tyr Ser Phe
210 215 220
Val Ser His Leu Arg Lys Ile Arg Thr Cys Thr Ser Ile Met Glu Lys
225 230 235 240
Asp Leu Thr Tyr Ser Ser Val Lys Arg His Leu Leu Val Ile Gln Ile
245 250 255
Leu Leu Ile Val Cys Phe Leu Pro Tyr Ser Ile Phe Lys Pro Ile Phe
260 265 270
Tyr Val Leu His Gln Arg Asp Asn Cys Gln Gln Leu Asn Tyr Leu Ile
275 280 285
Glu Thr Lys Asn Ile Leu Thr Cys Leu Ala Ser Ala Arg Ser Ser Thr
290 295 300
Asp Pro Ile Ile Phe Leu Leu Leu Asp Lys Thr Phe Lys Lys Thr Leu
305 310 315 320
Tyr Asn Leu Phe Thr Lys Ser Asn Ser Ala His Met Gln Ser Tyr Gly
325 330 335
<210>27
<211>1014
<212>DNA
<213>智人(Homo sapiens)
<400>27
atgaatgagc cactagacta tttagcaaat gcttctgatt tccccgatta tgcagctgct 60
tttggaaatt gcactgatga aaacatccca ctcaagatgc actacctccc tgttatttat 120
ggcattatct tcctcgtggg atttccaggc aatgcagtag tgatatccac ttacattttc 180
aaaatgagac cttggaagag cagcaccatc attatgctga acctggcctg cacagatctg 240
ctgtatctga ccagcctccc cttcctgatt cactactatg ccagtggcga aaactggatc 300
tttggagatt tcatgtgtaa gtttatccgc ttcagcttcc atttcaacct gtatagcagc 360
atcctcttcc tcacctgttt cagcatcttc cgctactgtg tgatcattca cccaatgagc 420
tgcttttcca ttcacaaaac tcgatgtgca gttgtagcct gtgctgtggt gtggatcatt 480
tcactggtag ctgtcattcc gatgaccttc ttgatcacat caaccaacag gaccaacaga 540
tcagcctgtc tcgacctcac cagttcggat gaactcaata ctattaagtg gtacaacctg 600
attttgactg caactacttt ctgcctcccc ttggtgatag tgacactttg ctataccacg 660
attatccaca ctctgaccca tggactgcaa actgacagct gccttaagca gaaagcacga 720
aggctaacca ttctgctact ccttgcattt tacgtatgtt ttttaccctt ccatatcttg 780
agggtcattc ggatcgaatc tcgcctgctt tcaatcagtt gttccattga gaatcagatc 840
catgaagctt acatcgtttc tagaccatta gctgctctga acacctttgg taacctgtta 900
ctatatgtgg tggtcagcga caactttcag caggctgtct gctcaacagt gagatgcaaa 960
gtaagcggga accttgagca agcaaagaaa attagttact caaacaaccc ttga 1014
<210>28
<211>337
<212>PRT
<213>智人(Homo sapiens)
<400>28
Met Asn Glu Pro Leu Asp Tyr Leu Ala Asn Ala Ser Asp Phe Pro Asp
1 5 10 15
Tyr Ala Ala Ala Phe Gly Asn Cys Thr Asp Glu Asn Ile Pro Leu Lys
20 25 30
Met His Tyr Leu Pro Val Ile Tyr Gly Ile Ile Phe Leu Val Gly Phe
35 40 45
Pro Gly Asn Ala Val Val Ile Ser Thr Tyr Ile Phe Lys Met Arg Pro
50 55 60
Trp Lys Ser Ser Thr Ile Ile Met Leu Asn Leu Ala Cys Thr Asp Leu
65 70 75 80
Leu Tyr Leu Thr Ser Leu Pro Phe Leu Ile His Tyr Tyr Ala Ser Gly
85 90 95
Glu Asn Trp Ile Phe Gly Asp Phe Met Cys Lys Phe Ile Arg Phe Ser
100 105 110
Phe His Phe Asn Leu Tyr Ser Ser Ile Leu Phe Leu Thr Cys Phe Ser
115 120 125
Ile Phe Arg Tyr Cys Val Ile Ile His Pro Met Ser Cys Phe Ser Ile
130 135 140
His Lys Thr Arg Cys Ala Val Val Ala Cys Ala Val Val Trp Ile Ile
145 150 155 160
Ser Leu Val Ala Val Ile Pro Met Thr Phe Leu Ile Thr Ser Thr Asn
165 170 175
Arg Thr Asn Arg Ser Ala Cys Leu Asp Leu Thr Ser Ser Asp Glu Leu
180 185 190
Asn Thr Ile Lys Trp Tyr Asn Leu Ile Leu Thr Ala Thr Thr Phe Cys
195 200 205
Leu Pro Leu Val Ile Val Thr Leu Cys Tyr Thr Thr Ile Ile His Thr
210 215 220
Leu Thr His Gly Leu Gln Thr Asp Ser Cys Leu Lys Gln Lys Ala Arg
225 230 235 240
Arg Leu Thr Ile Leu Leu Leu Leu Ala Phe Tyr Val Cys Phe Leu Pro
245 250 255
Phe His Ile Leu Arg Val Ile Arg Ile Glu Ser Arg Leu Leu Ser Ile
260 265 270
Ser Cys Ser Ile Glu Asn Gln Ile His Glu Ala Tyr Ile Val Ser Arg
275 280 285
Pro Leu Ala Ala Leu Asn Thr Phe Gly Asn Leu Leu Leu Tyr Val Val
290 295 300
Val Ser Asp Asn Phe Gln Gln Ala Val Cys Ser Thr Val Arg Cys Lys
305 310 315 320
Val Ser Gly Asn Leu Glu Gln Ala Lys Lys Ile Ser Tyr Ser Asn Asn
325 330 335
Pro
<210>29
<211>993
<212>DNA
<213>智人(Homo sapiens)
<400>29
atggatccaa ccaccccggc ctggggaaca gaaagtacaa cagtgaatgg aaatgaccaa 60
gcccttcttc tgctttgtgg caaggagacc ctgatcccgg tcttcctgat ccttttcatt 120
gccctggtcg ggctggtagg aaacgggttt gtgctctggc tcctgggctt ccgcatgcgc 180
aggaacgcct tctctgtcta cgtcctcagc ctggccgggg ccgacttcct cttcctctgc 240
ttccagatta taaattgcct ggtgtacctc agtaacttct tctgttccat ctccatcaat 300
ttccctagct tcttcaccac tgtgatgacc tgtgcctacc ttgcaggcct gagcatgctg 360
agcaccgtca gcaccgagcg ctgcctgtcc gtcctgtggc ccatctggta tcgctgccgc 420
cgccccagac acctgtcagc ggtcgtgtgt gtcctgctct gggccctgtc cctactgctg 480
agcatcttgg aagggaagtt ctgtggcttc ttatttagtg atggtgactc tggttggtgt 540
cagacatttg atttcatcac tgcagcgtgg ctgatttttt tattcatggt tctctgtggg 600
tccagtctgg ccctgctggt caggatcctc tgtggctcca ggggtctgcc actgaccagg 660
ctgtacctga ccatcctgct cacagtgctg gtgttcctcc tctgcggcct gccctttggc 720
attcagtggt tcctaatatt atggatctgg aaggattctg atgtcttatt ttgtcatatt 780
catccagttt cagttgtcct gtcatctctt aacagcagtg ccaaccccat catttacttc 840
ttcgtgggct cttttaggaa gcagtggcgg ctgcagcagc cgatcctcaa gctggctctc 900
cagagggctc tgcaggacat tgctgaggtg gatcacagtg aaggatgctt ccgtcagggc 960
accccggaga tgtcgagaag cagtctggtg tag 993
<210>30
<211>330
<212>PRT
<213>智人(Homo sapiens)
<400>30
Met Asp Pro Thr Thr Pro Ala Trp Gly Thr Glu Ser Thr Thr Val Asn
1 5 10 15
Gly Asn Asp Gln Ala Leu Leu Leu Leu Cys Gly Lys Glu Thr Leu Ile
20 25 30
Pro Val Phe Leu Ile Leu Phe Ile Ala Leu Val Gly Leu Val Gly Asn
35 40 45
Gly Phe Val Leu Trp Leu Leu Gly Phe Arg Met Arg Arg Asn Ala Phe
50 55 60
Ser Val Tyr Val Leu Ser Leu Ala Gly Ala Asp Phe Leu Phe Leu Cys
65 70 75 80
Phe Gln Ile Ile Asn Cys Leu Val Tyr Leu Ser Asn Phe Phe Cys Ser
85 90 95
Ile Ser Ile Asn Phe Pro Ser Phe Phe Thr Thr Val Met Thr Cys Ala
100 105 110
Tyr Leu Ala Gly Leu Ser Met Leu Ser Thr Val Ser Thr Glu Arg Cys
115 120 125
Leu Ser Val Leu Trp Pro Ile Trp Tyr Arg Cys Arg Arg Pro Arg His
130 135 140
Leu Ser Ala Val Val Cys Val Leu Leu Trp Ala Leu Ser Leu Leu Leu
145 150 155 160
Ser Ile Leu Glu Gly Lys Phe Cys Gly Phe Leu Phe Ser Asp Gly Asp
165 170 175
Ser Gly Trp Cys Gln Thr Phe Asp Phe Ile Thr Ala Ala Trp Leu Ile
180 185 190
Phe Leu Phe Met Val Leu Cys Gly Ser Ser Leu Ala Leu Leu Val Arg
195 200 205
Ile Leu Cys Gly Ser Arg Gly Leu Pro Leu Thr Arg Leu Tyr Leu Thr
210 215 220
Ile Leu Leu Thr Val Leu Val Phe Leu Leu Cys Gly Leu Pro Phe Gly
225 230 235 240
Ile Gln Trp Phe Leu Ile Leu Trp Ile Trp Lys Asp Ser Asp Val Leu
245 250 255
Phe Cys His Ile His Pro Val Ser Val Val Leu Ser Ser Leu Asn Ser
260 265 270
Ser Ala Asn Pro Ile Ile Tyr Phe Phe Val Gly Ser Phe Arg Lys Gln
275 280 285
Trp Arg Leu Gln Gln Pro Ile Leu Lys Leu Ala Leu Gln Arg Ala Leu
290 295 300
Gln Asp Ile Ala Glu Val Asp His Ser Glu Gly Cys Phe Arg Gln Gly
305 310 315 320
Thr Pro Glu Met Ser Arg Ser Ser Leu Val
325 330
<210>31
<211>1092
<212>DNA
<213>智人(Homo sapiens)
<400>31
atgggccccg gcgaggcgct gctggcgggt ctcctggtga tggtactggc cgtggcgctg 60
ctatccaacg cactggtgct gctttgttgc gcctacagcg ctgagctccg cactcgagcc 120
tcaggcgtcc tcctggtgaa tctgtcgctg ggccacctgc tgctggcggc gctggacatg 180
cccttcacgc tgctcggtgt gatgcgcggg cggacaccgt cggcgcccgg cgcatgccaa 240
gtcattggct tcctggacac cttcctggcg tccaacgcgg cgctgagcgt ggcggcgctg 300
agcgcagacc agtggctggc agtgggcttc ccactgcgct acgccggacg cctgcgaccg 360
cgctatgccg gcctgctgct gggctgtgcc tggggacagt cgctggcctt ctcaggcgct 420
gcacttggct gctcgtggct tggctacagc agcgccttcg cgtcctgttc gctgcgcctg 480
ccgcccgagc ctgagcgtcc gcgcttcgca gccttcaccg ccacgctcca tgccgtgggc 540
ttcgtgctgc cgctggcggt gctctgcctc acctcgctcc aggtgcaccg ggtggcacgc 600
agccactgcc agcgcatgga caccgtcacc atgaaggcgc tcgcgctgct cgccgacctg 660
caccccagtg tgcggcagcg ctgcctcatc cagcagaagc ggcgccgcca ccgcgccacc 720
aggaagattg gcattgctat tgcgaccttc ctcatctgct ttgccccgta tgtcatgacc 780
aggctggcgg agctcgtgcc cttcgtcacc gtgaacgccc agtggggcat cctcagcaag 840
tgcctgacct acagcaaggc ggtggccgac ccgttcacgt actctctgct ccgccggccg 900
ttccgccaag tcctggccgg catggtgcac cggctgctga agagaacccc gcgcccagca 960
tccacccatg acagctctct ggatgtggcc ggcatggtgc accagctgct gaagagaacc 1020
ccgcgcccag cgtccaccca caacggctct gtggacacag agaatgattc ctgcctgcag 1080
cagacacact ga 1092
<210>32
<211>363
<212>PRT
<213>智人(Homo sapiens)
<400>32
Met Gly Pro Gly Glu Ala Leu Leu Ala Gly Leu Leu Val Met Val Leu
1 5 10 15
Ala Val Ala Leu Leu Ser Asn Ala Leu Val Leu Leu Cys Cys Ala Tyr
20 25 30
Ser Ala Glu Leu Arg Thr Arg Ala Ser Gly Val Leu Leu Val Asn Leu
35 40 45
Ser Leu Gly His Leu Leu Leu Ala Ala Leu Asp Met Pro Phe Thr Leu
50 55 60
Leu Gly Val Met Arg Gly Arg Thr Pro Ser Ala Pro Gly Ala Cys Gln
65 70 75 80
Val Ile Gly Phe Leu Asp Thr Phe Leu Ala Ser Asn Ala Ala Leu Ser
85 90 95
Val Ala Ala Leu Ser Ala Asp Gln Trp Leu Ala Val Gly Phe Pro Leu
100 105 110
Arg Tyr Ala Gly Arg Leu Arg Pro Arg Tyr Ala Gly Leu Leu Leu Gly
115 120 125
Cys Ala Trp Gly Gln Ser Leu Ala Phe Ser Gly Ala Ala Leu Gly Cys
130 135 140
Ser Trp Leu Gly Tyr Ser Ser Ala Phe Ala Ser Cys Ser Leu Arg Leu
145 150 155 160
Pro Pro Glu Pro Glu Arg Pro Arg Phe Ala Ala Phe Thr Ala Thr Leu
165 170 175
His Ala Val Gly Phe Val Leu Pro Leu Ala Val Leu Cys Leu Thr Ser
180 185 190
Leu Gln Val His Arg Val Ala Arg Ser His Cys Gln Arg Met Asp Thr
195 200 205
Val Thr Met Lys Ala Leu Ala Leu Leu Ala Asp Leu His Pro Ser Val
210 215 220
Arg Gln Arg Cys Leu Ile Gln Gln Lys Arg Arg Arg His Arg Ala Thr
225 230 235 240
Arg Lys Ile Gly Ile Ala Ile Ala Thr Phe Leu Ile Cys Phe Ala Pro
245 250 255
Tyr Val Met Thr Arg Leu Ala Glu Leu Val Pro Phe Val Thr Val Asn
260 265 270
Ala Gln Trp Gly Ile Leu Ser Lys Cys Leu Thr Tyr Ser Lys Ala Val
275 280 285
Ala Asp Pro Phe Thr Tyr Ser Leu Leu Arg Arg Pro Phe Arg Gln Val
290 295 300
Leu Ala Gly Met Val His Arg Leu Leu Lys Arg Thr Pro Arg Pro Ala
305 310 315 320
Ser Thr His Asp Ser Ser Leu Asp Val Ala Gly Met Val His Gln Leu
325 330 335
Leu Lys Arg Thr Pro Arg Pro Ala Ser Thr His Asn Gly Ser Val Asp
340 345 350
Thr Glu Asn Asp Ser Cys Leu Gln Gln Thr His
355 360
<210>33
<211>1125
<212>DNA
<213>智人(Homo sapiens)
<400>33
atgcccacac tcaatacttc tgcctctcca cccacattct tctgggccaa tgcctccgga 60
ggcagtgtgc tgagtgctga tgatgctccg atgcctgtca aattcctagc cctgaggctc 120
atggttgccc tggcctatgg gcttgtgggg gccattggct tgctgggaaa tttggcggtg 180
ctgtgggtac tgagtaactg tgcccggaga gcccctggcc caccttcaga caccttcgtc 240
ttcaacctgg ctctggcgga cctgggactg gcactcactc tccccttttg ggcagccgag 300
tcggcactgg actttcactg gcccttcgga ggtgccctct gcaagatggt tctgacggcc 360
actgtcctca acgtctatgc cagcatcttc ctcatcacag cgctgagcgt tgctcgctac 420
tgggtggtgg ccatggctgc ggggccaggc acccacctct cactcttctg ggcccgaata 480
gccaccctgg cagtgtgggc ggcggctgcc ctggtgacgg tgcccacagc tgtcttcggg 540
gtggagggtg aggtgtgtgg tgtgcgcctt tgcctgctgc gtttccccag caggtactgg 600
ctgggggcct accagctgca gagggtggtg ctggctttca tggtgccctt gggcgtcatc 660
accaccagct acctgctgct gctggccttc ctgcagcggc ggcaacggcg gcggcaggac 720
agcagggtcg tggcccgctc tgtccgcatc ctggtggctt ccttcttcct ctgctggttt 780
cccaaccatg tggtcactct ctggggtgtc ctggtgaagt ttgacctggt gccctggaac 840
agtactttct atactatcca gacgtatgtc ttccctgtca ctacttgctt ggcacacagc 900
aatagctgcc tcaaccctgt gctgtactgt ctcctgaggc gggagccccg gcaggctctg 960
gcaggcacct tcagggatct gcggtcgagg ctgtggcccc agggcggagg ctgggtgcaa 1020
caggtggccc taaagcaggt aggcaggcgg tgggtcgcaa gcaacccccg ggagagccgc 1080
ccttctaccc tgctcaccaa cctggacaga gggacacccg ggtga 1125
<210>34
<211>374
<212>PRT
<213>智人(Homo sapiens)
<400>34
Met Pro Thr Leu Asn Thr Ser Ala Ser Pro Pro Thr Phe Phe Trp Ala
1 5 10 15
Asn Ala Ser Gly Gly Ser Val Leu Ser Ala Asp Asp Ala Pro Met Pro
20 25 30
Val Lys Phe Leu Ala Leu Arg Leu Met Val Ala Leu Ala Tyr Gly Leu
35 40 45
Val Gly Ala Ile Gly Leu Leu Gly Asn Leu Ala Val Leu Trp Val Leu
50 55 60
Ser Asn Cys Ala Arg Arg Ala Pro Gly Pro Pro Ser Asp Thr Phe Val
65 70 75 80
Phe Asn Leu Ala Leu Ala Asp Leu Gly Leu Ala Leu Thr Leu Pro Phe
85 90 95
Trp Ala Ala Glu Ser Ala Leu Asp Phe His Trp Pro Phe Gly Gly Ala
100 105 110
Leu Cys Lys Met Val Leu Thr Ala Thr Val Leu Asn Val Tyr Ala Ser
115 120 125
Ile Phe Leu Ile Thr Ala Leu Ser Val Ala Arg Tyr Trp Val Val Ala
130 135 140
Met Ala Ala Gly Pro Gly Thr His Leu Ser Leu Phe Trp Ala Arg Ile
145 150 155 160
Ala Thr Leu Ala Val Trp Ala Ala Ala Ala Leu Val Thr Val Pro Thr
165 170 175
Ala Val Phe Gly Val Glu Gly Glu Val Cys Gly Val Arg Leu Cys Leu
180 185 190
Leu Arg Phe Pro Ser Arg Tyr Trp Leu Gly Ala Tyr Gln Leu Gln Arg
195 200 205
Val Val Leu Ala Phe Met Val Pro Leu Gly Val Ile Thr Thr Ser Tyr
210 215 220
Leu Leu Leu Leu Ala Phe Leu Gln Arg Arg Gln Arg Arg Arg Gln Asp
225 230 235 240
Ser Arg Val Val Ala Arg Ser Val Arg Ile Leu Val Ala Ser Phe Phe
245 250 255
Leu Cys Trp Phe Pro Asn His Val Val Thr Leu Trp Gly Val Leu Val
260 265 270
Lys Phe Asp Leu Val Pro Trp Asn Ser Thr Phe Tyr Thr Ile Gln Thr
275 280 285
Tyr Val Phe Pro Val Thr Thr Cys Leu Ala His Ser Asn Ser Cys Leu
290 295 300
Asn Pro Val Leu Tyr Cys Leu Leu Arg Arg Glu Pro Arg Gln Ala Leu
305 310 315 320
Ala Gly Thr Phe Arg Asp Leu Arg Ser Arg Leu Trp Pro Gln Gly Gly
325 330 335
Gly Trp Val Gln Gln Val Ala Leu Lys Gln Val Gly Arg Arg Trp Val
340 345 350
Ala Ser Asn Pro Arg Glu Ser Arg Pro Ser Thr Leu Leu Thr Asn Leu
355 360 365
Asp Arg Gly Thr Pro Gly
370
<210>35
<211>1092
<212>DNA
<213>智人(Homo sapiens)
<400>35
atgaatcggc accatctgca ggatcacttt ctggaaatag acaagaagaa ctgctgtgtg 60
ttccgagatg acttcattgt caaggtgttg ccgccggtgt tggggctgga gtttatcttc 120
gggcttctgg gcaatggcct tgccctgtgg attttctgtt tccacctcaa gtcctggaaa 180
tccagccgga ttttcctgtt caacctggca gtggctgact ttctactgat catctgcctg 240
cccttcctga tggacaacta tgtgaggcgt tgggactgga agtttgggga catcccttgc 300
cggctgatgc tcttcatgtt ggctatgaac cgccagggca gcatcatctt cctcacggtg 360
gtggcggtag acaggtattt ccgggtggtc catccccacc acgccctgaa caagatctcc 420
aatcggacag cagccatcat ctcttgcctt ctgtggggca tcactattgg cctgacagtc 480
cacctcctga agaagaagat gccgatccag aatggcggtg caaatttgtg cagcagcttc 540
agcatctgcc ataccttcca gtggcacgaa gccatgttcc tcctggagtt cttcctgccc 600
ctgggcatca tcctgttctg ctcagccaga attatctgga gcctgcggca gagacaaatg 660
gaccggcatg ccaagatcaa gagagccatc accttcatca tggtggtggc catcgtcttt 720
gtcatctgct tccttcccag cgtggttgtg cggatccgca tcttctggct cctgcacact 780
tcgggcacgc agaattgtga agtgtaccgc tcggtggacc tggcgttctt tatcactctc 840
agcttcacct acatgaacag catgctggac cccgtggtgt actacttctc cagcccatcc 900
tttcccaact tcttctccac tttgatcaac cgctgcctcc agaggaagat gacaggtgag 960
ccagataata accgcagcac gagcgtcgag ctcacagggg accccaacaa aaccagaggc 1020
gctccagagg cgttaatggc caactccggt gagccatgga gcccctctta tctgggccca 1080
acctctcctt aa 1092
<210>36
<211>363
<212>PRT
<213>智人(Homo sapiens)
<400>36
Met Asn Arg His His Leu Gln Asp His Phe Leu Glu Ile Asp Lys Lys
1 5 10 15
Asn Cys Cys Val Phe Arg Asp Asp Phe Ile Val Lys Val Leu Pro Pro
20 25 30
Val Leu Gly Leu Glu Phe Ile Phe Gly Leu Leu Gly Asn Gly Leu Ala
35 40 45
Leu Trp Ile Phe Cys Phe His Leu Lys Ser Trp Lys Ser Ser Arg Ile
50 55 60
Phe Leu Phe Asn Leu Ala Val Ala Asp Phe Leu Leu Ile Ile Cys Leu
65 70 75 80
Pro Phe Leu Met Asp Asn Tyr Val Arg Arg Trp Asp Trp Lys Phe Gly
85 90 95
Asp Ile Pro Cys Arg Leu Met Leu Phe Met Leu Ala Met Asn Arg Gln
100 105 110
Gly Ser Ile Ile Phe Leu Thr Val Val Ala Val Asp Arg Tyr Phe Arg
115 120 125
Val Val His Pro His His Ala Leu Asn Lys Ile Ser Asn Arg Thr Ala
130 135 140
Ala Ile Ile Ser Cys Leu Leu Trp Gly Ile Thr Ile Gly Leu Thr Val
145 150 155 160
His Leu Leu Lys Lys Lys Met Pro Ile Gln Asn Gly Gly Ala Asn Leu
165 170 175
Cys Ser Ser Phe Ser Ile Cys His Thr Phe Gln Trp His Glu Ala Met
180 185 190
Phe Leu Leu Glu Phe Phe Leu Pro Leu Gly Ile Ile Leu Phe Cys Ser
195 200 205
Ala Arg Ile Ile Trp Ser Leu Arg Gln Arg Gln Met Asp Arg His Ala
210 215 220
Lys Ile Lys Arg Ala Ile Thr Phe Ile Met Val Val Ala Ile Val Phe
225 230 235 240
Val Ile Cys Phe Leu Pro Ser Val Val Val Arg Ile Arg Ile Phe Trp
245 250 255
Leu Leu His Thr Ser Gly Thr Gln Asn Cys Glu Val Tyr Arg Ser Val
260 265 270
Asp Leu Ala Phe Phe Ile Thr Leu Ser Phe Thr Tyr Met Asn Ser Met
275 280 285
Leu Asp Pro Val Val Tyr Tyr Phe Ser Ser Pro Ser Phe Pro Asn Phe
290 295 300
Phe Ser Thr Leu Ile Asn Arg Cys Leu Gln Arg Lys Met Thr Gly Glu
305 310 315 320
Pro Asp Asn Asn Arg Ser Thr Ser Val Glu Leu Thr Gly Asp Pro Asn
325 330 335
Lys Thr Arg Gly Ala Pro Glu Ala Leu Met Ala Asn Ser Gly Glu Pro
340 345 350
Trp Ser Pro Ser Tyr Leu Gly Pro Thr Ser Pro
355 360
<210>37
<211>1044
<212>DNA
<213>智人(Homo sapiens)
<400>37
atgggggatg agctggcacc ttgccctgtg ggcactacag cttggccggc cctgatccag 60
ctcatcagca agacaccctg catgccccaa gcagccagca acacttcctt gggcctgggg 120
gacctcaggg tgcccagctc catgctgtac tggcttttcc ttccctcaag cctgctggct 180
gcagccacac tggctgtcag ccccctgctg ctggtgacca tcctgcggaa ccaacggctg 240
cgacaggagc cccactacct gctcccggct aacatcctgc tctcagacct ggcctacatt 300
ctcctccaca tgctcatctc ctccagcagc ctgggtggct gggagctggg ccgcatggcc 360
tgtggcattc tcactgatgc tgtcttcgcc gcctgcacca gcaccatcct gtccttcacc 420
gccattgtgc tgcacaccta cctggcagtc atccatccac tgcgctacct ctccttcatg 480
tcccatgggg ctgcctggaa ggcagtggcc ctcatctggc tggtggcctg ctgcttcccc 540
acattcctta tttggctcag caagtggcag gatgcccagc tggaggagca aggagcttca 600
tacatcctac caccaagcat gggcacccag ccgggatgtg gcctcctggt cattgttacc 660
tacacctcca ttctgtgcgt tctgttcctc tgcacagctc tcattgccaa ctgtttctgg 720
aggatctatg cagaggccaa gacttcaggc atctgggggc agggctattc ccgggccagg 780
ggcaccctgc tgatccactc agtgctgatc acattgtacg tgagcacagg ggtggtgttc 840
tccctggaca tggtgctgac caggtaccac cacattgact ctgggactca cacatggctc 900
ctggcagcta acagtgaggt actcatgatg cttccccgtg ccatgctccc atacctgtac 960
ctgctccgct accggcagct gttgggcatg gtccggggcc acctcccatc caggaggcac 1020
caggccatct ttaccatttc ctag 1044
<210>38
<211>347
<212>PRT
<213>智人(Homo sapiens)
<400>38
Met Gly Asp Glu Leu Ala Pro Cys Pro Val Gly Thr Thr Ala Trp Pro
1 5 10 15
Ala Leu Ile Gln Leu Ile Ser Lys Thr Pro Cys Met Pro Gln Ala Ala
20 25 30
Ser Asn Thr Ser Leu Gly Leu Gly Asp Leu Arg Val Pro Ser Ser Met
35 40 45
Leu Tyr Trp Leu Phe Leu Pro Ser Ser Leu Leu Ala Ala Ala Thr Leu
50 55 60
Ala Val Ser Pro Leu Leu Leu Val Thr Ile Leu Arg Asn Gln Arg Leu
65 70 75 80
Arg Gln Glu Pro His Tyr Leu Leu Pro Ala Asn Ile Leu Leu Ser Asp
85 90 95
Leu Ala Tyr Ile Leu Leu His Met Leu Ile Ser Ser Ser Ser Leu Gly
100 105 110
Gly Trp Glu Leu Gly Arg Met Ala Cys Gly Ile Leu Thr Asp Ala Val
115 120 125
Phe Ala Ala Cys Thr Ser Thr Ile Leu Ser Phe Thr Ala Ile Val Leu
130 135 140
His Thr Tyr Leu Ala Val Ile His Pro Leu Arg Tyr Leu Ser Phe Met
145 150 155 160
Ser His Gly Ala Ala Trp Lys Ala Val Ala Leu Ile Trp Leu Val Ala
165 170 175
Cys Cys Phe Pro Thr Phe Leu Ile Trp Leu Ser Lys Trp Gln Asp Ala
180 185 190
Gln Leu Glu Glu Gln Gly Ala Ser Tyr Ile Leu Pro Pro Ser Met Gly
195 200 205
Thr Gln Pro Gly Cys Gly Leu Leu Val Ile Val Thr Tyr Thr Ser Ile
210 215 220
Leu Cys Val Leu Phe Leu Cys Thr Ala Leu Ile Ala Asn Cys Phe Trp
225 230 235 240
Arg Ile Tyr Ala Glu Ala Lys Thr Ser Gly Ile Trp Gly Gln Gly Tyr
245 250 255
Ser Arg Ala Arg Gly Thr Leu Leu Ile His Ser Val Leu Ile Thr Leu
260 265 270
Tyr Val Ser Thr Gly Val Val Phe Ser Leu Asp Met Val Leu Thr Arg
275 280 285
Tyr His His Ile Asp Ser Gly Thr His Thr Trp Leu Leu Ala Ala Asn
290 295 300
Ser Glu Val Leu Met Met Leu Pro Arg Ala Met Leu Pro Tyr Leu Tyr
305 310 315 320
Leu Leu Arg Tyr Arg Gln Leu Leu Gly Met Val Arg Gly His Leu Pro
325 330 335
Ser Arg Arg His Gln Ala Ile Phe Thr Ile Ser
340 345
<210>39
<211>1023
<212>DNA
<213>智人(Homo sapiens)
<400>39
atgaatccat ttcatgcatc ttgttggaac acctctgccg aacttttaaa caaatcctgg 60
aataaagagt ttgcttatca aactgccagt gtggtagata cagtcatcct cccttccatg 120
attgggatta tctgttcaac agggctggtt ggcaacatcc tcattgtatt cactataata 180
agatccagga aaaaaacagt ccctgacatc tatatctgca acctggctgt ggctgatttg 240
gtccacatag ttggaatgcc ttttcttatt caccaatggg cccgaggggg agagtgggtg 300
tttggggggc ctctctgcac catcatcaca tccctggata cttgtaacca atttgcctgt 360
agtgccatca tgactgtaat gagtgtggac aggtactttg ccctcgtcca accatttcga 420
ctgacacgtt ggagaacaag gtacaagacc atccggatca atttgggcct ttgggcagct 480
tcctttatcc tggcattgcc tgtctgggtc tactcgaagg tcatcaaatt taaagacggt 540
gttgagagtt gtgcttttga tttgacatcc cctgacgatg tactctggta tacactttat 600
ttgacgataa caactttttt tttccctcta cccttgattt tggtgtgcta tattttaatt 660
ttatgctata cttgggagat gtatcaacag aataaggatg ccagatgctg caatcccagt 720
gtaccaaaac agagagtgat gaagttgaca aagatggtgc tggtgctggt ggtagtcttt 780
atcctgagtg ctgcccctta tcatgtgata caactggtga acttacagat ggaacagccc 840
acactggcct tctatgtggg ttattacctc tccatctgtc tcagctatgc cagcagcagc 900
attaaccctt ttctctacat cctgctgagt ggaaatttcc agaaacgtct gcctcaaatc 960
caaagaagag cgactgagaa ggaaatcaac aatatgggaa acactctgaa atcacacttt 1020
tag 1023
<210>40
<211>340
<212>PRT
<213>智人(Homo sapiens)
<400>40
Met Asn Pro Phe His Ala Ser Cys Trp Asn Thr Ser Ala Glu Leu Leu
1 5 10 15
Asn Lys Ser Trp Asn Lys Glu Phe Ala Tyr Gln Thr Ala Ser Val Val
20 25 30
Asp Thr Val Ile Leu Pro Ser Met Ile Gly Ile Ile Cys Ser Thr Gly
35 40 45
Leu Val Gly Asn Ile Leu Ile Val Phe Thr Ile Ile Arg Ser Arg Lys
50 55 60
Lys Thr Val Pro Asp Ile Tyr Ile Cys Asn Leu Ala Val Ala Asp Leu
65 70 75 80
Val His Ile Val Gly Met Pro Phe Leu Ile His Gln Trp Ala Arg Gly
85 90 95
Gly Glu Trp Val Phe Gly Gly Pro Leu Cys Thr Ile Ile Thr Ser Leu
100 105 110
Asp Thr Cys Asn Gln Phe Ala Cys Ser Ala Ile Met Thr Val Met Ser
115 120 125
Val Asp Arg Tyr Phe Ala Leu Val Gln Pro Phe Arg Leu Thr Arg Trp
130 135 140
Arg Thr Arg Tyr Lys Thr Ile Arg Ile Asn Leu Gly Leu Trp Ala Ala
145 150 155 160
Ser Phe Ile Leu Ala Leu Pro Val Trp Val Tyr Ser Lys Val Ile Lys
165 170 175
Phe Lys Asp Gly Val Glu Ser Cys Ala Phe Asp Leu Thr Ser Pro Asp
180 185 190
Asp Val Leu Trp Tyr Thr Leu Tyr Leu Thr Ile Thr Thr Phe Phe Phe
195 200 205
Pro Leu Pro Leu Ile Leu Val Cys Tyr Ile Leu Ile Leu Cys Tyr Thr
210 215 220
Trp Glu Met Tyr Gln Gln Asn Lys Asp Ala Arg Cys Cys Asn Pro Ser
225 230 235 240
Val Pro Lys Gln Arg Val Met Lys Leu Thr Lys Met Val Leu Val Leu
245 250 255
Val Val Val Phe Ile Leu Ser Ala Ala Pro Tyr His Val Ile Gln Leu
260 265 270
Val Asn Leu Gln Met Glu Gln Pro Thr Leu Ala Phe Tyr Val Gly Tyr
275 280 285
Tyr Leu Ser Ile Cys Leu Ser Tyr Ala Ser Ser Ser Ile Asn Pro Phe
290 295 300
Leu Tyr Ile Leu Leu Ser Gly Asn Phe Gln Lys Arg Leu Pro Gln Ile
305 310 315 320
Gln Arg Arg Ala Thr Glu Lys Glu Ile Asn Asn Met Gly Asn Thr Leu
325 330 335
Lys Ser His Phe
340
<210>41
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>41
cttgcagaca tcaccatggc agcc 24
<210>42
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>42
gtgatgctct gagtactgga ctgg 24
<210>43
<211>20
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>43
gaagctgtga agagtgatgc 20
<210>44
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>44
gtcagcaata ttgataagca gcag 24
<210>45
<211>27
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>45
ccatggggaa cgattctgtc agctacg 27
<210>46
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>46
gctatgcctg aagccagtct tgtg 24
<210>47
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>47
ccaggatgtt gtgtcaccgt ggtggc 26
<210>48
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>48
cacagcgctg cagccctgca gctggc 26
<210>49
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>49
cttcctctcg tagggatgaa ccagac 26
<210>50
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>50
ctcgcacagg tgggaagcac ctgtgg 26
<210>51
<211>23
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>51
gcctgtgaca ggaggtaccc tgg 23
<210>52
<211>25
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>52
catatccctc cgagtgtcca gcggc 25
<210>53
<211>31
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>53
gcatggagag aaaatttatg tccttgcaac c 31
<210>54
<211>27
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>54
caagaacagg tctcatctaa gagctcc 27
<210>55
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>55
gctgttgcca tgacgtccac ctgcac 26
<210>56
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>56
ggacagttca aggtttgcct tagaac 26
<210>57
<211>23
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>57
ctttcgatac tgctcctatg ctc 23
<210>58
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>58
gtagtccact gaaagtccag tgatcc 26
<210>59
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>59
tttctgagca tggatccaac catctc 26
<210>60
<211>25
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>60
ctgtctgaca gggcagaggc tcttc 25
<210>61
<211>28
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>61
ggaactcgta tagacccagc gtcgctcc 28
<210>62
<211>28
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>62
ggaggttgcg ccttagcgac agatgacc 28
<210>63
<211>22
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>63
ctgcacccgg acacttgctc tg 22
<210>64
<211>25
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>64
gtctgcttgt tcagtgccac tcaac 25
<210>65
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>65
tatctgcaat tctattctag ctcctg 26
<210>66
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>66
tgtccctaat aaagtcacat gaatgc 26
<210>67
<211>23
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>67
ggagacaacc atgaatgagc cac 23
<210>68
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>68
tatttcaagg gttgtttgag taac 24
<210>69
<211>27
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>69
ggcaccagtg gaggttttct gagcatg 27
<210>70
<211>27
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>70
ctgatggaag tagaggctgt ccatctc 27
<210>71
<211>23
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>71
cctggcgagc cgctagcgcc atg 23
<210>72
<211>23
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>72
atgagccctg ccaggccctc agt 23
<210>73
<211>27
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>73
ctgcgatgcc cacactcaat acttctg 27
<210>74
<211>27
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>74
aaggatccta cacttggtgg atctcag 27
<210>75
<211>22
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>75
gctggagcat tcactaggcg ag 22
<210>76
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>76
agatcctggt tcttggtgac aatg 24
<210>77
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>77
agcca tccct gccaggaagc atgg 24
<210>78
<211>27
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>78
ccagactgtg gactcaagaa ctctagg 27
<210>79
<211>28
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>79
agtccacgaa caatgaatcc atttcatg 28
<210>80
<211>25
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>80
atcatgtcta gactcatggt gatcc 25
<210>81
<211>30
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>81
ggggagggaa agcaaaggtg gtcctcctgg 30
<210>82
<211>30
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>82
ccaggagaac cacctttgct ttccctcccc 30
<210>83
<211>1356
<212>DNA
<213>智人(Homo sapiens)
<400>83
atggagtcct cacccatccc ccagtcatca gggaactctt ccactttggg gagggtccct 60
caaaccccag gtccctctac tgccagtggg gtcccggagg tggggctacg ggatgttgct 120
tcggaatctg tggccctctt cttcatgctc ctgctggact tgactgctgt ggctggcaat 180
gccgctgtga tggccgtgat cgccaagacg cctgccctcc gaaaatttgt cttcgtcttc 240
cacctctgcc tggtggacct gctggctgcc ctgaccctca tgcccctggc catgctctcc 300
agctctgccc tctttgacca cgccctcttt ggggaggtgg cctgccgcct ctacttgttt 360
ctgagcgtgt gctttgtcag cctggccatc ctctcggtgt cagccatcaa tgtggagcgc 420
tactattacg tagtccaccc catgcgctac gaggtgcgca tgacgctggg gctggtggcc 480
tctgtgctgg tgggtgtgtg ggtgaaggcc ttggccatgg cttctgtgcc agtgttggga 540
agggtctcct gggaggaagg agctcccagt gtccccccag gctgttcact ccagtggagc 600
cacagtgcct actgccagct ttttgtggtg gtctttgctg tcctttactt tctgttgccc 660
ctgctcctca tacttgtggt ctactgcagc atgttccgag tggcccgcgt ggctgccatg 720
cagcacgggc cgctgcccac gtggatggag acaccccggc aacgctccga atctctcagc 780
agccgctcca cgatggtcac cagctcgggg gccccccaga ccaccccaca ccggacgttt 840
gggggaggga aagcaaaggt ggttctcctg gctgtggggg gacagttcct gctctgttgg 900
ttgccctact tctctttcca cctctatgtt gccctgagtg ctcagcccat ttcaactggg 960
caggtggaga gtgtggtcac ctggattggc tacttttgct tcacttccaa ccctttcttc 1020
tatggatgtc tcaaccggca gatccggggg gagctcagca agcagtttgt ctgcttcttc 1080
aagccagctc cagaggagga gctgaggctg cctagccggg agggctccat tgaggagaac 1140
ttcctgcagt tccttcaggg gactggctgt ccttctgagt cctgggtttc ccgaccccta 1200
cccagcccca agcaggagcc acctgctgtt gactttcgaa tcccaggcca gatagctgag 1260
gagacctctg agttcctgga gcagcaactc accagcgaca tcatcatgtc agacagctac 1320
ctccgtcctg ccgcctcacc ccggctggag tcatga 1356
<210>84
<211>451
<212>PRT
<213>智人(Homo sapiens)
<400>84
Met Glu Ser Ser Pro Ile Pro Gln Ser Ser Gly Asn Ser Ser Thr Leu
1 5 10 15
Gly Arg Val Pro Gln Thr Pro Gly Pro Ser Thr Ala Ser Gly Val Pro
20 25 30
Glu Val Gly Leu Arg Asp Val Ala Ser Glu Ser Val Ala Leu Phe Phe
35 40 45
Met Leu Leu Leu Asp Leu Thr Ala Val Ala Gly Asn Ala Ala Val Met
50 55 60
Ala Val Ile Ala Lys Thr Pro Ala Leu Arg Lys Phe Val Phe Val Phe
65 70 75 80
His Leu Cys Leu Val Asp Leu Leu Ala Ala Leu Thr Leu Met Pro Leu
85 90 95
Ala Met Leu Ser Ser Ser Ala Leu Phe Asp His Ala Leu Phe Gly Glu
100 105 110
Val Ala Cys Arg Leu Tyr Leu Phe Leu Ser Val Cys Phe Val Ser Leu
115 120 125
Ala Ile Leu Ser Val Ser Ala Ile Asn Val Glu Arg Tyr Tyr Tyr Val
130 135 140
Val His Pro Met Arg Tyr Glu Val Arg Met Thr Leu Gly Leu Val Ala
145 150 155 160
Ser Val Leu Val Gly Val Trp Val Lys Ala Leu Ala Met Ala Ser Val
165 170 175
Pro Val Leu Gly Arg Val Ser Trp Glu Glu Gly Ala Pro Ser Val Pro
180 185 190
Pro Gly Cys Ser Leu Gln Trp Ser His Ser Ala Tyr Cys Gln Leu Phe
195 200 205
Val Val Val Phe Ala Val Leu Tyr Phe Leu Leu Pro Leu Leu Leu Ile
210 215 220
Leu Val Val Tyr Cys Ser Met Phe Arg Val Ala Arg Val Ala Ala Met
225 230 235 240
Gln His Gly Pro Leu Pro Thr Trp Met Glu Thr Pro Arg Gln Arg Ser
245 250 255
Glu Ser Leu Ser Ser Arg Ser Thr Met Val Thr Ser Ser Gly Ala Pro
260 265 270
Gln Thr Thr Pro His Arg Thr Phe Gly Gly Gly Lys Ala Lys Val Val
275 280 285
Leu Leu Ala Val Gly Gly Gln Phe Leu Leu Cys Trp Leu Pro Tyr Phe
290 295 300
Ser Phe His Leu Tyr Val Ala Leu Ser Ala Gln Pro Ile Ser Thr Gly
305 310 315 320
Gln Val Glu Ser Val Val Thr Trp Ile Gly Tyr Phe Cys Phe Thr Ser
325 330 335
Asn Pro Phe Phe Tyr Gly Cys Leu Asn Arg Gln Ile Arg Gly Glu Leu
340 345 350
Ser Lys Gln Phe Val Cys Phe Phe Lys Pro Ala Pro Glu Glu Glu Leu
355 360 365
Arg Leu Pro Ser Arg Glu Gly Ser Ile Glu Glu Asn Phe Leu Gln Phe
370 375 380
Leu Gln Gly Thr Gly Cys Pro Ser Glu Ser Trp Val Ser Arg Pro Leu
385 390 395 400
Pro Ser Pro Lys Gln Glu Pro Pro Ala Val Asp Phe Arg Ile Pro Gly
405 410 415
Gln Ile Ala Glu Glu Thr Ser Glu Phe Leu Glu Gln Gln Leu Thr Ser
420 425 430
Asp Ile Ile Met Ser Asp Ser Tyr Leu Arg Pro Ala Ala Ser Pro Arg
435 440 445
Leu Glu Ser
450
<210>85
<211>28
<212>DNA
<213>智人(Homo sapiens)
<400>85
caggaaggca aagaccacca tcatcatc 28
<210>86
<211>28
<212>DNA
<213>智人(Homo sapiens)
<400>86
gatgatgatg gtggtctttg ccttcctg 28
<210>87
<211>1041
<212>DNA
<213>智人(Homo sapiens)
<400>87
atggagagaa aatttatgtc cttgcaacca tccatctccg tatcagaaat ggaaccaaat 60
ggcaccttca gcaataacaa cagcaggaac tgcacaattg aaaacttcaa gagagaattt 120
ttcccaattg tatatctgat aatatttttc tggggagtct tgggaaatgg gttgtccata 180
tatgttttcc tgcagcctta taagaagtcc acatctgtga acgttttcat gctaaatctg 240
gccatttcag atctcctgtt cataagcacg cttcccttca gggctgacta ttatcttaga 300
ggctccaatt ggatatttgg agacctggcc tgcaggatta tgtcttattc cttgtatgtc 360
aacatgtaca gcagtattta tttcctgacc gtgctgagtg ttgtgcgttt cctggcaatg 420
gttcacccct ttcggcttct gcatgtcacc agcatcagga gtgcctggat cctctgtggg 480
atcatatgga tccttatcat ggcttcctca ataatgctcc tggacagtgg ctctgagcag 540
aacggcagtg tcacatcatg cttagagctg aatctctata aaattgctaa gctgcagacc 600
atgaactata ttgccttggt ggtgggctgc ctgctgccat ttttcacact cagcatctgt 660
tatctgctga tcattcgggt tctgttaaaa gtggaggtcc cagaatcggg gctgcgggtt 720
tctcacagga aggcaaagac caccatcatc atcaccttga tcatcttctt cttgtgtttc 780
ctgccctatc acacactgag gaccgtccac ttgacgacat ggaaagtggg tttatgcaaa 840
gacagactgc ataaagcttt ggttatcaca ctggccttgg cagcagccaa tgcctgcttc 900
aatcctctgc tctattactt tgctggggag aattttaagg acagactaaa gtctgcactc 960
agaaaaggcc atccacagaa ggcaaagaca aagtgtgttt tccctgttag tgtgtggttg 1020
agaaaggaaa caagagtata a 1041
<210>88
<211>346
<212>PRT
<213>智人(Homo sapiens)
<400>88
Met Glu Arg Lys Phe MetSer Leu Gln Pro Ser Ile Ser Val Ser Glu
1 5 10 15
Met Glu Pro Asn Gly Thr Phe Ser Asn Asn Asn Ser Arg Asn Cys Thr
20 25 30
Ile Glu Asn Phe Lys Arg Glu Phe Phe Pro Ile Val Tyr Leu Ile Ile
35 40 45
Phe Phe Trp Gly Val Leu Gly Asn Gly Leu Ser Ile Tyr Val Phe Leu
50 55 60
Gln Pro Tyr Lys Lys Ser Thr Ser Val Asn Val Phe Met Leu Asn Leu
65 70 75 80
Ala Ile Ser Asp Leu Leu Phe Ile Ser Thr Leu Pro Phe Arg Ala Asp
85 90 95
Tyr Tyr Leu Arg Gly Ser Asn Trp Ile Phe Gly Asp Leu Ala Cys Arg
100 105 110
Ile Met Ser Tyr Ser Leu Tyr Val Asn Met Tyr Ser Ser Ile Tyr Phe
115 120 125
Leu Thr Val Leu Ser Val Val Arg Phe Leu Ala Met Val His Pro Phe
130 135 140
Arg Leu Leu His Val Thr Ser Ile Arg Ser Ala Trp Ile Leu Cys Gly
145 150 155 160
Ile Ile Trp Ile Leu Ile Met Ala Ser Ser Ile Met Leu Leu Asp Ser
165 170 175
Gly Ser Glu Gln Asn Gly Ser Val Thr Ser Cys Leu Glu Leu Asn Leu
180 185 190
Tyr Lys Ile Ala Lys Leu Gln Thr Met Asn Tyr Ile Ala Leu Val Val
195 200 205
Gly Cys Leu Leu Pro Phe Phe Thr Leu Ser Ile Cys Tyr Leu Leu Ile
210 215 220
Ile Arg Val Leu Leu Lys Val Glu Val Pro Glu Ser Gly Leu Arg Val
225 230 235 240
Ser His Arg Lys Ala Lys Thr Thr Ile Ile Ile Thr Leu Ile Ile Phe
245 250 255
Phe Leu Cys Phe Leu Pro Tyr His Thr Leu Arg Thr Val His Leu Thr
260 265 270
Thr Trp Lys Val Gly Leu Cys Lys Asp Arg Leu His Lys Ala Leu Val
275 280 285
Ile Thr Leu Ala Leu Ala Ala Ala Asn Ala Cys Phe Asn Pro Leu Leu
290 295 300
Tyr Tyr Phe Ala Gly Glu Asn Phe Lys Asp Arg Leu Lys Ser Ala Leu
305 310 315 320
Arg Lys Gly His Pro Gln Lys Ala Lys Thr Lys Cys Val Phe Pro Val
325 330 335
Ser Val Trp Leu Arg Lys Glu Thr Arg Val
340 345
<210>89
<211>28
<212>DNA
<213>人工序列
<220>
<223>新序列
<400)89
ccagtgcaaa gctaagaaag tgatcttc 28
<210>90
<211>28
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>90
gaagatcact ttcttagctt tgcactgg 28
<210>91
<211>1527
<212>DNA
<213>智人(Homo sapiens)
<400>91
atgacgtcca cctgcaccaa cagcacgcgc gagagtaaca gcagccacac gtgcatgccc 60
ctctccaaaa tgcccatcag cctggcccac ggcatcatcc gctcaaccgt gctggttatc 120
ttcctcgccg cctctttcgt cggcaacata gtgctggcgc tagtgttgca gcgcaagccg 180
cagctgctgc aggtgaccaa ccgttttatc tttaacctcc tcgtcaccga cctgctgcag 240
atttcgctcg tggccccctg ggtggtggcc acctctgtgc ctctcttctg gcccctcaac 300
agccacttct gcacggccct ggttagcctc acccacctgt tcgccttcgc cagcgtcaac 360
accattgtcg tggtgtcagt ggatcgctac ttgtccatca tccaccctct ctcctacccg 420
tccaagatga cccagcgccg cggttacctg ctcctctatg gcacctggat tgtggccatc 480
ctgcagagca ctcctccact ctacggctgg ggccaggctg cctttgatga gcgcaatgct 540
ctctgctcca tgatctgggg ggccagcccc agctacacta ttctcagcgt ggtgtccttc 600
atcgtcattc cactgattgt catgattgcc tgctactccg tggtgttctg tgcagcccgg 660
aggcagcatg ctctgctgta caatgtcaag agacacagct tggaagtgcg agtcaaggac 720
tgtgtggaga atgaggatga agagggagca gagaagaagg aggagttcca ggatgagagt 780
gagtttcgcc gccagcatga aggtgaggtc aaggccaagg agggcagaat ggaagccaag 840
gacggcagcc tgaaggccaa ggaaggaagc acggggacca gtgagagtag tgtagaggcc 900
aggggcagcg aggaggtcag agagagcagc acggtggcca gcgacggcag catggagggt 960
aaggaaggca gcaccaaagt tgaggagaac agcatgaagg cagacaaggg tcgcacagag 1020
gtcaaccagt gcagcattga cttgggtgaa gatgacatgg agtttggtga agacgacatc 1080
aatttcagtg aggatgacgt cgaggcagtg aacatcccgg agagcctccc acccagtcgt 1140
cgtaacagca acagcaaccc tcctctgccc aggtgctacc agtgcaaagc taagaaagtg 1200
atcttcatca tcattttctc ctatgtgcta tccctggggc cctactgctt tttagcagtc 1260
ctggccgtgt gggtggatgt cgaaacccag gtaccccagt gggtgatcac cataatcatc 1320
tggcttttct tcctgcagtg ctgcatccac ccctatgtct atggctacat gcacaagacc 1380
attaagaagg aaatccagga catgctgaag aagttcttct gcaaggaaaa gcccccgaaa 1440
gaagatagcc acccagacct gcccggaaca gagggtggga ctgaaggcaa gattgtccct 1500
tcctacgatt ctgctacttt tccttga 1527
<210>92
<211>508
<212>PRT
<213>智人(Homo sapiens)
<400>92
Met Thr Ser Thr Cys Thr Asn Ser Thr Arg Glu Ser Asn Ser Ser His
1 5 10 15
Thr Cys Met Pro Leu Ser Lys Met Pro Ile Ser Leu Ala His Gly Ile
20 25 30
Ile Arg Ser Thr Val Leu Val Ile Phe Leu Ala Ala Ser Phe Val Gly
35 40 45
Asn Ile Val Leu Ala Leu Val Leu Gln Arg Lys Pro Gln Leu Leu Gln
50 55 60
Val Thr Asn Arg Phe Ile Phe Asn Leu Leu Val Thr Asp Leu Leu Gln
65 70 75 80
Ile Ser Leu Val Ala Pro Trp Val Val Ala Thr Ser Val Pro Leu Phe
85 90 95
Trp Pro Leu Asn Ser His Phe Cys Thr Ala Leu Val Ser Leu Thr His
100 105 110
Leu Phe Ala Phe Ala Ser Val Asn Thr Ile Val Val Val Ser Val Asp
115 120 125
Arg Tyr Leu Ser Ile Ile His Pro Leu Ser Tyr Pro Ser Lys Met Thr
130 135 140
Gln Arg Arg Gly Tyr Leu Leu Leu Tyr Gly Thr Trp Ile Val Ala Ile
145 150 155 160
Leu Gln Ser Thr Pro Pro Leu Tyr Gly Trp Gly Gln Ala Ala Phe Asp
165 170 175
Glu Arg Asn Ala Leu Cys Ser Met Ile Trp Gly Ala Ser Pro Ser Tyr
180 185 190
Thr Ile Leu Ser Val Val Ser Phe Ile Val Ile Pro Leu Ile Val Met
195 200 205
Ile Ala Cys Tyr Ser Val Val Phe Cys Ala Ala Arg Arg Gln His Ala
210 215 220
Leu Leu Tyr Asn Val Lys Arg His Ser Leu Glu Val Arg Val Lys Asp
225 230 235 240
Cys Val Glu Asn Glu Asp Glu Glu Gly Ala Glu Lys Lys Glu Glu Phe
245 250 255
Gln Asp Glu Ser Glu Phe Arg Arg Gln His Glu Gly Glu Val Lys Ala
260 265 270
Lys Glu Gly Arg Met Glu Ala Lys Asp Gly Ser Leu Lys Ala Lys Glu
275 280 285
Gly Ser Thr Gly Thr Ser Glu Ser Ser Val Glu Ala Arg Gly Ser Glu
290 295 300
Glu Val Arg Glu Ser Ser Thr Val Ala Ser Asp Gly Ser Met Glu Gly
305 310 315 320
Lys Glu Gly Ser Thr Lys Val Glu Glu Asn Ser Met Lys Ala Asp Lys
325 330 335
Gly Arg Thr Glu Val Asn Gln Cys Ser Ile Asp Leu Gly Glu Asp Asp
340 345 350
Met Glu Phe Gly Glu Asp Asp Ile Asn Phe Ser Glu Asp Asp Val Glu
355 360 365
Ala Val Asn Ile Pro Glu Ser Leu Pro Pro Ser Arg Arg Asn Ser Asn
370 375 380
Ser Asn Pro Pro Leu Pro Arg Cys Tyr Gln Cys Lys Ala Lys Lys Val
385 390 395 400
Ile Phe Ile Ile Ile Phe Ser Tyr Val Leu Ser Leu Gly Pro Tyr Cys
405 410 415
Phe Leu Ala Val Leu Ala Val Trp Val Asp Val Glu Thr Gln Val Pro
420 425 430
Gln Trp Val Ile Thr Ile Ile Ile Trp Leu Phe Phe Leu Gln Cys Cys
435 440 445
Ile His Pro Tyr Val Tyr Gly Tyr Met His Lys Thr Ile Lys Lys Glu
450 455 460
Ile Gln Asp Met Leu Lys Lys Phe Phe Cys Lys Glu Lys Pro Pro Lys
465 470 475 480
Glu Asp Ser His Pro Asp Leu Pro Gly Thr Glu Gly Gly Thr Glu Gly
485 490 495
Lys Ile Val Pro Ser Tyr Asp Ser Ala Thr Phe Pro
500 505
<210>93
<211>29
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>93
gccgccaccg cgccaagagg aagattggc 29
<210>94
<211>29
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>94
gccaatcttc ctcttggcgc ggtggcggc 29
<210>95
<211>1092
<212>DNA
<213>智人(Homo sapiens)
<400>95
atgggccccg gcgaggcgct gctggcgggt ctcctggtga tggtactggc cgtggcgctg 60
ctatccaacg cactggtgct gctttgttgc gcctacagcg ctgagctccg cactcgagcc 120
tcaggcgtcc tcctggtgaa tctgtcgctg ggccacctgc tgctggcggc gctggacatg 180
cccttcacgc tgctcggtgt gatgcgcggg cggacaccgt cggcgcccgg cgcatgccaa 240
gtcattggct tcctggacac cttcctggcg tccaacgcgg cgctgagcgt ggcggcgctg 300
agcgcagacc agtggctggc agtgggcttc ccactgcgct acgccggacg cctgcgaccg 360
cgctatgccg gcctgctgct gggctgtgcc tggggacagt cgctggcctt ctcaggcgct 420
gcacttggct gctcgtggct tggctacagc agcgccttcg cgtcctgttc gctgcgcctg 480
ccgcccgagc ctgagcgtcc gcgcttcgca gccttcaccg ccacgctcca tgccgtgggc 540
ttcgtgctgc cgctggcggt gctctgcctc acctcgctcc aggtgcaccg ggtggcacgc 600
agccactgcc agcgcatgga caccgtcacc atgaaggcgc tcgcgctgct cgccgacctg 660
caccccagtg tgcggcagcg ctgcctcatc cagcagaagc ggcgccgcca ccgcgccacc 720
aggaagattg gcattgctat tgcgaccttc ctcatctgct ttgccccgta tgtcatgacc 780
aggctggcgg agctcgtgcc cttcgtcacc gtgaacgccc agaagggcat cctcagcaag 840
tgcctgacct acagcaaggc ggtggccgac ccgttcacgt actctctgct ccgccggccg 900
ttccgccaag tcctggccgg catggtgcac cggctgctga agagaacccc gcgcccagca 960
tccacccatg acagctctct ggatgtggcc ggcatggtgc accagctgct gaagagaacc 1020
ccgcgcccag cgtccaccca caacggctct gtggacacag agaatgattc ctgcctgcag 1080
cagacacact ga 1092
<210>96
<211>363
<212>PRT
<213>智人(Homo sapiens)
<400>96
Met Gly Pro Gly Glu Ala Leu Leu Ala Gly Leu Leu Val Met Val Leu
1 5 10 15
Ala Val Ala Leu Leu Ser Asn Ala Leu Val Leu Leu Cys Cys Ala Tyr
20 25 30
Ser Ala Glu Leu Arg Thr Arg Ala Ser Gly Val Leu Leu Val Asn Leu
35 40 45
Ser Leu Gly His Leu Leu Leu Ala Ala Leu Asp Met Pro Phe Thr Leu
50 55 60
Leu Gly Val Met Arg Gly Arg Thr Pro Ser Ala Pro Gly Ala Cys Gln
65 70 75 80
Val Ile Gly Phe Leu Asp Thr Phe Leu Ala Ser Asn Ala Ala Leu Ser
85 90 95
Val Ala Ala Leu Ser Ala Asp Gln Trp Leu Ala Val Gly Phe Pro Leu
100 105 110
Arg Tyr Ala Gly Arg Leu Arg Pro Arg Tyr Ala Gly Leu Leu Leu Gly
115 120 125
Cys Ala Trp Gly Gln Ser Leu Ala Phe Ser Gly Ala Ala Leu Gly Cys
130 135 140
Ser Trp Leu Gly Tyr Ser Ser Ala Phe Ala Ser Cys Ser Leu Arg Leu
145 150 155 160
Pro Pro Glu Pro Glu Arg Pro Arg Phe Ala Ala Phe Thr Ala Thr Leu
165 170 175
His Ala Val Gly Phe Val Leu Pro Leu Ala Val Leu Cys Leu Thr Ser
180 185 190
Leu Gln Val His Arg Val Ala Arg Ser His Cys Gln Arg Met Asp Thr
195 200 205
Val Thr Met Lys Ala Leu Ala Leu Leu Ala Asp Leu His Pro Ser Val
210 215 220
Arg Gln Arg Cys Leu Ile Gln Gln Lys Arg Arg Arg His Arg Ala Thr
225 230 235 240
Arg Lys Ile Gly Ile Ala Ile Ala Thr Phe Leu Ile Cys Phe Ala Pro
245 250 255
Tyr Val Met Thr Arg Leu Ala Glu Leu Val Pro Phe Val Thr Val Asn
260 265 270
Ala Gln Lys Gly Ile Leu Ser Lys Cys Leu Thr Tyr Ser Lys Ala Val
275 280 285
Ala Asp Pro Phe Thr Tyr Ser Leu Leu Arg Arg Pro Phe Arg Gln Val
290 295 300
Leu Ala Gly Met Val His Arg Leu Leu Lys Arg Thr Pro Arg Pro Ala
305 310 315 320
Ser Thr His Asp Ser Ser Leu Asp Val Ala Gly Met Val His Gln Leu
325 330 335
Leu Lys Arg Thr Pro Arg Pro Ala Ser Thr His Asn Gly Ser Val Asp
340 345 350
Thr Glu Asn Asp Ser Cys Leu Gln Gln Thr His
355 360
<210>97
<211>34
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>97
gatctctaga atggagtcct cacccatccc ccag 34
<210>98
<211>36
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>98
gatcgatatc cgtgactcca gccggggtga ggcggc 36
<210>99
<211>2610
<212>DNA
<213>智人(Homo sapiens)和大鼠
<400>99
atggagtcct cacccatccc ccagtcatca gggaactctt ccactttggg gagggtccct 60
caaaccccag gtccctctac tgccagtggg gtcccggagg tggggctacg ggatgttgct 120
tcggaatctg tggccctctt cttcatgctc ctgctggact tgactgctgt ggctggcaat 180
gccgctgtga tggccgtgat cgccaagacg cctgccctcc gaaaatttgt cttcgtcttc 240
cacctctgcc tggtggacct gctggctgcc ctgaccctca tgcccctggc catgctctcc 300
agctctgccc tctttgacca cgccctcttt ggggaggtgg cctgccgcct ctacttgttt 360
ctgagcgtgt gctttgtcag cctggccatc ctctcggtgt cagccatcaa tgtggagcgc 420
tactattacg tagtccaccc catgcgctac gaggtgcgca tgacgctggg gctggtggcc 480
tctgtgctgg tgggtgtgtg ggtgaaggcc ttggccatgg cttctgtgcc agtgttggga 540
agggtctcct gggaggaagg agctcccagt gtccccccag gctgttcact ccagtggagc 600
cacagtgcct actgccagct ttttgtggtg gtctttgctg tcctttactt tctgttgccc 660
ctgctcctca tacttgtggt ctactgcagc atgttccgag tggcccgcgt ggctgccatg 720
cagcacgggc cgctgcccac gtggatggag acaccccggc aacgctccga atctctcagc 780
agccgctcca cgatggtcac cagctcgggg gccccccaga ccaccccaca ccggacgttt 840
gggggaggga aagcagcagt ggttctcctg gctgtggggg gacagttcct gctctgttgg 900
ttgccctact tctctttcca cctctatgtt gccctgagtg ctcagcccat ttcaactggg 960
caggtggaga gtgtggtcac ctggattggc tacttttgct tcacttccaa ccctttcttc 1020
tatggatgtc tcaaccggca gatccggggg gagctcagca agcagtttgt ctgcttcttc 1080
aagccagctc cagaggagga gctgaggctg cctagccggg agggctccat tgaggagaac 1140
ttcctgcagt tccttcaggg gactggctgt ccttctgagt cctgggtttc ccgaccccta 1200
cccagcccca agcaggagcc acctgctgtt gactttcgaa tcccaggcca gatagctgag 1260
gagacctctg agttcctgga gcagcaactc accagcgaca tcatcatgtc agacagctac 1320
ctccgtcctg ccgcctcacc ccggctggag tcagcgatat ctgcagaatt ccaccacact 1380
ggactagtgg atccgagctc ggtaccaagc ttgggctgca ggtcgatggg ctgcctcggc 1440
aacagtaaga ccgaggacca gcgcaacgag gagaaggcgc agcgcgaggc caacaaaaag 1500
atcgagaagc agctgcagaa ggacaagcag gtctaccggg ccacgcaccg cctgctgctg 1560
ctgggtgctg gagagtctgg caaaagcacc attgtgaagc agatgaggat cctacatgtt 1620
aatgggttta acggagaggg cggcgaagag gacccgcagg ctgcaaggag caacagcgat 1680
ggtgagaagg ccaccaaagt gcaggacatc aaaaacaacc tgaaggaggc cattgaaacc 1740
attgtggccg ccatgagcaa cctggtgccc cccgtggagc tggccaaccc tgagaaccag 1800
ttcagagtgg actacattct gagcgtgatg aacgtgccaa actttgactt cccacctgaa 1860
ttctatgagc atgccaaggc tctgtgggag gatgagggag ttcgtgcctg ctacgagcgc 1920
tccaacgagt accagctgat cgactgtgcc cagtacttcc tggacaagat tgatgtgatc 1980
aagcaggccg actacgtgcc aagtgaccag gacctgcttc gctgccgcgt cctgacctct 2040
ggaatctttg agaccaagtt ccaggtggac aaagtcaact tccacatgtt cgatgtgggc 2100
ggccagcgcg atgaacgccg caagtggatc cagtgcttca atgatgtgac tgccatcatc 2160
ttcgtggtgg ccagcagcag ctacaacatg gtcatccggg aggacaacca gaccaaccgt 2220
ctgcaggagg ctctgaacct cttcaagagc atctggaaca acagatggct gcgtaccatc 2280
tctgtgatcc tcttcctcaa caagcaagat ctgcttgctg agaaggtcct cgctgggaaa 2340
tcgaagattg aggactactt tccagagttc gctcgctaca ccactcctga ggatgcgact 2400
cccgagcccg gagaggaccc acgcgtgacc cgggccaagt acttcatccg ggatgagttt 2460
ctgagaatca gcactgctag tggagatgga cgtcactact gctaccctca ctttacctgc 2520
gccgtggaca ctgagaacat ccgccgtgtc ttcaacgact gccgtgacat catccagcgc 2580
atgcatcttc gccaatacga gctgctctaa 2610
<210>100
<211>869
<212>PRT
<213>智人(Homo sapiens)和大鼠
<400>100
Met Glu Ser Ser Pro Ile Pro Gln Ser Ser Gly Asn Ser Ser Thr Leu
1 5 10 15
Gly Arg Val Pro Gln Thr Pro Gly Pro Ser Thr Ala Ser Gly Val Pro
20 25 30
Glu Val Gly Leu Arg Asp Val Ala Ser Glu Ser Val Ala Leu Phe Phe
35 40 45
Met Leu Leu Leu Asp Leu Thr Ala Val Ala Gly Asn Ala Ala Val Met
50 55 60
Ala Val Ile Ala Lys Thr Pro Ala Leu Arg Lys Phe Val Phe Val Phe
65 70 75 80
His Leu Cys Leu Val Asp Leu Leu Ala Ala Leu Thr Leu Met Pro Leu
85 90 95
Ala Met Leu Ser Ser Ser Ala Leu Phe Asp His Ala Leu Phe Gly Glu
100 105 110
Val Ala Cys Arg Leu Tyr Leu Phe Leu Ser Val Cys Phe Val Ser Leu
115 120 125
Ala Ile Leu Ser Val Ser Ala Ile Asn Val Glu Arg Tyr Tyr Tyr Val
130 135 140
Val His Pro Met Arg Tyr Glu Val Arg Met Thr Leu Gly Leu Val Ala
145 150 155 160
Ser Val Leu Val Gly Val Trp Val Lys Ala Leu Ala Met Ala Ser Val
165 170 175
Pro Val Leu Gly Arg Val Ser Trp Glu Glu Gly Ala Pro Ser Val Pro
180 185 190
Pro Gly Cys Ser Leu Gln Trp Ser His Ser Ala Tyr Cys Gln Leu Phe
195 200 205
Val Val Val Phe Ala Val Leu Tyr Phe Leu Leu Pro Leu Leu Leu Ile
210 215 220
Leu Val Val Tyr Cys Ser Met Phe Arg Val Ala Arg Val Ala Ala Met
225 230 235 240
Gln His Gly Pro Leu Pro Thr Trp Met Glu Thr Pro Arg Gln Arg Ser
245 250 255
Glu Ser Leu Ser Ser Arg Ser Thr Met Val Thr Ser Ser Gly Ala Pro
260 265 270
Gln Thr Thr Pro His Arg Thr Phe Gly Gly Gly Lys Ala Ala Val Val
275 280 285
Leu Leu Ala Val Gly Gly Gln Phe Leu Leu Cys Trp Leu Pro Tyr Phe
290 295 300
Ser Phe His Leu Tyr Val Ala Leu Ser Ala Gln Pro Ile Ser Thr Gly
305 310 315 320
Gln Val Glu Ser Val Val Thr Trp Ile Gly Tyr Phe Cys Phe Thr Ser
325 330 335
Asn Pro Phe Phe Tyr Gly Cys Leu Asn Arg Gln Ile Arg Gly Glu Leu
340 345 350
Ser Lys Gln Phe Val Cys Phe Phe Lys Pro Ala Pro Glu Glu Glu Leu
355 360 365
Arg Leu Pro Ser Arg Glu Gly Ser Ile Glu Glu Asn Phe Leu Gln Phe
370 375 380
Leu Gln Gly Thr Gly Cys Pro Ser Glu Ser Trp Val Ser Arg Pro Leu
385 390 395 400
Pro Ser Pro Lys Gln Glu Pro Pro Ala Val Asp Phe Arg Ile Pro Gly
405 410 415
Gln Ile Ala Glu Glu Thr Ser Glu Phe Leu Glu Gln Gln Leu Thr Ser
420 425 430
Asp Ile Ile Met Ser Asp Ser Tyr Leu Arg Pro Ala Ala Ser Pro Arg
435 440 445
Leu Glu Ser Ala Ile Ser Ala Glu Phe His His Thr Gly Leu Val Asp
450 455 460
Pro Ser Ser Val Pro Ser Leu Gly Cys Arg Ser Met Gly Cys Leu Gly
465 470 475 480
Asn Ser Lys Thr Glu Asp Gln Arg Asn Glu Glu Lys Ala Gln Arg Glu
485 490 495
Ala Asn Lys Lys Ile Glu Lys Gln Leu Gln Lys Asp Lys Gln Val Tyr
500 505 510
Arg Ala Thr His Arg Leu Leu Leu Leu Gly Ala Gly Glu Ser Gly Lys
515 520 525
Ser Thr Ile Val Lys Gln Met Arg Ile Leu His Val Asn Gly Phe Asn
530 535 540
Gly Glu Gly Gly Glu Glu Asp Pro Gln Ala Ala Arg Ser Asn Ser Asp
545 550 555 560
Gly Glu Lys Ala Thr Lys Val Gln Asp Ile Lys Asn Asn Leu Lys Glu
565 570 575
Ala Ile Glu Thr Ile Val Ala Ala Met Ser Asn Leu Val Pro Pro Val
580 585 590
Glu Leu Ala Asn Pro Glu Asn Gln Phe Arg Val Asp Tyr Ile Leu Ser
595 600 605
Val Met Asn Val Pro Asn Phe Asp Phe Pro Pro Glu Phe Tyr Glu His
610 615 620
Ala Lys Ala Leu Trp Glu Asp Glu Gly Val Arg Ala Cys Tyr Glu Arg
625 630 635 640
Ser Asn Glu Tyr Gln Leu Ile Asp Cys Ala Gln Tyr Phe Leu Asp Lys
645 650 655
Ile Asp Val Ile Lys Gln Ala Asp Tyr Val Pro Ser Asp Gln Asp Leu
660 665 670
Leu Arg Cys Arg Val Leu Thr Ser Gly Ile Phe Glu Thr Lys Phe Gln
675 680 685
Val Asp Lys Val Asn Phe His Met Phe Asp Val Gly Gly Gln Arg Asp
690 695 700
Glu Arg Arg Lys Trp Ile Gln Cys Phe Asn Asp Val Thr Ala Ile Ile
705 710 715 720
Phe Val Val Ala Ser Ser Ser Tyr Asn Met Val Ile Arg Glu Asp Asn
725 730 735
Gln Thr Asn Arg Leu Gln Glu Ala Leu Asn Leu Phe Lys Ser Ile Trp
740 745 750
Asn Asn Arg Trp Leu Arg Thr Ile Ser Val Ile Leu Phe Leu Asn Lys
755 760 765
Gln Asp Leu Leu Ala Glu Lys Val Leu Ala Gly Lys Ser Lys Ile Glu
770 775 780
Asp Tyr Phe Pro Glu Phe Ala Arg Tyr Thr Thr Pro Glu Asp Ala Thr
785 790 795 800
Pro Glu Pro Gly Glu Asp Pro Arg Val Thr Arg Ala Lys Tyr Phe Ile
805 810 815
Arg Asp Glu Phe Leu Arg Ile Ser Thr Ala Ser Gly Asp Gly Arg His
820 825 830
Tyr Cys Tyr Pro His Phe Thr Cys Ala Val Asp Thr Glu Asn Ile Arg
835 840 845
Arg Val Phe Asn Asp Cys Arg Asp Ile Ile Gln Arg Met His Leu Arg
850 855 860
Gln Tyr Glu Leu Leu
865
<210>101
<211>30
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>101
tctagaatga cgtccacctg caccaacagc 30
<210>102
<211>34
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>102
gatatcgcag gaaaagtagc agaatcgtag gaag 34
<210>103
<211>2781
<212>DNA
<213>智人(Homo sapiens)和大鼠
<400>103
atgacgtcca cctgcaccaa cagcacgcgc gagagtaaca gcagccacac gtgcatgccc 60
ctctccaaaa tgcccatcag cctggcccac ggcatcatcc gctcaaccgt gctggttatc 120
ttcctcgccg cctctttcgt cggcaacata gtgctggcgc tagtgttgca gcgcaagccg 180
cagctgctgc aggtgaccaa ccgttttatc tttaacctcc tcgtcaccga cctgctgcag 240
atttcgctcg tggccccctg ggtggtggcc acctctgtgc ctctcttctg gcccctcaac 300
agccacttct gcacggccct ggttagcctc acccacctgt tcgccttcgc cagcgtcaac 360
accattgtcg tggtgtcagt ggatcgctac ttgtccatca tccaccctct ctcctacccg 420
tccaagatga cccagcgccg cggttacctg ctcctctatg gcacctggat tgtggccatc 480
ctgcagagca ctcctccact ctacggctgg ggccaggctg cctttgatga gcgcaatgct 540
ctctgctcca tgatctgggg ggccagcccc agctacacta ttctcagcgt ggtgtccttc 600
atcgtcattc cactgattgt catgattgcc tgctactccg tggtgttctg tgcagcccgg 660
aggcagcatg ctctgctgta caatgtcaag agacacagct tggaagtgcg agtcaaggac 720
tgtgtggaga atgaggatga agagggagca gagaagaagg aggagttcca ggatgagagt 780
gagtttcgcc gccagcatga aggtgaggtc aaggccaagg agggcagaat ggaagccaag 840
gacggcagcc tgaaggccaa ggaaggaagc acggggacca gtgagagtag tgtagaggcc 900
aggggcagcg aggaggtcag agagagcagc acggtggcca gcgacggcag catggagggt 960
aaggaaggca gcaccaaagt tgaggagaac agcatgaagg cagacaaggg tcgcacagag 1020
gtcaaccagt gcagcattga cttgggtgaa gatgacatgg agtttggtga agacgacatc 1080
aatttcagtg aggatgacgt cgaggcagtg aacatcccgg agagcctccc acccagtcgt 1140
cgtaacagca acagcaaccc tcctctgccc aggtgctacc agtgcaaagc tgctaaagtg 1200
atcttcatca tcattttctc ctatgtgcta tccctggggc cctactgctt tttagcagtc 1260
ctggccgtgt gggtggatgt cgaaacccag gtaccccagt gggtgatcac cataatcatc 1320
tggcttttct tcctgcagtg ctgcatccac ccctatgtct atggctacat gcacaagacc 1380
attaagaagg aaatccagga catgctgaag aagttcttct gcaaggaaaa gcccccgaaa 1440
gaagatagcc acccagacct gcccggaaca gagggtggga ctgaaggcaa gattgtccct 1500
tcctacgatt ctgctacttt tcctgcgata tctgcagaat tccaccacac tggactagtg 1560
gatccgagct cggtaccaag cttgggctgc aggtcgatgg gctgcctcgg caacagtaag 1620
accgaggacc agcgcaacga ggagaaggcg cagcgcgagg ccaacaaaaa gatcgagaag 1680
cagctgcaga aggacaagca ggtctaccgg gccacgcacc gcctgctgct gctgggtgct 1740
ggagagtctg gcaaaagcac cattgtgaag cagatgagga tcctacatgt taatgggttt 1800
aacggagagg gcggcgaaga ggacccgcag gctgcaagga gcaacagcga tggtgagaag 1860
gccaccaaag tgcaggacat caaaagcaac ctgaaggagg ccattgaaac cattgtggcc 1920
gccatgagca acctggtgcc ccccgtggag ctggccaacc ctgagaacca gttcagagtg 1980
gactacattc tgagcgtgat gaacgtgcca aactttgact tcccacctga attctatgag 2040
catgccaagg ctctgtggga ggatgaggga gttcgtgcct gctacgagcg ctccaacgag 2100
taccagctga tcgactgtgc ccagtacttc ctggacaaga ttgatgtgat caagcaggcc 2160
gactacgtgc caagtgacca ggacctgctt cgctgccgcg tcctgacctc tggaatcttt 2220
gagaccaagt tccaggtgga caaagtcaac ttccacatgt tcgatgtggg cggccagcgc 2280
gatgaacgcc gcaagtggat ccagtgcttc aatgatgtga ctgccatcat cttcgtggtg 2340
gccagcagca gctacaacat ggtcatccgg gaggacaacc agaccaaccg tctgcaggag 2400
gctctgaacc tcttcaagag catctggaac aacagatggc tgcgtaccat ctctgtgatc 2460
ctcttcctca acaagcaaga tctgcttgct gagaaggtcc tcgctgggaa atcgaagatt 2520
gaggactact ttccagagtt cgctcgctac accactcctg aggatgcgac tcccgagccc 2580
ggagaggacc cacgcgtgac ccgggccaag tacttcatcc gggatgagtt tctgagaatc 2640
agcactgcta gtggagatgg acgtcactac tgctaccctc actttacctg cgccgtggac 2700
actgagaaca tccgccgtgt cttcaacgac tgccgtgaca tcatccagcg catgcatctt 2760
cgccaatacg agctgctcta a 2781
<210>104
<211>926
<212>PRT
<213>智人(Homo sapiens)和大鼠
<400>104
Met Thr Ser Thr Cys Thr Asn Ser Thr Arg Glu Ser Asn Ser Ser His
1 5 10 15
Thr Cys Met Pro Leu Ser Lys Met Pro Ile Ser Leu Ala His Gly Ile
20 25 30
Ile Arg Ser Thr Val Leu Val Ile Phe Leu Ala Ala Ser Phe Val Gly
35 40 45
Asn Ile Val Leu Ala Leu Val Leu Gln Arg Lys Pro Gln Leu Leu Gln
50 55 60
Val Thr Asn Arg Phe Ile Phe Asn Leu Leu Val Thr Asp Leu Leu Gln
65 70 75 80
Ile Ser Leu Val Ala Pro Trp Val Val Ala Thr Ser Val Pro Leu Phe
85 90 95
Trp Pro Leu Asn Ser His Phe Cys Thr Ala Leu Val Ser Leu Thr His
100 105 110
Leu Phe Ala Phe Ala Ser Val Asn Thr Ile Val Val Val Ser Val Asp
115 120 125
Arg Tyr Leu Ser Ile Ile His Pro Leu Ser Tyr Pro Ser Lys Met Thr
130 135 140
Gln Arg Arg Gly Tyr Leu Leu Leu Tyr Gly Thr Trp Ile Val Ala Ile
145 150 155 160
Leu Gln Ser Thr Pro Pro Leu Tyr Gly Trp Gly Gln Ala Ala Phe Asp
165 170 175
Glu Arg Asn Ala Leu Cys Ser Met Ile Trp Gly Ala Ser Pro Ser Tyr
180 185 190
Thr Ile Leu Ser Val Val Ser Phe Ile Val Ile Pro Leu Ile Val Met
195 200 205
Ile Ala Cys Tyr Ser Val Val Phe Cys Ala Ala Arg Arg Gln His Ala
210 215 220
Leu Leu Tyr Asn Val Lys Arg His Ser Leu Glu Val Arg Val Lys Asp
225 230 235 240
Cys Val Glu Asn Glu Asp Glu Glu Gly Ala Glu Lys Lys Glu Glu Phe
245 250 255
Gln Asp Glu Ser Glu Phe Arg Arg Gln His Glu Gly Glu Val Lys Ala
260 265 270
Lys Glu Gly Arg Met Glu Ala Lys Asp Gly Ser Leu Lys Ala Lys Glu
275 280 285
Gly Ser Thr Gly Thr Ser Glu Ser Ser Val Glu Ala Arg Gly Ser Glu
290 295 300
Glu Val Arg Glu Ser Ser Thr Val Ala Ser Asp Gly Ser Met Glu Gly
305 310 315 320
Lys Glu Gly Ser Thr Lys Val Glu Glu Asn Ser Met Lys Ala Asp Lys
325 330 335
Gly Arg Thr Glu Val Asn Gln Cys Ser Ile Asp Leu Gly Glu Asp Asp
340 345 350
Met Glu Phe Gly Glu Asp Asp Ile Asn Phe Ser Glu Asp Asp Val Glu
355 360 365
Ala Val Asn Ile Pro Glu Ser Leu Pro Pro Ser Arg Arg Asn Ser Asn
370 375 380
Ser Asn Pro Pro Leu Pro Arg Cys Tyr Gln Cys Lys Ala Ala Lys Val
385 390 395 400
Ile Phe Ile Ile Ile Phe Ser Tyr Val Leu Ser Leu Gly Pro Tyr Cys
405 410 415
Phe Leu Ala Val Leu Ala Val Trp Val Asp Val Glu Thr Gln Val Pro
420 425 430
Gln Trp Val Ile Thr Ile Ile Ile Trp Leu Phe Phe Leu Gln Cys Cys
435 440 445
Ile His Pro Tyr Val Tyr Gly Tyr Met His Lys Thr Ile Lys Lys Glu
450 455 460
Ile Gln Asp Met Leu Lys Lys Phe Phe Cys Lys Glu Lys Pro Pro Lys
465 470 475 480
Glu Asp Ser His Pro Asp Leu Pro Gly Thr Glu Gly Gly Thr Glu Gly
485 490 495
Lys Ile Val Pro Ser Tyr Asp Ser Ala Thr Phe Pro Ala Ile Ser Ala
500 505 510
Glu Phe His His Thr Gly Leu Val Asp Pro Ser Ser Val Pro Ser Leu
515 520 525
Gly Cys Arg Ser Met Gly Cys Leu Gly Asn Ser Lys Thr Glu Asp Gln
530 535 540
Arg Asn Glu Glu Lys Ala Gln Arg Glu Ala Asn Lys Lys Ile Glu Lys
545 550 555 560
Gln Leu Gln Lys Asp Lys Gln Val Tyr Arg Ala Thr His Arg Leu Leu
565 570 575
Leu Leu Gly Ala Gly Glu Ser Gly Lys Ser Thr Ile Val Lys Gln Met
580 585 590
Arg Ile Leu His Val Asn Gly Phe Asn Gly Glu Gly Gly Glu Glu Asp
595 600 605
Pro Gln Ala Ala Arg Ser Asn Ser Asp Gly Glu Lys Ala Thr Lys Val
610 615 620
Gln Asp Ile Lys Asn Asn Leu Lys Glu Ala Ile Glu Thr Ile Val Ala
625 630 635 640
Ala Met Ser Asn Leu Val Pro Pro Val Glu Leu Ala Asn Pro Glu Asn
645 650 655
Gln Phe Arg Val Asp Tyr Ile Leu Ser Val Met Asn Val Pro Asn Phe
660 665 670
Asp Phe Pro Pro Glu Phe Tyr Glu His Ala Lys Ala Leu Trp Glu Asp
675 680 685
Glu Gly Val Arg Ala Cys Tyr Glu Arg Ser Asn Glu Tyr Gln Leu Ile
690 695 700
Asp Cys Ala Gln Tyr Phe Leu Asp Lys Ile Asp Val Ile Lys Gln Ala
705 710 715 720
Asp Tyr Val Pro Ser Asp Gln Asp Leu Leu Arg Cys Arg Val Leu Thr
725 730 735
Ser Gly Ile Phe Glu Thr Lys Phe Gln Val Asp Lys Val Asn Phe His
740 745 750
Met Phe Asp Val Gly Gly Gln Arg Asp Glu Arg Arg Lys Trp Ile Gln
755 760 765
Cys Phe Asn Asp Val Thr Ala Ile Ile Phe Val Val Ala Ser Ser Ser
770 775 780
Tyr Asn Met Val Ile Arg Glu Asp Asn Gln Thr Asn Arg Leu Gln Glu
785 790 795 800
Ala Leu Asn Leu Phe Lys Ser Ile Trp Asn Asn Arg Trp Leu Arg Thr
805 810 815
Ile Ser Val Ile Leu Phe Leu Asn Lys Gln Asp Leu Leu Ala Glu Lys
820 825 830
Val Leu Ala Gly Lys Ser Lys Ile Glu Asp Tyr Phe Pro Glu Phe Ala
835 840 845
Arg Tyr Thr Thr Pro Glu Asp Ala Thr Pro Glu Pro Gly Glu Asp Pro
850 855 860
Arg Val Thr Arg Ala Lys Tyr Phe Ile Arg Asp Glu Phe Leu Arg Ile
865 870 875 880
Ser Thr Ala Ser Gly Asp Gly Arg His Tyr Cys Tyr Pro His Phe Thr
885 890 895
Cys Ala Val Asp Thr Glu Asn Ile Arg Arg Val Phe Asn Asp Cys Arg
900 905 910
Asp Ile Ile Gln Arg Met His Leu Arg Gln Tyr Glu Leu Leu
915 920 925
<210>105
<211>23
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>105
catgtatgcc agcgtcctgc tcc 23
<210>106
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>106
gctatgcctg aagccagtct tgtg 24
<210>107
<211>25
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>107
gcacctgctc ctgagcacct tctcc 25
<210>108
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>108
cacagcgctg cagccctgca gctggc 26
<210>109
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>109
ccagtgatga ctctgtccag cctg 24
<210>110
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>110
cagacacttg gcagggacga ggtg 24
<210>111
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>111
cttgtggtct actgcagcat gttccg 26
<210>112
<211>25
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>112
catatccctc cgagtgtcca gcggc 25
<210>113
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>113
atggatcctt atcatggctt cctc 24
<210>114
<211>27
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>114
caagaacagg tctcatctaa gagctcc 27
<210>115
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>115
ctctgatgcc atctgctgga ttcctg 26
<210>116
<211>26
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>116
gtagtccact gaaagtccag tgatcc 26
<210>117
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>117
tggtggcgat ggccaacagc gctc 24
<210>118
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>118
gttgcgcctt agcgacagat gacc 24
<210>119
<211>23
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>119
tcaacctgta tagcagcatc ctc 23
<210>120
<211>23
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>120
aaggagtagc agaatggtta gcc 23
<210>121
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>121
gacacctgtc agcggtcgtg tgtg 24
<210>122
<211>27
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>122
ctgatggaag tagaggctgt ccatctc 27
<210>123
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>123
gcgctgagcg cagaccagtg gctg 24
<210>124
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>124
cacggtgacg aagggcacga gctc 24
<210>125
<211>24
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>125
agccatccct gccaggaagc atgg 24
<210>126
<211>25
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>126
ccaggtaggt gtgcagcaca atggc 25
<210>127
<211>25
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>127
ctgttcaaca gggctggttg gcaac 25
<210>128
<211>25
<212>DNA
<213>人工序列
<220>
<223>新序列
<400>128
atcatgtcta gactcatggt gatcc 25
<210>129
<211>6
<212>PRT
<213>人工序列
<220>
<223>新序列
<400>129
Thr Leu Glu Ser Ile Met
1 5
<210>130
<211>5
<212>PRT
<213>人工序列
<220>
<223>新序列
<400>130
Glu Tyr Asn Leu Val
1 5
<210>131
<211>5
<212>PRT
<213>人工序列
<220>
<223>新序列
<400>131
Asp Cys Gly Leu Phe
1 5
<210>132
<211>36
<212>PRT
<213>人工序列
<220>
<223>新序列
<400>132
Gly Ala Thr Cys Ala Ala Gly Cys Thr Thr Cys Cys Ala Thr Gly Gly
1 5 10 15
Cys Gly Thr Gly Cys Thr Gly Cys Cys Thr Gly Ala Gly Cys Gly Ala
20 25 30
Gly Gly Ala Gly
35
<210>133
<211>53
<212>PRT
<213>人工序列
<220>
<223>新序列
<400>133
Gly Ala Thr Cys Gly Gly Ala Thr Cys Cys Thr Thr Ala Gly Ala Ala
1 5 10 15
Cys Ala Gly Gly Cys Cys Gly Cys Ala Gly Thr Cys Cys Thr Thr Cys
20 25 30
Ala Gly Gly Thr Thr Cys Ala Gly Cys Thr Gly Cys Ala Gly Gly Ala
35 40 45
Thr Gly Gly Thr Gly
50