书签 分享 收藏 举报 版权申诉 / 197

通过使用单链多肽融合蛋白进行疼痛的治疗.pdf

  • 上传人:zhu****_FC
  • 文档编号:8437365
  • 上传时间:2020-06-30
  • 格式:PDF
  • 页数:197
  • 大小:1.62MB
  • 摘要
    申请专利号:

    CN200780028089.0

    申请日:

    20070601

    公开号:

    CN101495135B

    公开日:

    20131030

    当前法律状态:

    有效性:

    有效

    法律详情:

    IPC分类号:

    A61K38/48,A61K39/08,A61P25/04

    主分类号:

    A61K38/48,A61K39/08,A61P25/04

    申请人:

    赛恩泰新公司,爱力根公司

    发明人:

    K·福斯特,J·查多克,P·马科斯,P·斯坦库姆,K·R·奥基,J·弗朗西斯,L·斯图尔德

    地址:

    英国牛津郡

    优先权:

    0610867.4

    专利代理机构:

    北京纪凯知识产权代理有限公司

    代理人:

    赵蓉民;路小龙

    PDF完整版下载: PDF下载
    内容摘要

    治疗分子的使用,用于特定疼痛病状的治疗,其中所述治疗分子是单链的多肽融合蛋白,其包含:非细胞毒性的蛋白酶,或其片段,所述蛋白酶或蛋白酶片段能够剪切疼痛感应传入器中胞吐融合器的蛋白;能够结合所述疼痛感觉传入器上结合位点的靶向部分,所述结合位点能够进行细胞内吞,以便被并入到所述疼痛感觉传入器的内涵体中;蛋白酶剪切位点,在该位点所述融合蛋白可被蛋白酶剪切,其中所述蛋白酶剪切位点位于所述非细胞毒性的蛋白酶或其片段和所述靶向部分之间;和转运区域,其能够从内涵体中转运所述蛋白酶或蛋白酶片段,跨内涵体膜并进入所述疼痛感觉传入器的细胞溶胶。

    权利要求书

    1.单链的多肽融合蛋白,其从N到C端包含:a).非细胞毒性的蛋白酶,所述蛋白酶能够剪切疼痛感应传入器中胞吐融合器的蛋白,其中所述非细胞毒性蛋白酶是梭菌神经毒素L-链或IgA蛋白酶;b).蛋白酶剪切位点,在该位点所述融合蛋白可被蛋白酶剪切,其中所述蛋白酶剪切位点位于所述非细胞毒性蛋白酶与靶向部分之间;c).能够结合所述疼痛感应传入器上之结合位点的阿片样物质靶向部分,所述结合位点能够进行细胞内吞作用,以被并入疼痛感应传入器中的内涵体内,其中所述靶向部分选自伤害感受肽、β-内啡肽、内啡素-1、内啡素-2、强啡肽、met-脑啡肽、leu-脑啡肽、甘丙肽和PAR-2肽;和d).转运区域,其能够将所述蛋白酶从内涵体中跨内涵体膜转运,并进入疼痛感应传入器的细胞溶胶中;其中所述转运区域是梭菌神经毒素的H区域,或是选自下述的转运区域:白喉毒素、假单胞菌外毒素的区域II、炭疽病毒素、源自流感病毒血凝素、塞姆利基森林病毒融合蛋白、水泡性口炎病毒糖蛋白G、SER病毒F蛋白、泡沫病毒包膜糖蛋白的融合和/或两亲肽;其中所述靶向部分和所述蛋白酶剪切位点由0个氨基酸残基分隔。 2.根据权利要求1的融合蛋白,其中所述阿片样物质靶向部分是疼痛感应传入器上存在的受体的激动剂。 3.根据权利要求1的融合蛋白,其中所述阿片样物质靶向部分是初级疼痛感应传入器上存在的受体的激动剂。 4.根据权利要求1的融合蛋白,其中所述阿片样物质靶向部分结合ORL受体。 5.根据权利要求4的融合蛋白,其中所述阿片样物质靶向部分特异地结合ORL受体。 6.根据权利要求4的融合蛋白,其中所述阿片样物质靶向部分是ORL受体的激动剂。 7.根据权利要求1的融合蛋白,其中所述阿片样物质靶向部分是SEQ ID No.38。 8.根据权利要求1的融合蛋白,其中所述阿片样物质靶向部分是SEQ ID Nos:40、42、44、46、48或50之一。 9.根据权利要求1的融合蛋白,其中所述阿片样物质靶向部分是伤害感受肽。 10.根据权利要求1的融合蛋白,其中所述融合蛋白包含纯化标记。 11.根据权利要求10的融合蛋白,其中所述融合蛋白包含纯化标记,其存在于所述融合蛋白的N-末端和/或C-末端。 12.根据权利要求10或11的融合蛋白,其中所述纯化标记通过肽间隔分子被连接到所述融合蛋白。 13.根据权利要求1的融合蛋白,其中所述转运区域由肽间隔分子与所述阿片样物质靶向部分分隔。 14.根据权利要求1所述多肽融合蛋白,其中所述多肽融合蛋白选自SEQ ID NOs:14、18、20、22、24、26、28、30、32、34、36、59、61、64、67、69、71、73、76、79、82、85或88中任一。 15.核酸序列,其编码根据权利要求1的多肽融合蛋白。 16.根据权利要求15的核酸序列,其中所述核酸分子选自下述任何之一:SEQ ID NOs:1-13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、58、60、63、66、68、70、72、75、78、81、84或者87。 17.DNA载体,其包括启动子、根据权利要求15或者权利要求16的核酸序列,其中所述DNA序列位于所述启动子的下游,并且终止子位于DNA构建物的下游。 18.根据权利要求15或者权利要求16的DNA序列的互补DNA链。 19.用于制备根据权利要求1-14的任何一项所述的单链多肽融合蛋白的方法,包括:在宿主细胞中,表达根据权利要求15或者权利要求16的核酸序列,或者表达权利要求17的DNA载体。 20.制备非细胞毒性的物质的方法,包括:a.使权利要求1-14中任意一项所定义的单链多肽融合蛋白与能够剪切所述蛋白酶剪切位点的蛋白酶接触;b.剪切所述蛋白酶剪切位点;并由此形成双链融合蛋白。 21.非细胞毒性的多肽,可通过权利要求20所述的方法获得,其中所述多肽是双链多肽,并且其中:(a).第一条链包含非细胞毒性的蛋白酶,所述蛋白酶能够剪切疼痛感应传入器中胞吐融合器的蛋白;其中所述非细胞毒性蛋白酶是梭菌神经毒素L-链或IgA蛋白酶;(b).第二条链包含阿片样物质靶向部分和转运区域,其能够将蛋白酶从内涵体中跨内涵体膜转运并进入所述疼痛感应传入器的细胞溶胶中;其中所述转运区域是梭菌神经毒素的H区域,或是选自下述的转运区域:白喉毒素、假单胞菌外毒素的区域II、炭疽病毒素、源自流感病毒血凝素、塞姆利基森林病毒融合蛋白、水泡性口炎病毒糖蛋白G、SER病毒F蛋白、泡沫病毒包膜糖蛋白的融合和/或两亲肽;并且所述第一条链和第二条链被二硫键连接在一起。 22.根据权利要求1-14的任何一项的融合蛋白或者根据权利要求21的多肽的用于制备药物中的用途,所述药物用于治疗、预防或缓解疼痛。 23.根据权利要求22的用途,其中所述疼痛是慢性疼痛。

    说明书

    本发明涉及非细胞毒性的融合蛋白的用途,用于特定类型疼痛的治疗。 

    根据其在靶细胞上产生效果的类型,毒素可被一般地分为两组。更详细地,第一组毒素杀死它们的天然靶细胞,并因此是通常所说的细胞毒性毒素分子。这一组的毒素特别地由植物毒素,如蓖麻毒素和相思豆毒素;并由细菌毒素,如白喉毒素和假单胞菌外毒素A(Pseudomonas exotoxin A)示例。细胞毒毒素在“魔法子弹”(如,免疫偶联物(immunoconjugate),其包含细胞毒毒素组分和与靶细胞特定标记进行结合的抗体)的设计中已经吸引了极大的兴趣,其被用于细胞紊乱和状况,如癌症的治疗。细胞毒毒素典型地通过抑制蛋白合成的细胞过程杀死它们的靶细胞。 

    第二组毒素,其被称作非细胞毒性的毒素,不杀死(如它们的名字所证实)它们天然的靶细胞。非细胞毒性的毒素与它们的细胞毒性相似物相比,吸引了较少的商用兴趣,并且通过抑制蛋白合成以外的细胞过程对靶细胞产生它们的影响。非细胞毒性的毒素通过多种植物,并通过多种微生物,如梭菌属某一种(Clostridium sp.)和奈瑟菌属某一种(Neisseria sp.)产生。 

    梭菌神经毒素是典型地具有150kDa数量级分子量的蛋白。它们由多种细菌属类物种产生,特别地由梭菌类产生,最重要地,由破伤风梭菌(C.tetani)和肉毒梭菌(C.botulinum)、丁酸梭菌(C.butyricum)和阿根廷梭菌(C.argentinense)的几种菌株产生。目前有8种不同类型的梭菌毒素,即:破伤风毒素,和血清型A、B、C1、D、E、F和G的肉毒菌神经毒素,并且它们都共享相似的结构和作用形式。 

    梭菌神经毒素代表了一组主要的非神经毒性的毒素分子,并通过宿主细菌作为单一多肽被合成,所述单一多肽通过蛋白水解剪切事件被翻译后修饰,以形成由二硫键连接在一起的两个多肽链。这两条链被称为具有约100kDa分子量的重链(H-链),和具有约50kDa分子量的轻链(L-链)。 

    L-链具有蛋白酶功能(锌依靠肽链内切酶活性)并显示出对胞吐(exocytic)过程中涉及的囊泡和/或质膜相关蛋白高的底物特异性。来自不同梭菌属种或血清型的L-链可以水解三种底物蛋白之一中的不同但特异的肽键,所述三种底物蛋白为小突触小泡蛋白(synaptobrevin)、突触融合蛋白(syntaxin)或SNAP-25。这些底物是神经分泌机制的重要组分。 

    奈瑟菌属,最重要地来自淋球菌(N.gonorrhoeae)的,产生功能相似的非细胞毒性蛋白酶。这些蛋白酶的一个实例是IgA蛋白酶(参见WO99/58571)。 

    现有技术中已经明确记载:毒素分子可以被重新靶向并非该毒素的天然靶细胞的细胞。当被所谓的重新靶向时,修饰的毒素能够结合目标靶细胞,并且接下来转运到细胞溶胶,能够对靶细胞产生其效应。所述重新靶向通过用不同的TM(靶向部分Targeting Moiety)替换该毒素的天然靶向部分(TM)完成。在这一点上,TM被选择以便其结合目标靶细胞,并允许修饰的毒素后续进入靶细胞内的内涵体之内。修饰的毒素也包含转运区域,以使非细胞毒性的蛋白酶进入细胞溶胶。该转运区域可以是该毒素的天然转运区域,或其可以是从具有转运活性的微生物蛋白中获得的不同转运区域。 

    上述TM替换可以通过普通技术人员公知的传统化学偶联技术被实现。在这一点上,参考Hermanson,G.T.(1996),Bioconjugatetechniques,Academic Press,并参考Wong,S.S.(1991),Chemistry ofprotein conjugation and cross-linking,CRC Press。 

    然而,化学偶联通常是不精确的。例如,偶联之后,TM可以在多于一个连接位点被连接到该偶联物的剩余部分。 

    化学偶联也难以控制。例如,TM可以在蛋白酶组分和/或转运组分的连接位点被连接到修饰毒素的剩余部分。当仅连接到所述组分之一(优选地在单一位点)对治疗效力是期望的时候,这是有问题的。 

    因此,化学偶联导致混合种类的修饰毒素分子,这是不理想的。 

    作为化学偶联的替代方案,TM代替可以被单一多肽融合蛋白的重组制备实现(参见WO98/07864)。该技术基于体内细菌机制,通过该机制,原生梭菌神经毒素(即,全毒素)被制备,并产生具有以下结构排列的融合蛋白:NH2-[蛋白酶组分]-[转运组分]-[TM]-COOH 

    根据WO98/07864,TM被置于朝向融合蛋白的C-末端。该融合蛋白随后通过用蛋白酶处理被激活,所述蛋白酶在蛋白酶组分和转运组分之间剪切。双链蛋白随后被产生,其包含共价连接(通过二硫键)到含有转运组分加TM的另一单一多肽链的,作为单一多肽链蛋白酶组分的蛋白酶组分。尽管WO98/07864的方法遵循了(按照融合蛋白的结构排列而言)梭菌全毒素的天然表达系统,但是本发明人已经发现该系统可以导致某些融合蛋白的产生,其对预期的靶细胞具有本质上降低的结合能力。 

    这一问题在治疗特定类型疼痛的情况下特别相关。 

    本发明通过提供用于生产治疗特定类型疼痛的药物的治疗分子的使用,解决了一个或多个上述问题,其中所述治疗分子是单链的多肽融合蛋白,其包含:a.非细胞毒性的蛋白酶(a non-cytotoxic protease)或其片段,所述蛋白酶或蛋白酶片段能够剪切疼痛感应传入器(或伤害感应传入器,nociceptive sensoryafferent)中细胞外融合器(exocytic fusion apparatus)的蛋白;b.能够结合疼痛感应传入器上之结合位点(BindingSite)的靶向部分(Targeting Moiety),所述结合位点能够进行细胞内吞作用,以被并入疼痛感应传入器中的内涵体内;c.蛋白酶剪切位点(protease cleavage site),在该位点 融合蛋白可被蛋白酶剪切,其中所述蛋白酶剪切位点位于非细胞毒性蛋白酶或其片段和靶向部分之间;和d.转运区域(translocation domain),其能够将蛋白酶或蛋白酶片段从内涵体中跨内涵体膜转运,并进入疼痛感应传入器的细胞溶胶中。 

    本发明人已经发现WO 98/07864的融合蛋白系统对需要N-末端区域与疼痛感应传入器上的结合位点相互作用的TMs来说不是最优化的。这一问题对于TMs来说特别尖锐,所述TMs需要特定的N-末端氨基酸残基或包括N-末端氨基酸残基的特定序列的氨基酸残基,用以与疼痛感应传入器上的结合位点相互作用。 

    与WO98/07864相反,本发明采用了非细胞毒性的融合蛋白,其中所述融合体的TM组分包括内部区域中的相关结合区域或朝向TM中部(即,线性肽序列的中部)放置的氨基酸序列,或优选地,朝向TM的N-末端放置,或更优选地位于或接近N-末端的氨基酸序列。所述N-末端区域能够结合疼痛感应传入器上的结合位点,并且所述TM优选地有对特定的和界定的氨基酸残基序列有要求,以在其N-末端是游离的。 

    本文所述的化合物可被用于治疗患有一种或多种类型慢性疼痛的患者,所述慢性疼痛包括神经性疼痛、炎症疼痛、头痛、身体疼痛、内脏疼痛和牵涉性疼痛。 

    “治疗”,用在这里,表示医学上的处理。它包括,例如,给予本发明的化合物,以预防疼痛或减轻其严重性。 

    术语“疼痛”,用在这里,表示任何不愉快的感官经历,通常与身体疾病相关。身体疾病对医生可能明显或可能不明显。疼痛有两种类型:慢性和急性。“急性疼痛”是突然发生的,短时间的疼痛。一种类型的急性疼痛,例如,是在皮肤或其它表面组织的伤口处,如由割伤或烧伤引起的,感觉到的皮肤疼痛。皮肤疼痛感受器仅终止于皮肤以下,并且由于高浓度的神经末端,产生良好定义的短期局部疼痛。“慢性疼痛”是急性疼痛以外的疼痛。慢性疼痛包括神经性疼痛、炎症疼痛、头痛、身体疼痛、内脏疼痛和牵涉性疼痛。 

    I.神经性疼痛

    本发明所述的化合物可以被用于治疗由任何以下神经性疼痛状况引起的或与其相关的疼痛。“神经性疼痛”表示来自外周神经系统、中枢神经系统或两者的不正常的感觉输入,导致不适。 

    A.神经性疼痛的症状

    神经性疼痛的症状可以包括持续、自发的疼痛,以及痛觉异常(allodynia)(对通常非疼痛的刺激的疼痛反应)、痛觉增敏(hyperalgesia)(对通常仅引起轻微不适的疼痛刺激,如针刺,产生的加重的反应)、或痛觉过敏(hyperpathia)(短暂的不适成为长期严重的疼痛)。 

    B.神经性疼痛的原因

    神经性疼痛可由以下任意原因引起。1.外伤性损害,例如,如神经压迫伤(如,神经压迫、神经拉伸、神经卡压(nerve entrapment)或不完整的神经切面);脊柱伤(如,脊柱的一半切除);腿截肢;挫伤;炎症(如,脊柱炎症);或手术过程。2.缺血性事件,包括,例如,中风和心脏病发作。3.感染物4.暴露于毒性试剂,包括,例如,药物、酒精、重金属(如铅、砷、汞)、工业试剂(如,溶剂、源自胶水的烟气)或一氧化二氮。5.疾病,包括,例如炎症性疾病,神经性肿瘤,获得性免疫缺陷综合症(acquired immune deficiency syndrome(AIDS)),莱姆病(Lymesdisease),麻风病,代谢疾病,外周神经疾病,如神经瘤、单神经病或多神经病。C.神经性疼痛的种类1.神经痛神经痛是沿一条或多条特异神经路径辐射的疼痛,通常在神经结构上没有任何可显示的病理改变。神经痛的起因是多种多样的。化学腐蚀、炎症、外伤(包括手术)、被附近的结构(如肿瘤)压迫和感染 都可以引发神经痛。但是,在多种情况下,起因是未知的或不可识别的。神经痛在老年人中最常见,但是它可以发生在任何年龄。神经痛,包括但不限于三叉神经痛、疱疹后神经痛(post-herpetic neuralgia)、疱疹后神经痛(postherpetic neuralgia)、舌咽神经痛、坐骨神经痛和非典型性面部疼痛。 

    神经痛是分布在单一神经或多个神经中的疼痛。实例是三叉神经痛、非典型性面部疼痛和疱疹后神经痛(由带状疱疹或疱疹引起)。受影响的神经负责感觉从下颚到额头的面部区域中的触摸、温度和压力。该疾病通常引起短暂的剧痛,通常少于2分钟并仅发生在面部的一侧。疼痛可以多种方式描述,如“剧痛(stabbing)”、“剧烈的(sharp)”、“闪电般的(like lightning)”、“烧灼(burning)”和甚至“痒的(itchy)”。在非典型形式的三叉神经痛中,疼痛也可以严重的或仅疼痛存在,并持续延长的时间。与三叉神经痛(TN)相关的疼痛被识别为可以被经历的最剧烈的疼痛之一。 

    简单的刺激,如吃、说话、洗脸或任何轻微的触碰或感觉可以引起发作(甚至微风的感觉)。发作可以一群发生或作为单独的发作发生。 

    症状包括位于任何位置急剧、剧烈的疼痛或持续、烧灼的疼痛,通常位于或接近身体的表面,对每个期间来说发生在相同的位置;痛沿特定神经途径的疼;由于疼痛受影响的身体部分受损的功能,或由于伴随的运动神经损伤的肌肉衰弱;提高的皮肤敏感性或受影响皮肤区域的麻木(与局部麻醉相似的感觉,如奴佛卜因注射(Novacaineshot));和被解释为疼痛的任何触摸或压力。运动也可能是疼痛的。 

    三叉神经痛是最常见形式的神经痛。它影响面部主要的感官神经,三叉神经(“三叉的”文字上表示“三个起点(three origins)”,指的是神经分成3个分支)。其症状包括严重的疼痛在面部的一侧突然而短暂的发作,沿着该侧三叉神经所牵扯的区域。疼痛发作可能严重到足以引起面部扭曲,其典型地指疼痛抽筋(神经痉挛(ticdouloureux))。有时,三叉神经痛的起因是血管或小肿瘤压迫神经。疾病,诸如多发性硬化症(影响脑和脊柱的炎症性疾病)、某些形式的关节炎和糖尿病(高血糖)也可能引起三叉神经痛,但并非总能识别出 起因。在这种情况下,某些运动,如咀嚼、说话、吞咽或接触面部的区域可能引发剧烈疼痛的痉挛。 

    相关但相当不常见的神经痛影响舌咽神经,其为咽喉提供感觉。该神经痛的症状是位于咽喉的短暂、冲击状发作的疼痛。 

    神经痛可能发生在诸如带状疱疹的感染之后,带状疱疹由带状疱疹病毒,一种疱疹病毒引起。这种神经痛在带状疱疹的疹子痊愈后产生持续的灼烧疼痛。疼痛由于受影响区域的运动或与其接触而恶化。并非所有诊断为带状疱疹的那些患者继续经历疱疹后神经痛,它会比带状疱疹更疼。疼痛和敏感可以持续数月或甚至数年。疼痛通常是对任何接触,但特别是轻触不可忍受的敏感形式。疱疹后神经痛不限制在面部;它可以发生在身体的任何位置,但通常发生在带状疱疹疹子的部位。 

    由于疼痛和患病期间的社交孤立,抑郁是常见的。 

    疱疹后神经痛可能在初始的疱疹感染的标志已经消失很长时间后恶化。可能引起神经痛的其它感染性疾病是梅毒和莱姆病(Lymedisease)。 

    糖尿病是神经痛的另一常见诱因。这一非常常见的医学问题影响几乎1/20的美国成年人。糖尿病损害向神经提供循环的微小动脉,导致神经纤维故障及有时的神经损失。糖尿病可以产生几乎任何神经痛,包括三叉神经痛、腕管综合症(carpal tunnel syndrome)(手部和腕部的疼痛和麻木)和感觉异常性股痛(由于股外侧皮神经损伤引起的大腿麻木和疼痛)。血糖的严格控制可以预防糖尿病的神经损伤并可以加速发生神经痛的患者的恢复。 

    可能与神经痛相关的其它医学症状为慢性肾衰竭和卟啉症(porphyria)——一种遗传疾病,其中身体不能清除身体中血液正常分解后产生的某些物质本身。某些药物也可能引起这个问题。 

    2.传入神经阻滞传入神经阻滞表示来自身体一部分的感觉输入的缺失,并可以由外周感觉纤维或形成中枢神经系统的神经的打断而引起。传入神经阻滞疼痛症状包括,但不限于脑或脊柱的损伤、中风后疼痛、幻觉痛、 半身不遂、上臂神经丛撕裂伤、腰部神经根病(radiculopathies)。 

    3.复杂性局部疼痛综合症(CRPSs)CRPS是起因于感应维持疼痛(sympathetically-maintained)的慢性疼痛综合症,并以两种形式存在。CRPS 1现在代替术语“反射性交感神经营养不良综合症(reflex sympathetic dystrophy syndrome)”。它是一种慢性神经病变,最常见发生在轻微或重大创伤后的胳膊和腿部。CRPS 1与严重的疼痛;指甲、骨骼和皮肤上的变化;和对受影响肢体的触碰提高的敏感度相关联。CRPS 2替代术语皮肤灼热痛(causalgia),并且其起因于识别出的对神经的伤害。CRPS包括但不限于I型CRPS(反射性交感神经营养不良综合症)和II型CRPS(皮肤灼热痛)。 

    4.神经病变

    神经病变是神经的功能或病理改变,并且通过感觉或运动神经元异常被临床表征。 

    中枢神经病变是中枢神经系统中的功能或病理改变。 

    外周神经病变是一个或多个外周神经中的功能或病理改变。外周神经从中枢神经系统(脑和脊柱)传递信息给肌肉和其它器官,并从皮肤、关节和其它器官传递回大脑。当这些神经无法携带信息往返大脑和脊柱时,外周神经病变发生,导致疼痛、感觉缺失、或无法控制肌肉。在一些情况下,控制血管、肠道和其它器官的神经的失效导致异常的血压、消化问题和其它基本身体过程的缺失。神经病变的风险因素包括糖尿病、酗酒和暴露于某些化学物质和药品。一些人具有神经病变的遗传倾向。在神经上长时间的压力是另一种发生神经损伤的风险。受压伤可能由长时间不动(如长时间的手术过程或长期患病)或由对神经的压迫引起。多神经病变表示通常同等影响两侧身体的广布过程。症状取决于何种类型的神经被影响。三种主要类型的神经为感觉、运动和自主神经。神经病变可以影响所有三种类型神经的任何一种或组合。症状也取决于该病症影响整个躯体或仅影响一束神经(如源自创伤)。慢性炎症性多神经病变的原因是异常的免疫反应。特异抗原、免疫过程和激发因子不同,并且在多种情况下是未知 的。它可能与其它症状关联发生,如HIV、炎症性肠病、红斑狼疮、慢性活动性肝炎和血细胞异常。 

    外周神经病变可能包括单一神经或神经束功能或病理的改变(单神经病变),或影响多个神经的功能或病理改变(多神经病变)。 

    外周神经病变遗传疾病进行性腓骨肌萎缩症(Charcot-Marie-Tooth disease)弗里德赖希氏共济失调(Friedreich′s ataxia)全身或代谢失调糖尿病(糖尿病神经痛)膳食缺乏(特别是维生素B-12)过量饮酒(酒精性神经痛)尿毒症(源自肾衰竭)癌症感染或炎症性病症AIDS肝炎科罗拉多壁虱热白喉格林-巴利综合症(Guillain-Barre syndrome)HIV感染而没有AIDS发展麻风病莱姆病(Lyme)结节性多动脉炎风湿性关节炎结节病干燥综合症(Sjogren syndrome) 梅毒全身红斑狼疮淀粉状物质(amyloid)暴露于有毒化合物吸入胶水或其它有毒化合物一氧化二氮工业试剂——特别是溶剂重金属(铅、砷、汞等)从属于像镇痛剂肾病的药物的神经痛多种诱因贫血(降低的氧/降低的血流)长时间暴露于冷的温度a.多神经病变多神经病变是外周神经病变,包括由多个外周神经损伤或解体引起的运动或某一区域感觉的缺失。多神经病变疼痛包括,但不限于脊髓灰质炎后综合症、乳房切除术后综合症(postmastectomy syndrome)、糖尿病神经痛、酒精性神经痛、淀粉状物质(amyloid)、毒素、AIDS、甲状腺机能减退、尿毒症、维生素缺乏、化疗引起的疼痛、2′,3′-双脱氧胞苷(ddC)治疗、格林-巴利综合症(Guillain-Barrésyndrome)或法布瑞氏症(Fabry′s disease)。b.单神经病变单神经病变是外周神经病变,包括由单一外周神经或神经束损伤或解体引起的运动或某一区域感觉的缺失。单神经病变最常见由起因于自创伤或外伤的局部区域损伤引起,尽管偶尔地,全身疾病可能引起单独的神经损伤(如多数单神经炎(mononeuritis multiplex))。常见的原因是直接外伤、对神经长时间的压迫、和由附近身体结构的肿胀或 受伤对神经的压迫。损伤包括神经髓鞘(遮盖物)的解体或部分神经细胞(轴突)的解体。损伤减缓或阻止了冲动通过神经的传导。单神经病变可能涉及身体的任何部分。单神经病变痛包括,但不限于坐骨神经功能异常、腓总神经功能异常、桡神经功能异常、尺神经功能异常、颅骨单神经病变VI、颅骨单神经病变VII、颅骨单神经病变III(压迫型)、颅骨单神经病变III(糖尿病型)、腋神经功能异常、腕管综合症、股神经功能异常、胫神经功能异常、面神经麻痹(Bell′s palsy)、胸廓出口综合症、腕管综合症和第六(外展)神经麻痹。c.普遍的外周神经病变普遍的外周神经病变是对称的,并且通常是由于各种全身疾病和病痛过程,这些疾病和病痛过程影响外周神经系统的整体。它们被进一步分为几个类别:i.远端轴突病变(Distal axonopathies)是神经元的一些代谢或毒性错乱的结果。它们可能由代谢疾病引起,例如糖尿病,肾衰竭,缺乏综合症(deficiency syndrome),如营养不良和酗酒,或毒素或药物的影响。远端轴突病变(也被成为逆行死亡神经病变(dying backneuropathy))是一种外周神经病变,其起因于外周神经系统(PNS)神经元的一些代谢或毒性的混乱。这是神经对代谢或毒素紊乱的最常见反应,并且照这样,可由代谢疾病引起,例如糖尿病,肾衰竭,缺乏综合症(deficiency syndrome),如营养不良和酗酒,或毒素或药物的影响。远端轴突病变的最常见诱因是糖尿病,并且最常见的远端轴突病变是糖尿病神经痛。ii.髓鞘质病是由于髓鞘质的主要攻击,引起冲动传导的急性失败。最常见的诱因是急性炎症性脱髓鞘多神经病变(acute inflammatorydemyelinating polyneutopathy(AIDP,也被称作格林-巴利综合症)),虽然其它诱因包括慢性炎症性脱髓鞘综合症(CIDP)、遗传代谢紊乱(如, 脑白质营养不良)或毒素。髓鞘质病是由于髓鞘或髓鞘化许旺细胞(myelinating Schwann cells)的大部分解体,其使得轴突完整,但引起冲动传导的急性衰竭。脱髓鞘化减缓或完全阻止了电冲动通过神经的传导。最常见的诱因是急性炎症性脱髓鞘多神经病变(AIDP,也被称作格林-巴利综合症),虽然其它诱因包括慢性炎症性脱髓鞘综合症(CIDP)、遗传代谢紊乱(如,脑白质营养不良或进行性腓骨肌萎缩)或毒素。iii.神经病变是外周神经系统(PNS)神经元破坏的结果。它们可能由运动神经元疾病,感觉神经病变(如,带状疱疹),毒素或自主神经功能异常。神经毒素可能引起神经病变,例如化学治疗试剂长春新碱。神经病变是由于外周神经系统(PNS)的神经元损伤,导致外周神经病变,引起的功能异常。它可能由运动神经元疾病,感觉神经病变(如,带状疱疹),有毒物质或自主神经功能异常。患有神经病变的人可能以多种形式存在,取决于诱因、其影响神经细胞的方式,和被影响最严重的神经细胞的类型。iv.聚焦节流神经病变(Focal entrapment neuropathies)(如腕管综合症) 

    II.炎症性疼痛

    本发明所述的化合物可以被用于治疗由任何以下炎症性症状引起的或与其相关的疼痛。 

    A.关节炎关节炎包括,例如,风湿性关节炎;青少年风湿性关节炎;系统性红斑狼疮(SLE);痛风性关节炎;硬皮病;骨关节炎;牛皮癣关节炎;强直性脊柱炎;莱特氏综合症(Reiter′s syndrome)(反应性关节炎);成人斯提耳病(adult Still′s disease);病毒感染引起的关节炎;细菌感染引起的关节炎,例如,如淋病性关节炎和非淋病性细菌关节炎(脓 毒性关节炎);三期莱姆病(Tertiary Lyme disease);结核性关节炎;和真菌感染引起的关节炎,例如,如芽生菌病。 

    B.自免疫疾病自免疫疾病包括,例如格林-巴利综合症、桥本氏甲状腺炎(Hashimoto′s thyroiditis)、恶性贫血、爱迪生氏病(Addison′s disease)、I型糖尿病、系统性红斑狼疮、皮肌炎、干燥综合症(sjogren′s syndrome)、红斑狼疮、多发性硬化症、重症肌无力、莱特氏综合症和格雷氏病(Grave′s disease)。 

    C.结缔组织疾病结缔组织疾病包括,例如脊柱关节炎(spondyloarthritis)、皮肌炎和肌纤维痛(fibromyalgia)。 

    D.受伤由受伤引起的炎症可能引起慢性炎症性疼痛,所述受伤包括,例如组织或关节的挤压、刺穿、拉伸。 

    E.感染由感染引起的炎症可能引起慢性炎症性疼痛,所述感染包括,例如肺结核或间质性角膜炎。 

    F.神经炎神经炎是影响神经或一组神经的炎症性过程。症状取决于涉及的神经,但可能包括疼痛、感觉异常、局部麻痹或感觉减退(麻木)。实例包括:a.臂神经炎b.眼球后神经病变,一种炎症性过程,其影响恰好位于眼球后的视神经。c.视神经病变,一种影响视神经的炎症性过程,在受影响的眼中引起突然下降的视力。视神经炎的诱因未知。视神经(连接眼睛和脑的神经)的突然发炎导致髓鞘的肿胀和解体。炎症偶尔可能是病毒感染的结果,或其可能由自免疫疾病,如多发性硬化引起。风险因素与可能的诱因相关。 d.前庭神经炎,病毒感染引起的影响前庭神经的炎症性过程。 

    G.关节炎症关节的炎症,如由粘液囊炎或肌腱炎引起的,例如,可能引起慢性炎症性疼痛。 

    III.头痛

    本发明所述的化合物可以被用于治疗由任何以下头痛症状引起的或与其相关的疼痛。头痛(医学上也被称为头痛(cephalgia))是头部轻微到严重疼痛的一种症状;有时颈部或上背部疼痛可能也被解释为头痛。它可能表明潜在的局部或全身疾病,或可能是其本身的疾病。 

    A.肌肉/肌原性头痛肌肉/肌原性头痛表现为包括面部和颈部肌肉的收紧(tightening)或紧张(tensing);它们可能向前额辐射。紧张性头痛是最常见形式的肌原性头痛。 

    紧张性头痛是涉及头部、头皮或颈部疼痛或不适的症状,通常与这些区域的肌肉紧张相关。紧张性头痛起因于颈部和头皮肌肉的收缩。这一肌肉收缩的一个原因是对压力、沮丧或紧张的反应。导致头部长时间保持在一个位置不运动的任何活动可以引起头痛。这样的活动包括打字或使用计算机,用手进行的精细工作和显微镜的使用。在寒冷的屋子中睡觉或以颈部处在不正常的位置下进行睡觉,也可能引发这一类型的头痛。紧张型头痛包括,但不限于阵发性紧张性头痛和慢性紧张性头痛。 

    B.血管性头痛最常见类型的血管性头痛是偏头痛。其它类型的血管性头痛包括集束性头痛,其引起紧张型头痛的反复阵发;和高血压导致的头痛。1.偏头痛偏头痛是异源疾病,其通常包括反复头痛。偏头痛与其它头痛不同,因为它们伴有其它症状发生,例如,如恶心、呕吐或对光敏感。在大多数人中,抽动的疼痛仅在头部一侧感受得到。临床症状,例如先兆 症状的类型、预征候的存在、或相关症状,如眩晕,可能在具有不同潜在病理生理和遗传机理的患者亚组中观察到。偏头痛包括,但不限于没有先兆的偏头痛(普通偏头痛)、具有先兆的偏头痛(传统偏头痛)、月经偏头痛、等价偏头痛(migraine equivalent)(无头痛性的偏头痛(acephalic headache))、复杂型偏头痛(complicated migraine)、腹型偏头痛(abdominal migraine)和混合型紧张偏头痛(mixed tensionmigraine)。2.集束型头痛集束型头痛影响一侧头部(单侧的)并且可能与眼睛流泪和鼻塞相关联。它们集群发生,每天在相同时间反复发生,持续数周后缓和。 

    D.高血压头痛 

    E.牵引性(Traction)和炎症性头痛牵引性和炎症性头痛通常是从中风到鼻窦炎的其它病症的症状。 

    F.激素型头痛 

    G.反弹性头痛反弹性头痛,也被称为药物过度使用头痛(medication overuseheadaches),在过度频繁服用药物以缓解头痛时发生。反弹性头痛每天经常发生,并可会非常疼痛。 

    H.慢性鼻窦炎头痛鼻窦炎是鼻旁窦细菌、真菌、病毒、过敏或自免疫的炎症。慢性鼻窦炎是普通感冒最常见的并发症之一。症状包括:鼻塞;面部疼痛;头痛;发烧;全身不适;浓绿或黄鼻涕;俯身时面部“肿胀(fullness)”感恶化。在少数情况下,慢性上颌鼻窦炎也可以由牙齿感染细菌的蔓延引起。慢性增生性嗜酸性鼻窦炎(Chronic hyperplastic eosinophilicsinusitis)是非感染形式的慢性鼻窦炎。 

    I.器质性头痛 

    J.猝发性头痛猝发性头痛是与癫痫活动关联的头痛。 

    IV.身体疼痛

    本发明所述的化合物可以被用于治疗由任何以下身体疼痛状况引起的或与其相关的疼痛。身体疼痛开始于韧带、肌腱、骨骼、血管和甚至神经本身。其用身体疼痛感受器检测。在这些区域中的疼痛受体的缺乏产生比皮肤疼痛时间更长的,迟钝,局部化较差的疼痛;实例包括扭伤和骨折。额外的实例包括以下。 

    A.过度肌肉紧张过度肌肉紧张可以通过,例如扭伤或拉伤引起。 

    B.反复性动作疾病反复性动作病可以起因于手部、腕部、肘部、肩部、颈部、背部、臀部、膝盖、足部、腿部或脚踝的过度使用。 

    C.肌肉疾病引起身体疼痛的肌肉疾病包括,例如,多发性肌炎、皮肌炎、狼疮、肌纤维痛、风湿性多肌痛和横纹肌溶解。 

    D.肌肉痛肌肉痛是肌肉疼痛并且是多种疾病和紊乱的症状。肌肉痛最常见的诱因是肌肉或肌肉群的过度使用或过度拉伸。无外伤史的肌肉痛通常是由于病毒感染。较长时期的肌肉痛可能是代谢肌病、一些营养缺乏或慢性疲劳综合症的指示。 

    E.感染感染可以引起身体疼痛。这些感染的实例包括,例如,肌肉中的脓肿,旋毛虫病,流感,莱姆病(Lyme disease),疟疾,落基山斑疹热,禽流感,普通感冒,社区获得性肺炎,脑膜炎,猴痘,严重急性呼吸道综合症,中毒性休克综合症,旋毛虫病,伤寒症和上呼吸道感染。 

    F.药物药物可以引起身体疼痛。这样的药物包括,例如,可卡因,降低胆固醇的抑制素(statin)(如阿托伐他汀(atorvastatin)、辛找他汀(simvastatin)和洛弗斯特丁(lovastatin))和降低血压的ACE抑制剂(如依那普利(enalapril)和卡托普利(captopril))。 

    V.内脏疼痛

    本发明所述的化合物可以被用于治疗由任何以下内脏疼痛状况引起的或与其相关的疼痛。内脏疼痛起始于身体的内脏或器官。内脏疼痛感受器被置于身体器官或内腔中。在这些区域中疼痛感受器的进一步缺乏产生了通常比身体疼痛更疼且时间更长的疼痛。内脏疼痛极其难定位,并且内脏组织的若干损伤显示出“牵涉性(referred)”疼痛,其中感觉被定位于与受伤位置完全无关的区域。内脏疼痛的实例包括以下。 

    A.功能性内脏疼痛功能性内脏疼痛包括,例如,肠道易激综合症(irritable bowelsyndrome)和慢性功能性腹痛(CFAP),功能性便秘和功能性消化不良,非心源性胸痛(NCCP)和慢性腹痛。 

    B.慢性胃肠炎慢性胃肠炎症包括,例如,胃炎,肠炎,像例如,克罗恩氏病(Crohn′sdisease)、溃疡性结肠炎、显微镜结肠炎、憩室炎(diverticulitis)和肠胃炎;间质性膀胱炎;肠缺血;胆囊炎;阑尾炎;食道胃酸逆流(gastroesophageal reflux);溃疡,肾结石,尿路感染,胰腺炎和疝气。 

    C.自免疫疼痛自免疫疼痛包括,例如,结节病和脉管炎。 

    D.器质性内脏疼痛器质性内脏疼痛包括,例如,起因于肠道外伤、炎症或病变性损伤,或由肿瘤侵入感觉神经分布产生。 

    E.治疗诱导的内脏疼痛治疗诱导的内脏疼痛包括,例如,接受化学疗法的疼痛,或接受放射性疗法的疼痛。 

    VI.牵涉性疼痛

    本发明所述的化合物可以被用于治疗由任何以下牵涉性疼痛状况引起的或与其相关的疼痛。 

    牵涉性疼痛来自定位于与疼痛刺激部位不同区域的疼痛。通常,当神经在位于或接近其起点被压迫或损伤时,牵涉性疼痛发生。在这种情况下,疼痛的感觉一般在该神经达到的区域被感觉到,尽管损伤起始于另外的地方。常见的实例发生在椎间盘突出,其中从脊柱伸出的神经根部被相邻的盘物质压迫。尽管疼痛可能来源于受损的椎间盘本身,疼痛也将在被压迫神经达到的区域(例如,大腿、膝盖或脚)被感觉到。缓解神经根部的压力可能缓解牵涉性疼痛,只要永久性神经损伤还没有发生。心肌缺血(部分心肌组织血流的缺少)可能是被最熟知的牵涉性疼痛的实例;感觉可以发生在胸腔上部,受限的感觉(restricted feeling),或左肩、臂或甚至手的疼痛。 

    本发明所述的非细胞毒性蛋白酶组分是非细胞毒性的蛋白酶或其片段,所述蛋白酶或蛋白酶片段能够剪切以下三种底物蛋白的一种中存在的不同但特异的肽键,所述底物蛋白为疼痛感应传入器(nociceptive sensory afferent)中胞吐融合器(exocytic fusion apparatus)的小突触小泡蛋白(synaptobrevin)、突触融合蛋白(syntaxin)或SNAP-25。这些底物是神经分泌机制的重要组分。本发明所述的非细胞毒性蛋白酶组分优选地为奈瑟菌属IgA蛋白酶或其片段,或梭菌属神经毒素L-链或其片段。特别优选的非细胞毒性蛋白酶组分为肉毒菌神经毒素(BoNT)L-链或其片段。 

    本发明所述的转运组分使非细胞毒性蛋白酶(或其片段)能够转运进靶细胞,以便蛋白酶活性的功能表达发生在靶细胞的细胞溶胶中。转运组分优选地能够在低pH值的条件下,在脂膜上形成离子可渗透的孔。优选地,已经发现仅使用蛋白分子的那些部分能够在内涵体膜中形成孔。转运部分可能从微生物蛋白来源获得,特别地从细菌或病毒蛋白来源获得。因此,在一种实施方式中,转运组分是诸如细菌毒素或病毒蛋白的酶的转运区域。本发明所述的转运组分优选地为梭菌属神经毒素H-链或其片段。最优选地,它是区域HN(或其功能组分),其中HN表示梭菌属神经毒素H-链的部分或片段,其约等价于H-链氨基端的一半,或对应于完整H-链中该片段的区域。 

    本发明所述的TM组分负责将本发明所述的融合蛋白结合到靶细胞的结合位点(Binding Site)。因此,TM组分简单地是配体, 通过它本发明所述的融合蛋白结合到选定的靶细胞。 

    在本发明的文字中,靶细胞是疼痛感觉传入器,优选地是初级的疼痛传入器(例如A-纤维,如Aδ-纤维或C-纤维)。因此,本发明所述的融合蛋白能够抑制神经递质或神经调节物质[如,谷氨酰胺、P物质、降血钙素基因相关肽(calcitonin-gene related peptide(CGRP))和/或神经肽Y]从疼痛感受传入器神经元的分散群落中的释放。在使用中,融合蛋白降低或防止感觉传入器信号(如神经递质或神经调控物质)从外周向中枢疼痛纤维的传导;并因此具有作为治疗疼痛,特别是慢性疼痛的治疗分子的应用。 

    确定TM结合到疼痛感受传入器是常规。例如,简单的放射性位移实验可能被采用,其中代表疼痛感觉传入器的组织或细胞(如DRGs)在过量未标记配体存在的情况下被暴露给已经标记(如氚化)的配体。在这样的实验中,非特异和特异结合的相对比例可以被估计,由此允许确认配体结合到疼痛感觉传入器靶细胞。任选地,该测试可能包括一种或多种结合拮抗剂,并且该测试可能进一步包括观察配体结合的损失。这一类型实验的实例可以在Hulme,E.C.(1990),Receptor-binding studies,a brief outline,pp.303-311,In Receptorbiochemistry,A Practical Approach,Ed.E.C.Hulme,Oxford UniversityPress中找到。 

    当与相应的“游离(free)”TM比较时,本发明所述的融合蛋白通常显示出对疼痛感觉传入器靶细胞降低的结合亲和度(在达100倍的区间)。然而,尽管有这一观察结果,本发明所述的融合蛋白令人吃惊地显示出良好的效力。这可归因于两个主要的特征。第一,所述非细胞毒性蛋白酶组分是催化的——因此,若干这些分子的治疗效果被迅速扩大。第二,在疼痛感受传入器上存在的受体仅需要发挥用于治疗进入的通路作用,而非必须需要被刺激到要求的水平,以便达到配体-受体介导的药物反应。因此,本发明所述的融合蛋白可能以比其它类型的止痛分子,如NSAIDS、吗啡和加巴喷丁(Gabapentin)所使用低的多的剂量被给药。后者分子典型地以高微克到毫克(甚至到数百毫克)的量被给药,而本发明所述的融合蛋白可能以低得多的剂量给药,典型地至少低10倍,而更典型地至少低100倍。 

    TM优选地包含最多50个氨基酸残基,更优选地最多40个氨基酸残基,特别优选地最多30个氨基酸残基,和最优选地最多20个氨基酸残基。 

    阿片样物质(Opioids)代表优选的本发明所述的TM。在肽家族内包括脑啡肽(met和leu)、内源性吗啡(endomorphin)1和2、β-内啡肽和强啡肽。阿片样物质肽经常被用于临床,以修饰对疼痛感受器和疼痛反应中涉及的其它细胞的活性。如三级世界卫生组织止痛剂梯度(Analgesic Ladder),阿片样物质具有进入慢性癌症和非癌症性疼痛药物治疗的所有三个阶段的切入点,强调了它们对疼痛治疗的重要性。提到阿片样物质,包括其片段、变异体和衍生物,它们保留了结合疼痛感受传入器的能力。 

    本发明所述的TM也可以是在疼痛感受传入器上,更特别地在初级疼痛传入器上存在的一个或多个受体发挥“激动剂”作用的分子。传统地,激动剂已经被认为是能够在细胞内提高或降低活性的任何分子,即简单地引起细胞活性改变的任何分子。例如,传统方式的激动剂包括能够与细胞上受体结合病起始反应或活性的化学物质,或通过激活受体引起活性反应的药物,无论该反应是细胞活性的提高或降低。 

    然而,对于本发明的目的,激动剂更特异地被界定为能够刺激靶细胞内胞吐融合过程(exocytic fusion)的分子,该过程容易被能够剪切所述靶细胞中胞吐融合元件的蛋白的蛋白酶(或其片段)抑制。 

    因此,本发明特定激动剂的定义排除了传统上被认为是激动剂的多种分子。例如,在其通过结合到TrkA受体启动神经元分化的能力方面,神经生长因子(NGF)是激动剂。然而,当由上述条件评估时,NGF不是激动剂,因为它不是胞吐融合体的主要诱导剂。此外,NGF刺激的过程(即细胞分化)不易于被非细胞毒性毒素分子的蛋白酶活性抑制。 

    结合疼痛感受传入器上受体的TM的激动剂的性质可以用实施例10中所述的方法确认。 

    在本发明优选的实施方式中,所述TM的目标是ORL1受 体。该受体是G蛋白偶联类受体的一个成员,并且具有7个跨膜域结构。ORL1受体的性质在Mogil & Pasternak(2001),PharmacologicalReviews,Vol.53,No.3,pages 381-415中被详细讨论。 

    在一种实施方式中,TM是结合(优选地特异结合)ORL1受体的分子。更优选地,TM是ORL1受体的“激动剂”。术语“激动剂”在文中如上文定义。 

    结合ORL1受体的TM激动剂的性质可以用实施例10中所述的方法确认。这些方法基于前述实验(参见,Inoue et al.1998[Proc.Natl.Acad.Sci.,95,10949-10953]),其证实了受体的天然激动剂,伤害感受肽(或者孤啡肽)(nociceptin)),引发了P物质从疼痛感受初级传入器神经元释放的诱导。这被以下事实支持: 伤害感受肽诱导的反应通过特异受体(P物质受体)拮抗剂消除;和 用辣椒素(其耗尽小直径初级传入器神经元中的P物质)预处理细胞减弱了伤害感受肽诱导的反应。 

    相似地,Inoue等人证实了A类肉毒菌神经毒素的足底内注射消除了伤害感受肽诱导的反应。由于已知BoNT抑制P物质从初级传入器神经元的释放(Welch et al.,2000,Toxicon,38,245-258),这证实了伤害感受肽-ORL1相互作用与P物质的后续释放之间的关联。 

    因此,如果TM引起P物质从疼痛感觉传入器神经元释放的诱导,TM可以被称为在ORL1受体具有激动剂活性(参见实施例10)。 

    在本发明特别优选的实施方式中,所述TM是伤害感受肽——ORL1受体的天然配体。伤害感受肽靶向ORL1受体,具有高亲和度。其它优选TMs的实例包括: 编码  序列 Ref. SEQ ID No. 伤害感受肽1-17  FGGFTGARKSARKLANQ [1] 37,38 伤害感受肽1-11  FGGFTGARKSA [1] 39,40 伤害感受肽[Y10]1-11  FGGFTGARKYA [1] 41,42 伤害感受肽[Y14]1-17  FGGFTGARKSARKYANQ [1] 45,46 伤害感受肽1-13  FGGFTGARKSARK [2] 47,48

     编码 序列 Ref. SEQ ID No. 伤害感受肽[R14K15]1-17(在本说明书中也被称作“变异”伤害感受肽) FGGFTGARKSARKRKNQ [3,4] 49,50 肽激动剂 来自重组文库方法的肽激动剂 [5] -

    [1]Mogil & Pasternak,2001,Pharmacol.Rev.,53,381-415[2]Maile et al.,2003,Neurosci.Lett.,350,190-192[3]Rizzi et al.,2002,J.Pharmacol.Exp.Therap.,300,57-63[4]Okada et al.,2000,Biochem.Biophys.Res.Commun.,278,493-498[5]Dooley et al.,1997,J Pharmacol Exp Ther.283(2),735-41. 

    上文识别的“变异”TM显示出对疼痛感觉传入器特别良好的结合亲和力(当与天然伤害感受肽比较时)。这是令人吃惊的,因为氨基酸修饰发生在远离TM的N-末端的位置。而且,修饰大多在TM的C-末端,其又被附着到大的多肽序列(即转运区域)。一般来说,含TM的融合蛋白将显示出相对于TM本身降低约100倍的结合能力。上述“变异”TM本身显示出疼痛感觉传入器对天然伤害感受肽提高了约3-10倍的结合能力(如,通过ORL1受体)。因此,含有“变异”TM的融合体被预期显示出疼痛感觉传入器对“游离的”伤害感受肽降低了约10倍的结合能力(如,通过ORL1受体)。然而,本发明人已经展示了:这些含有“变异”TM的融合蛋白显示出与“游离”伤害感受肽非常接近(最令人吃惊)的结合能力——参见图14。 

    在本发明的情形中,术语阿片样物质或ORL1受体激动剂(如伤害感受肽,或上表中所列的肽的任意一种)包括与所述阿片样物质或激动剂具有至少70%,优选地至少80%,更优选地至少90%,和最优选地至少95%同源性的分子。激动剂同源体保留了伤害感受肽在ORL1受体上的激动剂性质,其可使用实施例10中提供的方法测试。相似地,阿片样物质同源体基本上保持了与其显示高度同源性的阿片样物质的结合功能。 

    本发明也包括上述TMs中任一的片段、变异体和衍生物。这些片段、变异体和衍生物基本上保留了归因于所述TMs的性质。 

    除了上述阿片样物质和非阿片样物质类的TMs,多种其它多肽也适合靶向本发明所述的融合蛋白到疼痛感觉传入器(如,到伤害感受肽)。在这一方面,特别要提到甘丙肽(galanin)和甘丙肽的衍生物。甘丙肽受体在DRGs中突触前或突触后被发现(Liu & Hokfelt,(2002),Trends Pharm.Sci.,23(10),468-74),并且在神经病变疼痛状态过程中,表达被增强。蛋白酶激活的受体(proteinase-activated receptors(PARs))也是本发明所述的TMs的优选组,最特别地是PAR-2。已知PAR-2的激动剂诱导/引起急性炎症,部分通过神经元性的机理。PAR2由初级脊髓传入神经元表达,并且PAR2激动剂刺激P物质(substanceP(SP))和降血钙素基因相关肽(calcitonin gene-related peptide(CGRP))在外周组织中的释放。 

    本发明所述特别优选组的TMs包括: 配体 参考文献 伤害感受肽 Guerrini,et al.,(1997)J.Med.Chem.,40,pp.1789-1793 β-内啡肽 Blanc,et al.,(1983)J.Biol.Chem.,258(13),pp.8277-8284 内啡素-1;内啡素-2 Zadina,et al.,(1997).Nature,386,pp.499-502 强啡肽 Fields & Basbaum(2002)Chapter 11,In TheTextbook of Pain,Wall & Melzack eds. Met-脑啡肽 Fields & Basbaum(2002)Chapter 11,In TheTextbook of Pain,Wall & Melzack eds. Leu-脑啡肽 Fields & Basbaum(2002)Chapter 11,In TheTextbook of Pain,Wall & Melzack eds. 甘丙肽 Xu et al.,(2000)Neuropeptides,34(3 & 4),137-147 PAR-2肽 Vergnolle et al.,(2001)Nat.Med.,7(7),821-826

    本发明所述的蛋白酶剪切位点允许在非细胞毒性蛋白酶组分和TM组分之间的位置对融合蛋白进行剪切(优选地为可控剪切)。该剪切反应将融合蛋白从单链多肽转化为二硫键连接的双链多肽。 

    根据本发明优选的实施方式,TM通过位于该TM的C-端远端的区域或氨基酸序列结合。例如,相关的结合区域可能包括朝向所述TM中部(即线性肽序列)放置的内部区域或氨基酸序列。优选地,相关结合区域位于朝向该TM的N-末端,更优选地在或接近所述N-末端。 

    在一种实施方式中,单链多肽融合体可能包括一个以上蛋白水解剪切位点。然而,在两个或多个这样的位点存在之处,它们是不同的,借此基本上防止在单一蛋白酶存在的情况下发生多处剪切的事件。在另一实施方式中,优选的是单链多肽融合体具有单一蛋白酶剪切位点。 

    蛋白酶剪切序列可以通过传统的方法,例如通过位点定向诱变在DNA水平上引入(和/或任意内在剪切序列的去除)。确认剪切序列存在的筛选可手工进行或用计算机软件(如,DNASTAR,Inc公司的MapDraw程序)辅助进行。 

    尽管可采用任何蛋白酶剪切位点,以下是优选的:肠激酶               (DDDDK↓)Xa因子               (IEGR↓/IDGR↓)TEV(烟草蚀纹病毒)    (ENLYFQ↓G)凝血酶               (LVPR↓GS)PreScission          (LEVLFQ↓GP) 

    内含肽(intein)也被术语蛋白酶剪切位点包括,它是自剪切序列。自剪接反应是可控的,例如,通过改变存在的还原试剂的浓度。 

    在使用中,蛋白酶剪切位点被剪切,并且TM的N-末端区域(优选地为N-末端)成为暴露的。产生的多肽具有TM,其带有基本游离于融合蛋白其余部分的N-末端区域或内部区域。这一排列保证了该TM的N-末端组分(或内部区域)可直接与靶细胞上的结合位点 相互作用。 

    在优选的实施方式中,TM和蛋白酶剪切位点在该融合蛋白中由最多10个氨基酸残基分隔开,更优选地由最多5个氨基酸残基分隔,并且最优选地由0个氨基酸残基分隔。因此,蛋白酶剪切位点被剪切之后,向融合体提供具有N-末端区域的TM,所述N-末端区域基本游离于该融合体的其余部分。这一排列保证了靶向部分(TargetingMoiety)的N-末端组分可直接与靶细胞上的结合位点相互作用。 

    与上述激活步骤相关的一个好处在于,一旦融合蛋白的蛋白水解剪切已经发生,所述TM仅对N-末端降解易感。此外,特异蛋白酶剪切位点的选择允许多肽融合体的选择性激活,成为双链构型。 

    本发明所述的单链多肽融合体的构建将蛋白酶剪切位点置于TM和非细胞毒性蛋白酶组分之间。 

    优选的是:在单链融合体中,TM位于蛋白酶剪切位点和转运组分之间。这保证了TM被连接到转运区域(即,如原生梭菌全毒素所发生的),尽管在本发明的情况下,两种组分的顺序相对于原生全毒素被逆转。这一排列的另一优点在于,TM被置于融合蛋白暴露的环形区域中,这对融合蛋白的构型具有最小的结构影响。在这一方面,所述环被不同地称作接头、激活环、域间环或仅仅是表面暴露的环(Schiavo et al 2000,Phys.Rev.,80,717-766;Turton et al.,2002,TrendsBiochem.Sci.,27,552-558}。 

    在一种实施方式中,在单链多肽中,非细胞毒性蛋白酶组分和转运组分被二硫键连接在一起。因此,在蛋白酶剪切位点被剪切后,该多肽被认为是双链构型,其中所述蛋白酶和转运区域通过二硫键保持连接在一起。为此,优选的是蛋白酶和转运组分在单链融合蛋白中由最多100个氨基酸残基彼此分隔开,更优选地最多80个氨基酸残基,特别优选地最多60个氨基酸残基,和最优选地最多50个氨基酸残基彼此分隔开。 

    在一种实施方式中,非细胞毒性蛋白酶组分与融合蛋白的转运组分形成二硫键。例如,形成二硫键的蛋白酶组分的氨基酸残基位于蛋白酶组分最后20个,优选地最后10个C-末端氨基酸残基之内。相似地,在转运组分中形成二硫键第二部分的氨基酸残基位于转运组 分前20个,优选地前10个N-末端氨基酸残基之内。 

    可选地,在单链多肽中,非细胞毒性蛋白酶组分和TM可被二硫键连接在一起。在这一方面,TM中形成二硫键的氨基酸残基优选地位于该TM N-末端的远端,更优选地朝向该TM的C-末端。 

    在一种实施方式中,非细胞毒性蛋白酶组分与融合蛋白的TM组分形成二硫键。在这一方面,形成二硫键的蛋白酶组分的氨基酸残基优选地位于蛋白酶组分最后20个,优更选地最后10个C-末端氨基酸残基之内。相似地,在TM组分中形成二硫键第二部分的氨基酸残基优选地位于TM最后20个,更优选地最后10个C-末端氨基酸残基之内。 

    上述二硫键排列具有这样的优点:蛋白酶和转运组分以与原生梭菌神经毒素相似的方式排列。通过比较的方式,参考原生梭菌神经毒素的一级氨基酸序列,每个半胱氨酸氨基酸残基由8到27个氨基酸残基分隔——摘自Popoff,MR & Marvaud,J-C,1999,Structural &genomic features of clostridial neurotoxins,Chapter 9,in TheComprehensive Sourcebook of Bacterial Protein Toxins.Ed.Alouf &Freer: 血清型1 序列 C-C之间的“原生”长度 BoNT/A1  CVRGIITSKTKS----LDKGYNKALNDLC 23 BoNT/A2  CVRGIIPFKTKS----LDEGYNKALNDLC 23 BoNT/B  CKSVKAPG-------------------IC 8 BoNT/C  CHKAIDGRS----------LYNKTLDC 15 BoNT/D  CLRLTK---------------NSRDDSTC 12 BoNT/E  CKN-IVSVK----------GIRK---SIC 13 BoNT/F  CKS-VIPRK----------GTKAPP-RLC 15 BoNT/G  CKPVMYKNT----------GKSE----QC 13 TeNT  CKKIIPPTNIRENLYNRTASLTDLGGELC 27

    1仅来自蛋白水解菌株的信息 

    融合蛋白可以包含一个或多个纯化标记,它们位于蛋白酶组分的N-末端和/或转运组分的C-末端。 

    尽管可采用任何纯化标记,以下是优选的:His-标记(如6个组氨酸),优选地作为C-末端和/或N-末端标记MBP-标记(麦芽糖结合蛋白),优选地作为N-末端标记GST-标记(谷胱甘肽-S-转移酶),优选地作为N-末端标记His-MBP-标记,优选地作为N-末端标记GST-MBP-标记,优选地作为N-末端标记硫氧还蛋白-标记,优选地作为N-末端标记CBD-标记(几丁质结合域),优选地作为N-末端标记 

    根据本发明进一步的实施方式,一个或多个肽间隔分子可被包含在融合蛋白中。例如,肽间隔分子可在纯化标记和融合蛋白分子的剩余部分之间使用(例如,在N-末端纯化标记和本发明的蛋白酶组分之间;和/或在C-末端纯化标记和本发明的转运组分之间)。肽间隔分子也可在本发明的TM和转运组分之间使用。 

    多种不同的间隔分子可被用于本发明所述的任意融合蛋白中。这些间隔分子的实例包括图28和29所示的那些。本文特别提到了GS15、GS20、GS25和Hx27——参见图28和29。 

    本发明人出乎意料地发现:当间隔分子的大小被选择,以便(在使用中)TM的C-末端与转运组分的N-末端彼此分开40-105埃,优选地50-100埃,且更优选地50-90埃时,本发明所述的融合蛋白(如CPNv/A)可显示出对疼痛感觉传入器提高的结合活性。在另一实施方式中,优选的间隔分子具有11-29个氨基酸残基,优选地15-27个氨基酸残基,并且更优选地20-27个氨基酸残基的氨基酸序列。合适的间隔分子可根据Crasto,C.J.and Feng,J.A.(2000)May,13(5),pp.309-312常规地识别和获得——也参见http://www.fccc./edu/research/labs/feng/limker.html。 

    根据本发明的第二方面,提供了编码上述单链多肽的DNA序列。在本发明优选的方面,该DNA序列作为DNA载体的一部分被制备,其中该载体包含启动子和终止子。 

    在优选的实施方式中,该载体具有选自以下的启动子: 启动子        诱导试剂      典型的诱导条件Tac(杂交体)   IPTG          0.2mM(0.05-2.0mM)AraBAD        L-阿拉伯糖    0.2%(0.002-0.4%)T7-lac操纵子  IPTG          0.2mM(0.05-2.0mM) 

    本发明所述的DNA构建体优选地用计算机模拟(in silico)设计,并随后通过传统的DNA合成技术合成。 

    上述DNA序列信息根据采用的最终宿主细胞(如,大肠杆菌)表达系统被任选地针对密码子偏好而修饰。 

    DNA骨架优选地针对任何内在的核酸序列被筛选,当被转录和翻译时,所述核酸序列可产生对应于蛋白酶剪切位点的氨基酸序列,所述剪切位点由第二肽编码序列编码。所述筛选可手工进行或用计算机软件(如,DNASTAR,Inc公司的MapDraw程序)辅助进行。 

    根据本发明进一步的实施方式,提供了制备非细胞毒性试剂的方法,包括:a.使本发明所述的单链多肽融合蛋白与能够剪切蛋白酶剪切位点的蛋白酶接触;b.剪切所述蛋白酶剪切位点,并由此形成双链融合蛋白。 

    这方面提供了双链多肽,其通常模拟梭菌全毒素的结构。更详细地,产生的双链多肽典型地具有这样的结构,其中:a.第一条链包含非细胞毒性的蛋白酶或其片段,所述蛋白酶或蛋白酶片段能够剪切疼痛感应传入器(nociceptive sensory afferent)中胞吐融合器(apparatus)的蛋白;b.第二条链包含TM和转运区域,其能够将蛋白酶或蛋白酶片段从内涵体中跨内涵体膜转运进入疼痛感应传入器的细胞溶胶中;并且第一和第二条链被二硫键连接在一起。 

    在使用中,本发明所述的单链或双链多肽治疗、预防或缓解疼痛。 

    在使用中,治疗有效量的本发明所述单链或双链多肽被给 予患者。 

    本发明解决了广泛的疼痛症状,特别地慢性疼痛症状。优选的病症包括癌症性和非癌症性疼痛,炎症性疼痛和神经病变性疼痛。本申请所述的阿片样物质-融合体特别适合解除炎症性疼痛,尽管其可能适合解除神经病变性疼痛的能力较差。甘丙肽-融合体更适合解除神经病变性疼痛。 

    在使用中,本发明所述的多肽典型地以联合药物载体、稀释剂和/或赋形剂的药物组合物的形式被使用,尽管组合物确切的形式可根据给药模式改变。给药优选地给予哺乳动物,更优选地给予人类。 

    该多肽可以,例如,以用于关节内给药或颅骨内给药的无菌溶液的形式被使用。脊柱注射(如,硬膜外或髓鞘内)是优选的。 

    本发明所述多肽给药的剂量范围是产生期望的治疗效果的那些。应该认识到,需要的剂量范围取决于所述组分精确的性质;给药的途径;制剂的特征;患者的年龄;患者病症的特征、程度或严重性;是否有任何禁忌症;和诊断医生的判断。 

    合适的每日剂量在0.0001-1mg/kg范围内,优选地0.0001-0.5mg/kg,更优选地0.002-0.5mg/kg,和特别优选地0.004-0.5mg/kg。单位剂量可以从小于1毫克到30毫克变化,但是典型地在每剂0.01到1mg的范围内,这可被每天给药或优选地更不频繁地给药,如每周或每6个月。 

    特别优选的给药方案是基于2.5ng融合蛋白(如CPNv/A)作为1×药剂。在这方面,优选的剂量在1×-100×(即2.5-250ng)范围内。这一剂量范围明显低于(即,至少低10倍,典型地低100倍)其它类型止痛剂分子,如NSAIDS、吗啡和加巴喷丁(Gabapentin)采用的剂量。而且,当在摩尔的基础上进行相同比较时,上述差异被显著增大——这是因为本发明所述的融合蛋白具有比传统“小”分子疗法大得多的分子量(Mw)。 

    然而,在所要求剂量中的多种变化被预期,其取决于所述组分的精确性质和各种给药途径不同的效率。 

    这些剂量水平中的变化可以使用用于优化的标准经验途径调整,它们在本领域内被公知。 

    适合注射的组合物可以是溶液、悬液或乳剂、或干燥粉末的形式,所述粉末在使用前溶解或悬浮在适当载体中。 

    液态单位剂量形式典型地使用无致热物(pyrogen-free)的无菌载体制备。取决于载体和使用的浓度,活性成分可以溶解或悬浮在载体中。 

    在制备可给药溶液时,多肽可以被溶解在载体中,如果必要,该溶液通过加入氯化钠被制成等渗的,并在灌入合适的无菌小瓶或安瓿和封装前,使用无菌技术通过经由无菌过滤器过滤而灭菌。可选地,如果溶液的稳定性足够,该溶液在其密封容器中可通过高压灭菌被灭菌。 

    有利的添加剂,如缓冲液、增溶剂、稳定剂、防腐剂或杀菌剂、悬浮剂或乳化剂可被溶解在载体中。 

    使用前溶解或悬浮在适当载体中的干燥粉末可在无菌区域中使用无菌技术,通过向无菌容器中灌入预先灭菌的药物物质和其它成分制备。 

    可选地,多肽和其它成分可被溶解在水性载体中,该溶液通过过滤灭菌,并在灭菌区域中使用无菌技术分装进合适的容器。产品随后被冷冻干燥并且容器被无菌封装。 

    非口服(肠胃外)悬液,适合用于肌肉内、皮下或真皮内注射,以基本相同的方式制备,除了无菌组分悬浮在无菌载体中替代了被溶解,且灭菌不能通过过滤完成。所述组分可在无菌状态下分离,或可选地,其可在分离后灭菌,例如通过γ辐射。 

    有利地,诸如聚乙烯吡咯烷酮的悬浮剂可被包含在组合物中,以促进所述组分的均一分布。 

    定义部分

    靶向部分(Targeting Moiety(TM))表示与试剂相关的任何化学结构,所述试剂与结合位点功能上相互作用,引起所述试剂与靶细胞表面的物理联系。在本发明的文字中,靶细胞是疼痛感觉传入器(nociceptive sensory afferent)。术语TM包括能够结合靶细胞上结合位点的任何分子(即,天然发生的分子,或其化学/物理修饰的变异体), 所述结合位点能够内化(internalisation)(如,内涵体的形成)——也被称为受体介导的细胞内吞。TM可能具有内涵体膜转运功能,在这种情况下,分离的TM和转运区域(Translocation Domain)组分不需要存在于本发明的试剂中。 

    本发明所述的TM结合(优选地特异结合)疼痛感觉传入器(如初级疼痛传入器)。在这一方面,特异结合表示TM以比其结合诸如非疼痛传入器的其它神经元和/或运动神经元(即,梭菌神经毒素全毒素的天然目标)更大的亲和力,结合到疼痛感觉传入器(如,初级疼痛传入器)。术语“特异结合”也可以表示给定的TM以106M-1或更高,优选地107M-1或更高,更优选地108M-1或更高,和最优选地109M-1或更高的结合亲和力(Ka)结合到给定受体,例如ORL1受体。 

    出于本发明的目的,激动剂被定义为能够刺激靶细胞内胞吐(exocytic)融合过程的分子,该过程容易被能够剪切所述靶细胞中胞吐融合元件的蛋白的蛋白酶(或其片段)抑制。 

    因此,本发明特定激动剂的定义排除了传统上被认为是激动剂的多种分子。 

    例如,在其通过结合到TrkA受体启动神经元分化的能力方面,神经生长因子(nerve growth factor(NGF))是激动剂。然而,当由上述条件评估时,NGF不是激动剂,因为它不是胞吐融合体的主要诱导剂。此外,NGF刺激的过程(即细胞分化)不易于被非细胞毒性毒素分子的蛋白酶活性抑制。 

    术语“片段”,当用于蛋白时,表示具有至少35个,优选地至少25个,更优选地至少20个,和最优选地至少10个所述蛋白的氨基酸残基的肽。 

    术语“变异体”,当用于蛋白时,表示含有一个或多个氨基酸类似物(如,非天然氨基酸)或替代的连接的蛋白的肽或肽片段。 

    术语“衍生物”,当用于蛋白时,表示含有所述蛋白和其它肽序列的蛋白。所述其它肽序列应该优选地不干扰基本折叠和由此产生的初始蛋白的构型结构。两个或多个肽(或片段,或变异体)可能被连接在一起形成衍生物。可选地,肽(或片段,或变异体)可与不相关分子(如第二个不相关的肽)连接。衍生物可被化学合成,但典 型地通过重组核酸的方法被制备。其它组分,如脂质、和/或多糖、和/或聚酮组分可被包括。 

    在本说明书中,提到“ORL1受体”包括所有ORL1受体家族的成员。ORL1受体家族的成员典型地具有7个跨膜域结构,并与Gi和G0家族的G蛋白偶联。确定ORL1受体的配体的G-蛋白刺激活性的方法在实施例12中给出。测量ORL1激活后细胞cAMP水平的降低的方法在实施例11中给出。ORL1受体家族成员的进一步的特征在于,它们典型地能够结合伤害感受肽(ORL1的天然配体)。举例来说,所有ORL1受体的选择性剪接变异体是ORL1受体家族的成员。 

    术语“非细胞毒性的”表示讨论议题中的所述蛋白酶分子不杀死其重新靶向的靶细胞。 

    本发明所述的蛋白酶包括所有天然发生的非细胞毒性蛋白酶,其能够剪切真核细胞中胞吐融合器的一个或多个蛋白。 

    本发明所述的蛋白酶优选地为细菌蛋白酶(或其片段)。更优选地,所述细菌蛋白酶选自梭菌属(Clostridium)或奈瑟菌属(Neisseria)(例如,梭菌L-链,或优选地来自淋球菌(N.gonorrhoeae)的奈瑟菌IgA蛋白酶)。 

    本发明也包括修饰的非细胞毒性蛋白酶,其包含非天然发生的氨基酸序列和/或合成的氨基酸残基,只要修饰的蛋白酶仍显示出上述蛋白酶活性。 

    本发明所述的蛋白酶优选地显示出丝氨酸或金属蛋白酶活性(如,肽链内切酶活性)。蛋白酶优选地对SNARE蛋白(如SNAP-25、小突触泡蛋白/VAMP或突触融合蛋白)具有特异性。 

    特别提及的是神经毒素的蛋白酶区域,例如细菌神经毒素的蛋白酶区域。因此,本发明包含天然发生的神经毒素区域的使用,以及所述天然发生的神经毒素的重组制备版本的使用。 

    示例性的神经毒素通过梭菌产生,并且术语“梭菌神经毒素”包括由破伤风梭菌(C.tetani)(TeNT)和由肉毒梭菌(C.botulinum)(BoNT)血清型A-G产生的神经毒素,以及与由巴氏梭菌(C.baratii)和丁酸梭菌(C.butyricum)产生的、紧密相关的BoNT样神经毒素。上述缩写贯穿本说明书使用。例如,命名法BoNT/A表示神经毒素的 来源为BoNT(血清型A)。相应的命名法也适用于其它BoNT血清型。 

    术语“L-链片段”表示神经毒素L-链的组分,该片段显示出金属蛋白酶的活性并能够蛋白水解地剪切细胞胞吐中涉及的囊泡和/或质膜相关蛋白。 

    转运区域是使蛋白酶(或其片段)能够转运进靶细胞、以便蛋白酶活性的功能表达发生在靶细胞的细胞溶胶中的分子。任何分子(如,蛋白或肽)是否具有本发明所述必须的转运功能可通过多种传统测试中任一确认。 

    例如,Shone C.(1987)描述了采用脂质体的体外测试,其使用测试分子刺激。必须转运功能的存在通过K+和/或标记的NAD从脂质体中的释放确定,这可被容易地检测[参见Shone C.(1987)Eur.J.Biochem;vol.167(1):pp.175-180]。 

    Blaustein R.(1987)提供了另一实例,其描述了采用平面磷脂双层膜简单的体外测试。该膜用测试分子刺激,并且必须的转运功能通过跨所述膜传导性的提高确认[参见Blaustein(1987)FEBS Letts;vol.226,no.1:pp.115-120]。 

    能够评估膜融合体,并由此识别适合用于本发明的转运区域的其它方法由Methods in Enzymology Vol 220 and 221,MembraneFusion Techniques,Parts A and B,Academic Press 1993提供。 

    转运区域优选地能够在低pH值的条件下,在脂膜上形成离子可渗透的孔。优选地,已经发现仅使用蛋白分子的那些部分能够在内涵体膜中形成孔。 

    转运区域可以从微生物蛋白来源获得,特别地从细菌或病毒蛋白来源获得。因此,在一种实施方式中,转运区域是诸如细菌毒素或病毒蛋白的酶的转运区域。 

    已经有充分记载:细菌毒素分子的某些区域能够形成这样的孔。也已知:在病毒内表达的膜融合蛋白的某些转运区域能够形成这样的孔。这些区域可被用在本发明中。 

    所述转运区域可能是梭菌源的,即HN区域(或其功能组分)。HN表示梭菌属神经毒素H-链的部分或片段,其约等价于H-链氨基端的一半,或对应于完整H-链中的片段的区域。优选的是H-链基本 上缺少H-链的HC组分天然的结合功能。在这一方面,HC功能可通过HC氨基酸序列的删除(通过核酸酶或蛋白酶处理,或者在DNA合成水平,或者在合成后水平)而被除去。可选地,HC功能可通过化学或生物处理而失活。因此,H-链优选地不能结合靶细胞上的结合位点,而原生梭菌神经毒素(即全毒素)结合该位点。 

    在一种实施方式中,转运区域是梭菌神经毒素的HN区域(或其片段)。合适的梭菌转运区域的实例包括:肉毒菌A型神经毒素  -氨基酸残基(449-871)肉毒菌B型神经毒素  -氨基酸残基(441-858)肉毒菌C型神经毒素  -氨基酸残基(442-866)肉毒菌D型神经毒素  -氨基酸残基(446-862)肉毒菌E型神经毒素  -氨基酸残基(423-845)肉毒菌F型神经毒素  -氨基酸残基(440-864)肉毒菌G型神经毒素  -氨基酸残基(442-863)破伤风神经毒素     -氨基酸残基(458-879) 

    对于在肉毒梭菌和破伤风梭菌中产生毒素的遗传基础的细节,我们参考Henderson et al(1997)in The Clostridia:Molecular Biologyand Pathogenesis,Academic press。 

    术语“HN”包括天然发生的神经毒素的HN部分和修饰的HN部分,其具有非天然发生的氨基酸序列和/或合成的氨基酸残基,只要修饰的HN部分仍显示出上述转运功能。 

    可选地,转运区域可能是非梭菌源的(参见表4)。非梭菌转运区域源的实例包括,但不限制于白喉毒素的转运区域[O=Keefe etal.,Proc.Natl.Acad.Sci.USA(1992)89,6202-6206;Silverman et al.,J.Biol.Chem.(1993)269,22524-22532;和London,E.(1992)Biochem.Biophys.Acta.,1112,pp.25-51],假单胞菌外毒素A类型的转运区域[Prioret al.Biochemistry(1992)31,3555-3559],炭疽病毒素的转运区域[Blanke et al.Proc.Natl.Acad.Sci.USA(1996)93,8437-8442],多种具有转运功能的融合或疏水肽[Plank et al.J.Biol.Chem.(1994)269, 12918-12924;和Wagner et al(1992)PNAS,89,pp.7934-7938],及两亲肽[Murata et al(1992)Biochem.,31,pp.1986-1992]。所述转运区域可模拟天然生成的蛋白中的转运区域,或可能包括氨基酸变异,只要该变异不破坏该转运区域的转运能力。 

    适合用于本发明的病毒转运区域的特定实例包括病毒表达的膜融合蛋白的某些转运区域。例如,Wagner et al.(1992)和Murata et al.(1992)描述了从流感病毒血凝素的N-末端区域衍生的多个融合和两亲肽的转运(即,膜融合和囊泡形成)功能。已知具有期望转运活性的其它病毒表达的膜融合蛋白是塞姆利基森林病毒(Semliki Forest Virus(SFV))融合肽的转运区域,水泡性口炎病毒(vesicular stomatitis virus(VSV))糖蛋白G的转运区域,SER病毒F蛋白的转运区域和泡沫病毒包膜糖蛋白的转运区域。病毒编码的刺突(Aspike)蛋白在本发明的背景下具有特定的应用,例如,SFV的E1蛋白和VSV的G蛋白。 

    表(下文)中所列的转运区域的用途包括其序列变异体的用途。变异体可能包含一个或多个保守核酸置换和/或核酸删除或插入,条件是该变异体具有必须的转运功能。变异体也可能包含一个或多个氨基酸置换和/或氨基酸删除或插入,只要该变异体具有必须的转运功能。 转运区域来源 氨基酸残基 参考文献 白喉毒素 194-380 Silverman et al.,1994,J.Biol.Chem.269,22524-22532London E.,1992,Biochem.Biophys.Acta.,1113,25-51 假单胞菌外毒素的区域II  405-613 Prior et al.,1992,Biochemistry31,3555-3559Kihara & Pastan,1994,Bioconj Chem.5,532-538

     转运区域来源 氨基酸残基 参考文献 流感病毒血凝素 GLFGAIAGFIENGWEGMIDGWYG及其变异体 Plank et al.,1994,J.Biol.Chem.269,12918-12924Wagner et al.,1992,PNAS,89,7934-7938Murata et al.,1992,Biochemistry 31,1986-1992 塞姆利基森林病毒融合蛋白 转运区域 Kielian et al.,1996,J Cell Biol.134(4),863-872 水泡性口炎病毒糖蛋白G 118-139 Yao et al.,2003,Virology310(2),319-332 SER病毒F蛋白 转运区域 Seth et al.,2003,J Virol 77(11)6520-6527 泡沫病毒包膜糖蛋白 转运区域 Picard-Maureau et al.,2003,JVirol.77(8),4722-4730

    附图图1LC/A-伤害感受肽-HN/A融合蛋白的纯化图2伤害感受肽-LC/A-HN/A融合蛋白的纯化图3LC/C-伤害感受肽-HN/C融合蛋白的纯化图4LC/A-met脑啡肽-HN/A融合蛋白的纯化图5LC/A-伤害感受肽-HN/A融合蛋白和伤害感受肽-LC/A-HN/A融合蛋白的结合效力的比较图6LC/A-伤害感受肽-HN/A融合蛋白的体外催化活性图7LC/A-伤害感受肽变异体-HN/A融合蛋白的纯化 图8LC/A-伤害感受肽-HN/A融合蛋白和LC/A-伤害感受肽变异体-HN/A融合蛋白融的结合效力的比较图9表达/纯化的具有可变间隔长度产物的LC/A-伤害感受肽-HN/A融合蛋白家族图10SP释放和SNAP-25被CPN-A剪切的抑制图11DRG暴露于CPN-A后,SP释放和SNAP-25的剪切的在延长的时间段内的抑制图12SNAP-25被CPNv-A的剪切图13DRG暴露于CPNv-A后,NAP-25在延长的时间段内的剪切图14CPNv-A融合体介导的[3H]-伤害感受肽结合的替换图15表达/纯化的CPNv(Ek)-A产物图16SNAP-25被CPNv(Ek)-A的剪切图17表达/纯化的CPNv-C产物图18突触融合蛋白被CPNv-C的剪切图19CPN-A在急性辣椒素诱导的机械痛觉异常模型中的效力图20CPN-A在链脲霉素(STZ)诱导的外周糖尿病神经病变(神经病变性疼痛)模型中的效力图21CPNv-A在急性辣椒素诱导的机械痛觉异常模型中的效力图22表达/纯化的LC/A-CPLE-HN/A产物图23表达/纯化的LC/A-CPBE-HN/A产物图24表达/纯化的CPOP-A产物图25表达/纯化的CPOPv-A产物图26DRG细胞模型中SNAP-25的体外剪切图27表达/纯化的CPNv-A-FXa-HT(可去除his-标记)图28具有可变间隔长度的LC/A-伤害感受肽-HN/A融合蛋白的 体外效力,由配体竞争测试评估图29具有可变间隔长度的LC/A-伤害感受肽-HN/A融合蛋白的体外效力,由体外SNAP-25剪切评估在 

    附图现在被更详细地描述。图1-LC/A-伤害感受肽-HN/A融合蛋白的纯化 

    使用实施例9所概括描述的方法,LC/A-伤害感受肽-HN/A融合蛋白从大肠杆菌BL21细胞中被纯化。简单地说,细胞破碎后获得的可溶产物被加样到装有镍的亲和捕获柱上。结合的蛋白用100mM咪唑洗脱,用因子Xa处理以激活融合蛋白并除去麦芽糖结合蛋白(maltose-binding protein(MBP))标记,随后重加样到第二个装有镍的亲和捕获柱上。来自纯化步骤的样品通过SDS-PAGE(图A)和蛋白质印迹(图B)评估。抗伤害感受肽的抗血清(从Abcam获得)被用作蛋白质印迹蛋白质印迹的一抗。在还原剂不存在和存在下,最终纯化的材料分别在标记有[-]和[+]的泳道中被识别。图2-伤害感受肽-LC/A-HN/A融合蛋白的纯化 

    使用实施例9所述的方法,伤害感受肽-LC/A-HN/A融合蛋白从大肠杆菌BL21细胞中被纯化。简单地说,细胞破碎后获得的可溶产物被加样到装有镍的亲和捕获柱上。结合的蛋白用100mM咪唑洗脱,用因子Xa处理以激活融合蛋白并除去麦芽糖结合蛋白(MBP)标记,随后重加样到第二个装有镍的亲和捕获柱上。来自纯化步骤的样品通过SDS-PAGE(图A)和蛋白质印迹蛋白质印迹(图B)评估。抗伤害感受肽的抗血清(从Abcam获得)被用作蛋白质印迹蛋白质印迹的一抗。在还原剂不存在和存在下,最终纯化的材料分别在标记[-]和[+]的泳道中被识别。图3-LC/C-伤害感受肽-HN/C融合蛋白的纯化 

    使用实施例9所述的方法,LC/C-伤害感受肽-HN/C融合蛋白从大肠杆菌BL21细胞中被纯化。简单地说,细胞破碎后获得的可溶 产物被加样到装有镍的亲和捕获柱上。结合的蛋白用100mM咪唑洗脱,用因子Xa处理以激活融合蛋白并除去麦芽糖结合蛋白(MBP)标记,随后重加样到第二个装有镍的亲和捕获柱上。来自纯化步骤的样品通过SDS-PAGE(图A)和蛋白质印迹(图B)评估。抗伤害感受肽的抗血清(从Abcam获得)被用作蛋白质印迹的一抗。在还原试剂不存在和存在下,最终纯化的材料分别在标记[-]和[+]的泳道中被识别。图4-LC/A-met脑啡肽-HN/A融合蛋白的纯化 

    使用实施例9所述的方法,LC/A-met脑啡肽-HN/A融合蛋白从大肠杆菌BL21细胞中被纯化。简单地说,细胞破碎后获得的可溶产物被加样到装有镍的亲和捕获柱上。结合的蛋白用100mM咪唑洗脱,用因子Xa处理以激活融合蛋白并除去麦芽糖结合蛋白(MBP)标记,随后重加样到第二个装有镍的亲和捕获柱上。来自纯化步骤的样品通过SDS-PAGE评估。在还原剂不存在和存在下,最终纯化的材料分别在标记[-]和[+]的泳道中被识别。图5-LC/A-伤害感受肽-HN/A融合蛋白和伤害感受肽-LC/A-HN/A融合蛋白的结合效力的比较 

    伤害感受肽融合体结合ORL1受体的能力使用简单的基于竞争的测试评估。背根神经节(dorsal root ganglia(DRG))的原始培养物在1nM的[3H]-伤害感受肽存在的情况下被暴露于各种浓度的测试材料。放射性标记配体的特异结合的降低通过闪烁计数评估,并且与未标记配体(Tocris伤害感受肽)的效力比较绘图。清楚的是LC/A-伤害感受肽-HN/A融合体在与ORL1受体相互作用方面远比伤害感受肽-LC/A-HN/A融合体出众。图6-LC/A-伤害感受肽-HN/A融合蛋白的体外催化活性 

    纯化的LC/A-伤害感受肽-HN/A融合蛋白的体外肽链内切酶活性本质上根据Chaddock et al 2002,Prot.Express Purif.25,219-228所述确定。简单地说,固定在ELISA平板上的SNAP-25肽在37℃被暴露于多种浓度的融合蛋白1小时。一系列的洗涤之后,被剪切的 SNAP-25肽的量通过用与特定抗血清的反应性进行定量。图7-LC/A-伤害感受肽变异体-HN/A融合蛋白的纯化 

    使用实施例9所述的方法,LC/A-伤害感受肽变异体-HN/A融合蛋白从大肠杆菌BL21细胞中被纯化。简单地说,细胞破碎后获得的可溶产物被加样到装有镍的亲和捕获柱上。结合的蛋白用100mM咪唑洗脱,用因子Xa处理以激活融合蛋白并除去麦芽糖结合蛋白(MBP)标记,随后重加样到第二个装有镍的亲和捕获柱上。来自纯化步骤的样品通过SDS-PAGE评估。在还原剂不存在和存在下,最终纯化的材料分别在标记[-]和[+]的泳道中被识别。图8-LC/A-伤害感受肽-HN/A融合蛋白和LC/A-伤害感受肽变异体-HN/A融合蛋白的结合效力的比较 

    伤害感受肽融合体结合ORL1受体的能力使用简单的基于竞争的测试评估。背根神经节(DRG)的原始培养物在1nM的[3H]-伤害感受肽存在的情况下被暴露于各种浓度的测试材料。放射性标记配体的特异结合的降低通过闪烁计数评估,并且与未标记配体(Tocris伤害感受肽)的效力比较绘图。清楚的是LC/A-伤害感受肽变异体-HN/A融合体(CPNv-LHA)在与ORL1受体相互作用方面远比LC/A-伤害感受肽变异体-HN/A融合体(CPN-LHA)出众。图9-表达/纯化具有可变间隔长度产物的LC/A-伤害感受肽-HN/A融合蛋白家族 

    使用实施例9所述的方法,含有GS10、GS30和HX27的LC/A-CPN-HN/A融合蛋白从大肠杆菌细胞浆(cell paste)中被纯化。来自LC/A-CPN(GS10)-HN/A、LC/A-CPN(GS15)-HN/A、LC/A-CPN(GS25)-HN/A、LC/A-CPN(GS30)-HN/A和LC/A-CPN(HX27)-HN/A纯化的样品在用考马斯蓝(Coomassie Blue)染色前,通过SDS-PAGE评估。电泳图样表明CPBE-A预期分子量的二硫键双链种类的纯化。上部图面:M=标准分子量标记;S=大肠杆菌总蛋白可溶部分;FT=不结合Ni2+-装载的琼脂糖柱的蛋白; FUSION=通过加入咪唑洗脱的融合蛋白。底图:泳道1=标准分子量标记;泳道2=大肠杆菌总蛋白的可溶部分;泳道3=在Ni2+-装载的琼脂糖上初始捕获后纯化的材料;泳道4=在Ni2+-装载琼脂糖上最终捕获前用因子Xa处理的材料;泳道5=用因子Xa(5μl)激活后纯化的最终材料;泳道6=用因子Xa(10μl)激活后纯化的最终材料;泳道7=用因子Xa(20μl)激活后纯化的最终材料;泳道8=用因子Xa+DTT(5μl)激活后纯化的最终材料;泳道9=用因子Xa+DTT(10μl)激活后纯化的最终材料;泳道10=用因子Xa+DTT(20μl)激活后纯化的最终材料。图10-SP释放和SNAP-25被CPN-A剪切的抑制 

    简单地说,背根神经节(DRG)的原始培养物被暴露于各种浓度的CPN-A中24小时。细胞蛋白通过SDS-PAGE、蛋白质印迹分离,并用抗-SNAP-25标记,以促进SNAP-25剪切的评估。被剪切的SNAP-25的百分比通过密度计量分析计算,并相对融合体浓度绘图(短划线)。也被回收,用于使用特定EIA试剂盒进行P物质含量的分析。P物质释放的抑制由实线显示。达到50%最大SNAP-25剪切所需的融合体浓度估计为6.30±2.48nM。图11-DRG暴露于CPN-A后,SP释放和SNAP-25的剪切在延长的时间段内的抑制 

    背根神经节(DRG)的原始培养物被暴露于各种浓度的CPN-A中24小时。肉毒菌神经毒素(BoNT/A)被用作对照。初始的暴露后,细胞外物质通过清洗被除去,并且细胞在37℃下培养不同的时间段。在特定的时间点,细胞蛋白通过SDS-PAGE、蛋白质印迹分离,并用抗-SNAP-25标记,以促进SNAP-25剪切的评估。被剪切的SNAP-25的百分比通过密度计分析计算并由虚线显示。材料也被回收,用于使用特定EIA试剂盒进行的P物质含量的分析。P物质释放的抑制由实线显示。 图12-SNAP-25被CPNv-A的剪切 

    背根神经节(DRG)的原始培养物被暴露于各种浓度的CPNv-A中24小时。细胞蛋白通过SDS-PAGE、蛋白质印迹分离,并用抗-SNAP-25标记,以促进SNAP-25剪切的评估。被剪切的SNAP-25的百分比通过密度计分析计算。达到50%最大SNAP--25剪切所需的融合体浓度估计为1.38±0.36nM。图13-DRG暴露于CPNv-A后,NAP-25在延长的时间段内的剪切 

    背根神经节(DRG)的原始培养物被暴露于各种浓度的CPNv-A中24小时。CPN-A被用作对照。初始的暴露后,细胞外物质通过清洗被除去,并且细胞在37℃培养不同的时间段。在特定的时间点,细胞蛋白通过SDS-PAGE、蛋白质印迹分离,并用抗-SNAP-25标记,以促进SNAP-25剪切的评估。被剪切的SNAP-25的百分比通过密度计分析计算。图14-CPNv-A融合体介导的[3H]-伤害感受肽结合的替代 

    伤害感受肽融合体结合ORL1受体的能力使用简单的基于竞争的测试评估。背根神经节(DRG)的原始培养物在1nM的[3H]-伤害感受肽存在的情况下被暴露于各种浓度的测试材料。放射性标记配体的特异结合的降低通过闪烁计数评估,并且与未标记配体(Tocris伤害感受肽)的效力比较绘图。清楚的是LC/A-伤害感受肽变异体-HN/A融合体(标记为CPNv-LHnA)在与ORL1受体相互作用方面比LC/A-伤害感受肽-HN/A融合体(标记为CPN-LHnA)出众。图15-表达/纯化CPNv(Ek)-A产物 

    蛋白在用考马斯蓝染色前接受SDS-PAGE。电泳图谱表明预期分子量的CPNv(Ek)-A二硫键结合的双链种类的纯化。泳道1=标准分子量标记;泳道2=大肠杆菌总蛋白可溶部分;泳道3=在Ni2+-装载的琼脂糖上初始捕获后纯化的物质;泳道4=用肠激酶(5μl)激活后纯化的最终物质;泳道5=用肠激酶(10μl)激活后纯化的最终物质;泳道6=用肠激酶(20μl)激活后纯化的最终物质;泳道7=用肠激酶+DTT(5μl)激活后纯化的最终物质;泳道8=用肠激酶+DTT(10μl)激活后纯化的最终物质;泳道9=用肠激酶+DTT(20μl)激活后纯化的最终物质。图16-SNAP-25被CPNv(Ek)-A的剪切 

    背根神经节(DRG)的原始培养物被暴露于各种浓度的CPNv(Ek)-A中24小时。细胞蛋白通过SDS-PAGE、蛋白质印迹分离,并用抗-SNAP-25标记,以促进SNAP-25剪切的评估。被剪切的SNAP-25的百分比通过密度计分析计算。实施例9中制备的CPNv-A被用作比较的目的。SNAP-25被CPNv(Ek)-A(标记为En激活的)和CPNv-A(标记为Xa激活的)剪切的百分比被显示出。图17-表达/纯化CPNv-C产物 

    蛋白在用考马斯蓝染色前进行SDS-PAGE。电泳图谱表明预期分子量的CPNv-C的二硫键连接双链种类的纯化。泳道1=标准分子量标记;泳道2=大肠杆菌总蛋白可溶部分;泳道3=在Ni2+-装载的琼脂糖上初始捕获后纯化的物质;泳道4=Ni2+-装载的琼脂糖上最终捕获前因子Xa处理的物质;泳道5=在Ni2+-装载的琼脂糖上第二次捕获后纯化的物质;泳道6=最终纯化的物质;泳道7=最终纯化的物质+DTT;泳道8=标准分子量标记。 图18-突触融合蛋白被CPNv-C的剪切 

    背根神经节(DRG)的原始培养物被暴露于各种浓度的CPNv-C中24小时。细胞蛋白通过SDS-PAGE、蛋白质印迹分离,并用抗-突触融合蛋白标记,以促进SNAP-25剪切的评估。被剪切的突触融合蛋白的百分比通过密度计分析计算。达到50%最大突触融合蛋白的剪切所需的融合体浓度估计为3.13±1.96nM。图19-CPN-A在急性辣椒素诱导的机械痛觉异常模型中的效力 

    LC/A-伤害感受肽-HN/A融合体(CPN/A)抑制急性辣椒素诱导的机械痛觉异常的能力在大鼠后爪的皮下足底内注射后被评估。在招入本研究之前(预处理),在用CPN/A皮下足底内注射后、但在辣椒素刺激之前(Pre-CAP),和在CPN/A注射后且用辣椒素刺激后(平均反应为15′和30′;CAP),实验动物被评估爪在对10g Von Frey纤丝刺激系列(10刺激×3次试验)的爪回缩频度(paw withdrawal frequency(PWF%))。辣椒素刺激通过10μL的0.3%溶液的注射完成。样品稀释物在0.5%的BSA/盐水中制备。图20-CPN-A在链脲霉素(Streptozotocin(STZ))诱导的外周糖尿病神经病变(神经病变性疼痛)模型中的效力 

    雄性Sprague-Dawley大鼠(250-300g)用65mg/kg溶解在柠檬酸盐缓冲液中的STZ处理(I.V.),并且血糖和脂质被每周测量以确定该模型的准备状态。爪回缩阈值(Paw Withdrawal Threshold(PWT))根据一段时间内响应于Von Frey纤丝刺激系列的反应被测量。当两个连续测量日(间隔1周)的PWT测量在尺度上低于6g时,疼痛异常被称为已建立。在这时,大鼠被随机分配到盐水组(阴性效力对照)、加巴喷丁(Gabapentin)组(阳性效力对照)或测试组(CPN/A)。测 试物质(20-25μl)作为单一注射剂被皮下注射(不包括加巴喷丁),并且PWT在治疗1天后被测量,并在这之后的两周时间内定期测量。加巴喷丁(30mg/kg i.p.,3ml/kg注射体积)在开始PWT测试之前2小时,被每天注射。图21-CPNv-A在急性辣椒素诱导的机械痛觉异常模型中的效力 

    LC/A-伤害感受肽变异体-HN/A融合体(CPNv/A)抑制辣椒素诱导的机械性疼痛异常的能力在大鼠后爪皮下足底内注射后被评估。在招入研究之前(预处理),在用CPNv/A皮下足底内注射后但在辣椒素刺激之前(Pre-CAP),和在CPN/A注射后且用辣椒素刺激后(平均反应为15′和30′;CAP),实验动物被评估爪在对10g Von Frey纤丝刺激系列(10刺激×3次试验)反应的爪回缩频度(PWF%)。辣椒素刺激通过10μL的0.3%溶液的注射完成。样品稀释物在0.5%的BSA/盐水中制备。这些数据被表示为标准化的爪回缩频度差异,其中峰值反应(辣椒素之后)和基线反应(辣椒素之前)之间的差异被表示为百分比。用该分析,可以看出CPNv/A比CPN/A更有效,因为达到应用CPN/A所看到的相似止痛效果需要较低剂量的CPNv/A。图22-表达/纯化LC/A-CPLE-HN/A产物 

    蛋白在用考马斯蓝染色前接受SDS-PAGE。电泳图谱表明预期分子量的CPLE-A的二硫键连接双链种类的纯化。泳道1=标准分子量标记;泳道2=大肠杆菌总蛋白可溶部分;泳道3=在Ni2+-装载的琼脂糖上初始捕获后纯化的物质;泳道4=Ni2+-装载的琼脂糖上最终捕获前因子Xa处理的物质;泳道5=在Ni2+-装载的琼脂糖上第二次捕获后纯化的物质;泳道6=最终纯化的物质;泳道7=最终纯化的物质+DTT。 图23-表达/纯化LC/A-CPBE-HN/A产物 

    蛋白在用考马斯蓝染色前接受SDS-PAGE。电泳图谱表明预期分子量的CPBE-A的二硫键连接的双链种类的纯化。泳道1=大肠杆菌总蛋白的可溶部分;泳道2=在Ni2+-装载的琼脂糖上初始捕获后纯化的材料;泳道3=在Ni2+-装载琼脂糖上最终捕获前用因子Xa处理的材料;泳道4=用因子Xa(5μl)激活后纯化的最终材料;泳道5=用因子Xa(10μl)激活后纯化的最终材料;泳道6=用因子Xa(20μl)激活后纯化的最终材料;泳道7=用因子Xa+DTT(5μl)激活后纯化的最终材料;泳道8=用因子Xa+DTT(10μl)激活后纯化的最终材料;泳道9=用因子Xa+DTT(20μl)激活后纯化的最终材料;泳道10=标准分子量标记。图24-表达/纯化CPOP-A产物 

    蛋白在用考马斯蓝染色前进行SDS-PAGE。电泳图谱表明预期分子量的CPOP-A的二硫键连接的双链种类的纯化。泳道1=标准分子量标记;泳道2=在Ni2+-装载的琼脂糖上初始捕获后纯化的材料;泳道3=在Ni2+-装载琼脂糖上最终捕获前用因子Xa处理的材料;泳道4=在Ni2+-装载琼脂糖上第二次捕获后纯化的材料;泳道5=用因子Xa(5μl)激活后纯化的最终材料;泳道6=用因子Xa(10μl)激活后纯化的最终材料;泳道7=用因子Xa(20μl)激活后纯化的最终材料;泳道8=用因子Xa+DTT(5μl)激活后纯化的最终材料;泳道9=用因子Xa+DTT(10μl)激活后纯化的最终材料;泳道10=用因子Xa+DTT(20μl)激活后纯化的最终材料。图25-表达/纯化CPOPv-A产物 

    蛋白在用考马斯蓝染色前进行SDS-PAGE。电泳图谱表明预期分子量的CPOPv-A的二硫键连接的双链种类的纯化。泳道1=标准分子量标记;泳道2=大肠杆菌总蛋白的可溶部分;泳道3=在Ni2+-装载的琼脂糖上初始捕获后纯化的材料;泳道4=在Ni2+-装载琼脂糖上最终捕获前用因子Xa处理的材料;泳道5=用因子Xa(5μl)激活后纯化的最终材料;泳道6=用因子Xa(10μl)激活后纯化的最终材料;泳道7=用因子Xa(20μl)激活后纯化的最终材料;泳道8=用因子Xa+DTT(5μl)激活后纯化的最终材料;泳道9=用因子Xa+DTT(10μl)激活后纯化的最终材料;泳道10=用因子Xa+DTT(20μl)激活后纯化的最终材料。图26-DRG细胞模型中SNAP-25的体外剪切 

    背根神经节(DRG)的原始培养物被暴露于各种浓度的CPOPv-A中24小时。细胞蛋白质通过SDS-PAGE、蛋白质印迹分离,并用抗-SNAP-25标记,以促进SNAP-25剪切的评估。被剪切的SNAP-25的百分比通过密度计量分析计算。图27-表达/纯化CPNv-A-FXa-HT(可去除his-标记) 

    蛋白在用考马斯蓝染色前进行SDS-PAGE。电泳图样表明预期分子量的CPNv-A-FXa-HT的二硫键双链种类的纯化。泳道1=标准分子量标记;泳道2=大肠杆菌总蛋白的可溶部分;泳道3=在Ni2+-装载琼脂糖上最终捕获前用因子Xa处理的材料;泳道4=用因子Xa激活后纯化的最终材料;泳道5=用因子Xa+DTT激活后纯化的最终材料。图28-具有可变间隔长度的LC/A-伤害感受肽-HN/A融合蛋白的体外 效力,由配体竞争测试评估 

    可变间隔分子长度的LC/A-伤害感受肽-HN/A融合体结合ORL1受体的能力使用简单的基于竞争的测试评估。背根神经节(DRG)的原始培养物在1nM的[3H]-伤害感受肽存在的情况下被暴露于各种浓度的测试材料。放射性标记配体的特异结合的降低通过闪烁计数评估,并且与未标记配体(Tocris伤害感受肽)的效力比较绘图。上图显示了GS0、GS20、GS30和Hx27间隔分子的替换特性,而下图显示了由GS10、GS15和GS25间隔的融合蛋白达到的移位。结论是:在伤害感受肽替换ORL1受体方面,GS0和GS30间隔分子是无效的,且GS10是较不有效的。图29-具有可变间隔长度的LC/A-伤害感受肽-HN/A融合蛋白的体外效力,由体外SNAP-25剪切评估 

    背根神经节(DRG)的原始培养物被暴露于各种浓度的CPN-A(具有可变间隔分子长度)中24小时。细胞蛋白通过SDS-PAGE、蛋白质印迹分离,并用抗-SNAP-25标记,以促进SNAP-25剪切的评估。被剪切的SNAP-25的百分比通过密度计量分析计算。GS10间隔的融合蛋白的较不有效的结合特性(参见图28)反映为需要较高浓度融合体,以达到细胞内SNAP-25的剪切。GS0和GS30间隔的融合蛋白完全无效(数据未显示)。GS15、20和25间隔的融合蛋白差不多一样有效。 SEQ ID NOsSEQ ID1 LC/A的DNA序列SEQ ID2 HN/A的DNA序列SEQ ID3 LC/B的DNA序列SEQ ID4 HN/B的DNA序列 SEQ ID5 LC/C的DNA序列SEQ ID6 HN/C的DNA序列SEQ ID7 CPN-A接头的DNA序列SEQ ID8 A接头的DNA序列SEQ ID9 N-末端呈递伤害感受肽插入体的DNA序列SEQ ID10 CPN-C接头的DNA序列SEQ ID11 CPBE-A接头的DNA序列SEQ ID12 CPNvar-A接头的DNA序列SEQ ID13 LC/A-CPN-HN/A融合体的DNA序列SEQ ID14 LC/A-CPN-HN/A融合体的蛋白序列SEQ ID15 N-LC/A-HN/A融合体的DNA序列SEQ ID16 N-LC/A-HN/A融合体的蛋白序列SEQ ID17 LC/C-CPN-HN/C融合体的DNA序列SEQ ID18 LC/C-CPN-HN/C融合体的蛋白序列SEQ ID19 LC/C-CPN-HN/C(A-接头)融合体的DNA序列SEQ ID20 LC/C-CPN-HN/C(A-接头)融合体的蛋白序列SEQ ID21 LC/A-CPME-HN/A融合体的DNA序列SEQ ID22 LC/A-CPME-HN/A融合体的蛋白序列SEQ ID23 LC/A-CPBE-HN/A融合体的DNA序列SEQ ID24 LC/A-CPBE-HN/A融合体的蛋白序列SEQ ID25 LC/A-CPNv-HN/A融合体的DNA序列SEQ ID26 LC/A-CPNv-HN/A融合体的蛋白序列SEQ ID27 LC/A-CPN[1-11]-HN/A融合体的DNA序列SEQ ID28 LC/A-CPN[1-11]-HN/A融合体的蛋白序列SEQ ID29 LC/A-CPN[[Y10]1-11]-HN/A融合体的DNA序列SEQ ID30 LC/A-CPN[[Y10]1-11]-HN/A融合体的蛋白序列 SEQ ID31 LC/A-CPN[[Y11]1-11]-HN/A融合体的DNA序列SEQ ID32 LC/A-CPN[[Y11]1-11]-HN/A融合体的蛋白序列SEQ ID33 LC/A-CPN[[Y14]1-17]-HN/A融合体的DNA序列SEQ ID34 LC/A-CPN[[Y14]1-17]-HN/A融合体的蛋白序列SEQ ID35 LC/A-CPN[1-13]-HN/A融合体的DNA序列SEQ ID36 LC/A-CPN[1-13]-HN/A融合体的蛋白序列SEQ ID37 CPN[1-17]的DNA序列SEQ ID38 CPN[1-17]的蛋白序列SEQ ID39 CPN[1-11]的DNA序列SEQ ID40 CPN[1-11]的蛋白序列SEQ ID41 CPN[[Y10]1-11]的DNA序列SEQ ID42 CPN[[Y10]1-11]的蛋白序列SEQ ID43 CPN[[Y11]1-11]的DNA序列SEQ ID44 CPN[[Y11]1-11]的蛋白序列SEQ ID45 CPN[[Y14]1-17]的DNA序列SEQ ID46 CPN[[Y14]1-17]的蛋白序列SEQ ID47 CPN[1-13]的DNA序列SEQ ID48 CPN[1-13]的蛋白序列SEQ ID49 CPNv(也称作N[[R14K15]1-17])的DNA序列SEQ ID50 CPNv(也称作N[[R14K15]1-17])的蛋白序列SEQ ID51 伤害感受肽-间隔分子-LC/A-HN/A融合体的DNA序列SEQ ID52 伤害感受肽-间隔分子-LC/A-HN/A融合体的蛋白序列SEQ ID53 CPN-A GS10接头的DNA序列SEQ ID54 CPN-A GS15接头的DNA序列SEQ ID55 CPN-A GS25接头的DNA序列SEQ ID56 CPN-A GS30接头的DNA序列 SEQ ID57  CPN-A HX27接头的DNA序列SEQ ID58  LC/A-CPN(GS15)-HN/A融合体的DNA序列SEQ ID59  LC/A-CPN(GS15)-HN/A融合体的蛋白序列SEQ ID60  LC/A-CPN(GS25)-HN/A融合体的DNA序列SEQ ID61  LC/A-CPN(GS25)-HN/A融合体的蛋白序列SEQ ID62  CPNvar-A肠激酶可激活接头的DNA序列SEQ ID63  LC/A-CPNv(Ek)-HN/A融合体的DNA序列SEQ ID64  LC/A-CPNv(Ek)-HN/A融合体的蛋白序列SEQ ID65  CPNvar-A接头的DNA序列SEQ ID66  LC/C-CPNv-HN/C融合体(act.A)的DNA序列SEQ ID67  LC/C-CPNv-HN/C融合体(act.A)的蛋白序列SEQ ID68  LC/A-CPLE-HN/A融合体的DNA序列SEQ ID69  LC/A-CPLE-HN/A融合体的蛋白序列SEQ ID70  LC/A-CPOP-HN/A融合体的DNA序列SEQ ID71  LC/A-CPOP-HN/A融合体的蛋白序列SEQ ID72  LC/A-CPOPv-HN/A融合体的DNA序列SEQ ID73  LC/A-CPOPv-HN/A融合体的蛋白序列SEQ ID74  IgA蛋白酶的DNA序列SEQ ID75  IgA-CPNv-HN/A融合体的DNA序列SEQ ID76  gA-CPNv-HN/A融合体的蛋白序列SEQ ID77  FXa-HT的DNA序列SEQ ID78  CPNv-A-FXa-HT的DNA序列SEQ ID79  CPNv-A-FXa-HT融合体的蛋白序列SEQ ID80  DT转运区域的DNA序列SEQ ID81  CPLE-DT-A的DNA序列SEQ ID82  CPLE-DT-A融合体的蛋白序列 SEQ ID83 TeNT LC的DNA序列SEQ ID84 CPNv-TENT LC的DNA序列SEQ ID85 CPNV-TeNT LC融合体的蛋白序列SEQ ID86 CPNvar-C接头的DNA序列SEQ ID87 LC/C-CPNv-HN/C融合体(act.C)的DNA序列SEQ ID88 LC/C-CPNv-HN/C融合体(act.C)的蛋白序列 

    实施例

    实施例1-LC/A和HN/A骨架克隆的制备

    以下步骤产生了用作多区域融合表达物组分骨架的LC和HN片段。本实施例基于血清型A基克隆(SEQ ID1和SEQ ID2)的制备,虽然该过程和方法可以同等地应用于其它血清型[由血清型B(SEQID3和SEQ ID4)和血清型C(SEQ ID5和SEQ ID6)的序列表所示例说明]。克隆和表达载体的制备pCR 4(Invitrogen)被选为标准克隆载体,其被选择是由于在载体和相邻的测序引物位点内缺少限制性序列,以便用于构建体容易确认。表达载体基于pMAL(NEB)表达载体,其在多克隆位点内具有正确顺序的期望限制性序列,用以构建体插入(BamHI-SalI-PstI-HindIII)。表达载体的片段已经被移除,以产生不可移动的质粒,并且多种不同的融合标签已经被插入,以增加纯化的选择方案。 蛋白酶(如LC/A)插入体的制备 

    LC/A(SEQ ID1)通过以下两种方式之一产生:该DNA序列通过LC/A氨基酸序列[从免费可用的数据库来源,如GenBank(登录号P10845)或Swissprot(登陆基因座BXA1_CLOBO)获得,使用多种反向翻译软件工具之一(例如,EditSeq best E.coli reversetranslation(DNASTAR Inc.)或Backtranslation tool v2.0(Entelechon))]的反向翻译设计。BamHI/SalI识别序列分别被插入该序列的5′和3′端, 保持正确的读码框。DNA序列针对反向翻译过程中被插入的限制性酶剪切序列被筛选(使用诸如MapDraw,DNASTAR Inc.的软件)。被发现对克隆系统要求的那些常见的任意剪切序列,从提议的编码序列中被手工移除,所述编码序列保证了常见大肠杆菌密码子选择(使用)被保持。大肠杆菌密码子选择通过软件程序,如Graphical Codon UsageAnalyser(Geneart)被评估,并且%GC含量和密码子使用比例通过参考公开的密码子使用表(例如,GenBank Release 143,2004年9月13日)来评估。含有LC/A开放读码框的,优化的DNA序列随后被商业合成(例如,通过Entelechon,Geneart或Sigma-Genosys),并在pCR4载体中被提供。 

    可选的方法是使用BamHI和SalI限制性酶序列分别插入5′和3′端的PCR引物,对已存在的DNA序列使用PCR扩增。互补的寡核苷酸引物由供应商(如MWG或Sigma-Genosys)化学合成,以便每个引物具有与梭菌目标DNA伸展侧翼的相反链(其3′端彼此“相对”)杂交的能力,一个寡核苷酸对应两条DNA链的每一个。要产生PCR产物,一对特异针对梭菌DNA序列的短寡核苷酸引物与梭菌DNA模板和其它反应组分混合,并被置于能够自动改变反应试管温育温度的仪器中(“PCR仪”),该仪器的温度在约94℃(用于变性)、55℃(用于寡核苷酸退火)和72℃(用于合成)之间循环。用于PCR产物扩增要求的其它试剂包括DNA聚合酶(如Taq或Pfu聚合酶),等摩尔量(50-200μM)的四种核苷酸dNTP——DNA构建单元,和适合该酶、对Mg2+浓度(0.5-5mM)优化的缓冲液。 

    扩增产物被克隆进pCR 4,使用用于Taq PCR产物的TOPOTA克隆,或用于Pfu PCR产物的Zero Blunt TOPO克隆(两种试剂盒都可从Invitrogen购买)。产生的克隆通过测序检查。与该克隆系统不相容的任意其它限制性序列随后使用位点定向诱变[例如,使用Quickchange(Stratagene Inc.)]被除去。 转运(如HN)插入物的制备 

    HN/A(SEQ ID2)通过以下两种方式之一产生:该DNA序列通过HN/A氨基酸序列[从免费可用的数据库来源,如 GenBank(登录号P10845)或Swissprot(登陆基因座BXA1_CLOBO)获得,使用多种反向翻译软件工具之一(例如,EditSeq best E.coli reversetranslation(DNASTAR Inc.)或Backtranslation tool v2.0(Entelechon))]的反向翻译设计。PstI限制性序列被加入N-末端,并且XbaI-终止子-HindIII被加入C-末端以保证正确的读码框被保持。DNA序列针对反向翻译过程中被插入的限制性酶剪切序列被筛选(使用诸如MapDraw,DNASTAR Inc.的软件)。被发现对克隆系统要求的那些常见的任意序列,从提议的编码序列中被手工移除,所述编码序列保证了常见大肠杆菌密码子使用被保持。大肠杆菌密码子使用通过软件程序,如Graphical Codon Usage Analyser(Geneart)被评估,并且%GC含量和密码子使用比例通过参阅公开的密码子使用表(例如,GenBank Release143,2004年9月13日)来评估。优化的DNA序列随后被商业合成(例如,通过Entelechon,Geneart或Sigma-Genosys),并在pCR4载体中被提供。 

    可选的方法是对已存在的DNA序列使用PCR扩增,并以PstI和XbaI-终止子-HindIII限制性酶序列分别插入到5′和3′端的PCR引物中。PCR扩增按上文所述进行。PCR产物被插入pCR4载体并通过测序检查。与该克隆系统不相容的任意其它限制性序列随后使用位点定向诱变[例如,使用Quickchange(Stratagene Inc.)]被除去。实施例2-LC/A-伤害感受肽-HN/A融合蛋白的制备(伤害感受肽是HN-链的N-末端)接头-伤害感受肽-间隔分子插入物的制备 

    LC-HN接头可以根据第一原则,使用已存在的用于接头作为模板的序列信息被设计。例如,血清型A接头(在这种情况下,被定义为存在于LC和HN之间的二硫键桥的半胱氨酸之间的区域间的多肽区域)是23个氨基酸的长度,并且具有序列VRGIITSKTKSLDKGYNKALNDL。在该序列中,应该理解,天然的蛋白水解激活产生了具有N-末端序列ALNDL的HN区域。这一序列信息可免费地从可用数据库资源获得,如GenBank(登录号P10845)或 Swissprot(登陆基因座BXA1 CLOBO)。在该接头内,插入了因子Xa位点、伤害感受肽和间隔分子;并使用多种反向翻译软件工具[例如,EditSeq best E.coli reverse translation(DNASTAR Inc.)或Backtranslationtool v2.0(Entelechon)],确定编码接头-配体-间隔分子区域的DNA序列。限制性位点随后被插入DNA序列,并能够被排列为BamHI-SalI-接头-蛋白酶位点-伤害感受肽-NheI-间隔分子-SpeI-PstI-XbaI-终止子-HindIII(SEQ ID7)。重要的是确保用于间隔分子、伤害感受肽和限制性序列的正确读码框被保持,和XbaI序列前面没有碱基,TC;如果这样的话,可能导致DAM甲基化。DNA序列针对限制性序列的插入被筛选,并且任何其它序列从剩余的序列中被手工移除,以保证了常见大肠杆菌密码子使用被保持。大肠杆菌密码子使用通过软件程序,如Graphical Codon Usage Analyser(Geneart)被评估,并且%GC含量和密码子使用比例通过参考公开的密码子使用表(例如,GenBank Release143,2004年9月13日)来评估。优化的DNA序列随后被商业合成(例如,通过Entelechon,Geneart或Sigma-Genosys),并在pCR4载体中被提供。LC/A-伤害感受肽-HN/A融合体的制备 

    为了产生LC-接头-伤害感受肽-间隔分子-HN构建体(SEQID13),编码接头(SEQ ID7)的pCR 4载体用BamHI+SalI限制性酶剪切。剪切的载体随后作为接受载体,用于被BamHI+SalI剪切的LC/ADNA(SEQ ID1)的插入和连接。产生的质粒DNA随后用PstI+XbaI限制性酶剪切,并作为接受载体,用于被PstI+XbaI剪切的HN/A DNA(SEQ ID2)的插入和连接。最终的构建体包含LC-接头-伤害感受肽-间隔分子-HN ORF(SEQ ID13),用于转染进表达载体进行表达,以产生SEQ ID14所示序列的融合蛋白。实施例3-伤害感受肽-LC/A-HN/A融合蛋白的制备(伤害感受肽是LC-链的N-末端) 

    LC/A-HN/A骨架按照实施例2所述,使用带有用于激活的因子Xa加入的合成的A血清型接头被构建,排列为BamHI-SalI-接头- 蛋白酶位点-接头-PstI-XbaI-终止子-HindIII(SEQ ID8)。LC/A-HN/A骨架及合成的N-末端呈递伤害感受肽插入体(SEQ ID9)用BamHI+HindIII限制性酶剪切,其被凝胶纯化并连接到一起,以产生伤害感受肽-间隔分子-LC-接头-HN。该ORF(SEQ ID15)随后用限制性酶AvaI+XbaI切出,用于转染进表达载体中表达,以产生SEQ ID16所示序列的融合蛋白。实施例4-LC/C-伤害感受肽-HN/C融合蛋白的制备 

    按照实施例1和2中使用的方法,LC/C(SEQ ID5)和HN/C(SEQ ID6)被产生并被插入C血清型接头,排列为BamHI-SalI-接头-蛋白酶位点-伤害感受肽-NheI-间隔分子-SpeI-PstI-XbaI-终止子-HindIII(SEQ ID10)。最终的构建体包含LC-接头-伤害感受肽-间隔分子-HNORF(SEQ ID17),用于转染进表达载体表达,以产生SEQ ID18所示序列的融合蛋白。实施例5-带有血清型A激活序列的LC/C-伤害感受肽-HN/C融合蛋白的制备 

    按照实施例1和2中使用的方法,LC/C(SEQ ID5)和HN/C(SEQ ID6)被产生并被插入A血清型接头,排列为BamHI-SalI-接头-蛋白酶位点-伤害感受肽-NheI-间隔分子-SpeI-PstI-XbaI-终止子-HindIII(SEQ ID7)。最终的构建体包含LC-接头-伤害感受肽-间隔分子-HNORF(SEQ ID19),用于转染进表达载体表达,以产生SEQ ID20所示序列的融合蛋白。实施例6-LC/A-met脑啡肽-HN/A融合蛋白的纯化 

    由于小的,5个氨基酸的,met-脑啡肽配体的尺寸,LC/A-met脑啡肽-HN/A融合体通过位点定向诱变[例如,使用 Quickchange(Stratagene Inc.)],使用LC/A-伤害感受肽-HN/A融合体(SEQ ID13)作为模板产生。编码YGGFM met-脑啡肽的肽的寡核苷酸被设计,保证标准大肠杆菌密码子的使用被保持,并且没有其它限制性酶位点被插入,由与LC/A-伤害感受肽-HN/A融合体任意一侧上伤害感受肽部分的接头区域互补的序列在其侧翼。SDM产物通过测序检查,并且最终的构建体包含LC-接头-met脑啡肽-间隔分子-HN ORF(SEQ ID21)用以表达SEQ ID22所示序列的蛋白。实施例7-LC/A-β内啡肽-HN/A融合蛋白的制备 

    按照实施例1和2中使用的方法,LC/A(SEQ ID1)和HN/A(SEQ ID2)被产生并被插入A血清型β内啡肽接头,排列为BamHI-SalI-接头-蛋白酶位点-β内啡肽-NheI-间隔分子-SpeI-PstI-XbaI-终止子-HindIII(SEQ ID11)。最终的构建体包含LC-接头-β内啡肽-间隔分子-HN ORF(SEQ ID23),用以表达SEQ ID24所示序列的蛋白。实施例8-LC/A-伤害感受肽变异体-HN/A融合蛋白的制备 

    按照实施例1和2中使用的方法,LC/A(SEQ ID1)和HN/A(SEQ ID2)被产生并被插入A血清型伤害感受肽变异体接头,排列为BamHI-SalI-接头-蛋白酶位点-伤害感受肽变异体-NheI-间隔分子-SpeI-PstI-XbaI-终止子-HindIII(SEQ ID 12)。最终的构建体包含LC-接头-伤害感受肽变异体-间隔分子-HN ORF(SEQ ID25),用以表达SEQID26所示序列的蛋白。实施例9-LC/A-伤害感受肽-HN/A融合蛋白的纯化方法 

    解冻装有25ml 50mM HEPES pH 7.2、200mM NaCl和大约10g大肠杆菌BL21细胞浆(cell paste)的falcon管。用50mM的HEPES pH 7.2、200mM的NaCl将融解的细胞浆补充到80ml,并在以22微米的功率冰上超声波处理,30秒开,30秒关,10个循环,以保证样品保持冷冻。在4℃,18000rpm下,离心裂解的细胞30分钟。将上清液加样到用50mM HEPES pH 7.2、200mM NaCl平衡的,装有0.1MNiSO4的螯合柱上(20-30ml的柱是足够的)。使用10到40mM咪唑的浓度梯度洗去非特异结合的蛋白,并用100mM咪唑洗脱融合蛋白。用5L的50mM HEPES pH 7.2、200mM NaCl在4℃渗析洗脱的融合蛋白过夜,并测量渗析的融合蛋白的OD。每100μg融合蛋白中加入1个单位的因子Xa,并在25℃稳定温育过夜。加样到用50mM HEPES pH7.2、200mM NaCl平衡的,装有0.1 M NiSO4的螯合柱上(20-30ml的柱足够)。用50mM HEPES pH 7.2、200mM NaCl清洗该柱到基线。使用10到40mM咪唑的浓度梯度洗去非特异结合的蛋白,并用100mM咪唑洗脱融合蛋白。用5L的50mM HEPES pH 7.2、200mM NaCl在4℃透析洗脱的融合蛋白过夜,并浓缩该融合体到约2mg/ml,将样品分成等量小样并在-20℃冷冻。用OD、BCA、纯度分析和SNAP-25评估测试纯化的蛋白。实施例10-通过测量P物质从神经元细胞培养物中的释放确定TM激动剂的活性材料P物质EIA从R&D Systems,UK获得。方法 

    eDRG的原代神经元培养物按前述(Duggan et al.,2002)建立。P物质从培养物中的释放通过EIA,基本根据前述(Duggan et al.,2002)评估。目标TM被加入神经元培养物(处理前至少2周建立); 对照培养物通过加入载体代替TM平行进行。对照和TM处理的培养物的P物质的刺激(100mM KCl)和基线释放,与总细胞裂解物含量一起获得。P物质的免疫反应性使用P物质酶免疫测试试剂盒(Substance P Enzyme Immunoassay Kits)(Cayman Chemical Company,USA or R&D Systems,UK),根据制造商的说明测量。 

    神经元细胞在目标TM存在的情况下释放P物质的量,与存在和不存在100mM KCl的情况下获得的释放比较。由上述目标TM刺激产生的P物质释放与基线释放表明,目标TM是如本说明书中定义的“激动剂配体”。如果希望,由目标TM刺激产生的P物质释放可以与用天然ORL-1受体配体,伤害感受肽(Tocris)产生的标准P物质释放曲线比较。实施例11-通过测量福斯高林(forskolin)刺激的cAMP生产确认ORL1受体激活 

    通过以下测试提供了给定TM通过ORL1受体被激活的确认,其中TMs抑制福斯高林刺激的cAMP生产的能力被评估。材料 

    [3H]腺嘌呤和[14C]cAMP从GE Healthcare获得方法 

    测试基本上按照Meunier et al.[Isolation and structure of theendogenous agonist of opioid receptor-like ORL1 receptor.Nature 377:532-535,1995]的先前所述予以进行,是在完整的,在24孔塑料盘中接种的,被转染的CHO细胞中进行。 

    向所述细胞中以0.4ml培养基的形式加入[3H]腺嘌呤(1.0μCi)。细胞在37℃保存2小时,以允许腺嘌呤进入细胞内ATP池。2小时后,细胞用温育缓冲液清洗一次,该缓冲液含有:130mM NaCl、4.8mM KCl、1.2mM KH2PO4、1.3mM CaCl2、1.2mM MgSO4、10mM葡萄糖、1mg/ml牛血清白蛋白和25mM HEPES pH 7.4,并用含有福斯高林(10μM)和异丁基甲基黄嘌呤(50μM)在含有和不含目标TM的 情况下进行替换。10分钟后,培养基被吸出并用0.5ml的0.2 M HCl代替。大约1000cpm的[14C]cAMP被加入每个孔,并被用作内部标准。孔中的内含物随后被转移到0.65g干燥铝粉的柱中。该柱用4ml的5mMHCl、0.5ml的0.1M醋酸铵,随后额外2毫升的醋酸铵洗脱。最终的洗脱物被收集到闪烁管中并对14C和氚计数。收集的量针对[14C]cAMP的恢复被修正。ORL1受体激动剂的TMs引起由福斯高林反应产生的cAMP水平的降低。实施例12-使用GTPγS结合功能测试确认ORL1受体激活 

    给定TM通过ORL1受体作用的确认也由以下测试,GTPγS结合功能测试提供。材料 

    [35S]GTPγS从GE Healthcare获得小麦芽凝集素包被(Wheatgerm agglutinin-coated(SPA))的珠从GE Healthcare获得方法 

    本测试基本上根据Traynor和Nahorski[Modulation byμ-opioid agonists of guanosine-5-O-(3-[35S]thio)triphosphate binding tomembranes from human neuroblastoma SH-SY5Y cells.Mol.Pharmacol.47:848-854,1995]所述进行。 

    细胞从组织培养盘中被刮入20mM HEPES、1mM乙二胺四乙酸中,随后500×g离心10分钟。细胞被重悬浮在该缓冲液中,并用Polytron匀质器(Homogenizer)均一化。 

    匀浆在27,000×g离心15分钟,并且沉淀物在缓冲液A中重悬浮,该缓冲液含有:20mM HEPES、10mM MgCl2、100mM NaCl,pH7.4。悬液在20,000×g离心并再次被悬浮在缓冲液A中。对于结合测试,膜(8-15μg蛋白)与[35S]GTP S(50pM)、GDP(10μM),在含有和不含目标TM的情况下,在总体积1.0ml中25℃温育60分钟。样品在玻璃纤维过滤器中被过滤,并根据结合测试中所述计数。 实施例13-LC/A-伤害感受肽-HN/A融合蛋白的制备(伤害感受肽是HN-链的N-末端) 

    接头-伤害感受肽-间隔分子插入体按实施例2所述制备。LC/A-伤害感受肽-HN/A融合体的制备 

    为了产生LC-接头-伤害感受肽-间隔分子-HN构建体(SEQID13),编码接头(SEQ ID7)的pCR 4载体用BamHI+SalI限制性酶剪切。剪切的载体随后作为接受体,用于被BamHI+SalI剪切的LC/ADNA(SEQ ID1)的插入和连接。产生的质粒DNA随后被BamHI+HindIII限制性酶剪切,并且LC/A-接头片段被插入到被相似剪切的载体中,该载体包含BamHI、SalI、PstI和HindIII的独特多克隆位点,如pMAL载体(NEB)。HN/A DNA(SEQ ID2)随后被PstI+HindIII限制性酶剪切,并被插入被相似剪切的pMAL-LC/A-接头构建体。最终的构建体包含LC-接头-伤害感受肽-间隔分子-HN ORF(SEQ ID13),用于转染进表达载体表达,以产生SEQ ID14所示序列的蛋白。 实施例14-伤害感受肽-LC/A-HN/A融合蛋白的制备(伤害感受肽是LC-链的N-末端) 

    为了产生伤害感受肽-间隔分子-LC/A-HN/A构建体,使用带有用于激活的因子Xa加入的A血清型接头,排列为BamHI-SalI-接头-蛋白酶位点-接头-PstI-XbaI-终止子-HindIII(SEQ ID8),按实施例13所述被合成。编码该接头的pCR 4载体用BamHI+SalI限制性酶剪切。剪切的载体随后作为接受体,用于被BamHI+SalI剪切的LC/A DNA(SEQ ID1)的插入和连接。产生的质粒DNA随后被BamHI+HindIII限制性酶剪切,并且LC/A-接头片段被插入被相似剪切的载体,该载体包含合成的N-末端呈递的伤害感受肽插入体(SEQ ID9)。该构建体随后用AvaI+HindIII剪切,并被插入表达载体,如pMAL质粒(NEB)。HN/ADNA(SEQ ID2)随后被PstI+HindIII限制性酶剪切,并被插入被相似剪切的pMAL-伤害感受肽-LC/A-接头构建体。最终的构建体包含伤害感受肽-间隔分子-LC/A-HN/A ORF(SEQ ID51),用于转染进表达载体表 达,以产生SEQ ID52所示序列的蛋白质。 实施例15-具有可变间隔长度产物的LC/A-伤害感受肽-HN/A融合蛋白家族的表达和纯化 

    使用如实施例2中采用的策略,一系列编码伤害感受肽和间隔分子的DNA接头被制备。使用多种反向翻译软件工具之一[例如,EditSeq best E.coli reverse translation(DNASTAR Inc.)或Backtranslationtool v2.0(Entelechon)],编码接头-配体-间隔分子区域的DNA序列被确定。限制性位点随后被插入DNA序列,并能够被排列为BamHI-SalI-接头-蛋白酶位点-伤害感受肽-NheI-间隔分子-SpeI-PstI-XbaI-终止子-HindIII(SEQ ID53到SEQ ID57)。重要的是确保用于间隔分子、伤害感受肽和限制性序列的正确读码框被保持,和XbaI序列的前面没有碱基TC;如果有碱基TC的话,可能导致DAM甲基化。DNA序列针对限制性序列的插入被筛选,并且任何其它序列从剩余的序列中被手工移除,以保证了常见大肠杆菌密码子使用被保持。大肠杆菌密码子使用通过软件程序,如Graphical Codon Usage Analyser(Geneart)被评估,并且%GC含量和密码子使用比例通过参考公开的密码子使用表(例如,GenBank Release 143,2004年9月13日)来评估。优化的DNA序列随后被商业合成(例如,通过Entelechon,Geneart或Sigma-Genosys),并在pCR4载体中被提供。 所产生的间隔分子包括: 编码  接头的蛋白序列 接头DNA的SEQ ID GS10  ALAGGGGSALVLQ 53 GS15  ALAGGGGSGGGGSALVLQ 54 GS25  ALAGGGGSGGGGSGGGGSGGGGSALVLQ 55 GS30  ALAGGGGSGGGGSGGGGSGGGGSGGGGSALVLQ 56 HX27  ALAAEAAAKEAAAKEAAAKAGGGGSALVLQ 57

    表1 

    通过实施例的方式,为了产生LC/A-CPN(GS15)-HN/A融合构建体(SEQ ID58),编码接头(SEQ ID54)的pCR 4载体用BamHI+SalI限制性酶剪切。剪切的载体随后作为接受体,用于被BamHI+SalI剪切的LC/A DNA(SEQ ID1)的插入和连接。产生的质粒DNA随后被BamHI+HindIII限制性酶剪切,并且LC/A-接头片段被插入被相似剪切的载体,该载体包含BamHI、SalI、PstI和HindIII独特的多克隆位点,如pMAL载体(NEB)。HN/A DNA(SEQ ID2)随后被PstI+HindIII限制性酶剪切,并被插入被相似剪切的pMAL-LC/A-接头构建体。最终的构建体包含LC/A-CPN(GS15)-HN/A ORF(SEQ ID58),用于表达SEQ ID59所示序列的蛋白。 

    作为一个进一步的实例,要产生LC/A-CPN(GS25)-HN/A融合构建体(SEQ ID60),编码接头(SEQ ID55)的pCR 4载体用BamHI+SalI限制性酶剪切。剪切的载体随后作为接受载体,用于被BamHI+SalI剪切的LC/A DNA(SEQ ID1)的插入和连接。产生的质粒DNA随后被BamHI+HindIII限制性酶剪切,并且LC/A-接头片段被插入被相似剪切的载体,该载体包含BamHI、SalI、PstI和HindIII独特的多克隆位点,如pMAL载体(NEB)。HN/A DNA(SEQ ID2)随后被PstI+HindIII限制性酶剪切,并被插入被相似剪切的pMAL-LC/A-接头构建体。最终的构建体包含LC/A-CPN(GS25)-HN/A ORF(SEQ ID60),用于表达SEQ ID61所示序列的蛋白。 

    含有GS10、GS30和HX27的LC/A-CPN-HN/A融合体的变异体被相似地构建。使用实施例9所述的纯化方法,融合蛋白从大肠杆菌细胞浆中被纯化。图9显示了在LC/A-CPN(GS10)-HN/A、LC/A-CPN(GS15)-HN/A、LC/A-CPN(GS25)-HN/A、LC/A-CPN(GS30)-HN/A和LC/A-CPN(HX27)-HN/A情况下获得的纯化产品。 实施例16-LC/A-伤害感受肽-HN/A融合体的体外活性的评估 

    根据实施例2和9制备的融合蛋白在eDRG神经元细胞模型中被评估。 

    P物质释放和SNAP-25剪切抑制的评估已经在此前报告(Duggan et al.,2002,J.Biol.Chem.,277,34846-34852)。简单地说,背根神经节神经元从15天大的胎儿Sprague-Dawley大鼠中收集,并且分离的细胞以1×106细胞/孔的密度在Matrigel包被的24孔板中接种。接种一天后,细胞用10μM胞嘧啶β-D-呋喃阿拉伯糖苷(arabinofuranoside)处理48小时。细胞被保存在补充有5%热失活的胎牛血清、5mM L-谷氨酰胺、0.6%D-葡萄糖、2%B27补充剂和100ng/ml 2.5S小鼠神经生长因子的Dulbecco’s基本必须培养基中。加入测试物质前,培养被保持在37℃,95%空气/5%CO2的环境中2周。 

    P物质从eDRG的释放由酶联免疫吸收测试(enzyme-linkedimmunosorbent assay)评估。简单地说,eDRG细胞用低钾平衡的盐溶液(BSS:5mM KCl、137mM NaCl、1.2mM MgCl2、5mM葡萄糖、0.44mMKH2PO4、20mM HEPES,pH 7.4、2mM CaCl2)冲洗两次。基线样品通过用1ml的低钾BBS温育每个孔5分钟获得。去除该缓冲液后,细胞通过与1ml高钾缓冲液(如上述BBS,修改为包括用NaCl等渗平衡的100mM KCl)温育被刺激以释放。稀释的样品被评估P物质的含量。P物质的免疫反应性使用P物质酶免疫测试试剂盒(Substance P EnzymeImmunoassay Kits)(Cayman Chemical Company或R&D Systems),根据制造商的说明测量。P物质被表示为相对于平行进行的标准P物质曲线的pg/ml。 

    SDS-PAGE和蛋白质印迹分析使用标准的步骤(Novex)进行。SNAP-25蛋白在12%的Tris/甘氨酸聚丙烯酰胺凝胶(Novex)上分离并随后被转移到硝酸纤维素膜上。该膜用识别受剪切的和完整的SNAP-25的单克隆抗体(SMI-81)检测。特异结合使用过氧化物酶偶联的二抗和化学荧光检测系统观察。SNAP-25的剪切通过扫描密度计(Molecular Dynamics Personal SI,ImageQuant数据分析软件)量化。SNAP-25剪切的百分比根据下式计算:(剪切的SNAP-25/(剪切的+完整的SNAP-25))x100。 

    eDRG神经元暴露于LC/A-伤害感受肽-HN/A融合体(称作CPN-A)后,P物质释放和SNAP-25的剪切的抑制均被观察到(图10)。暴露于融合体24小时后,最大SNAP-25剪切的50%通过融合体浓度 为6.3±2.5nM而达到。 

    该融合体的效果也在eDRG暴露于CPN-A 16小时后在确定的时间点评估。图11显示了CFN-A融合蛋白延长的作用时间,可测量活性在暴露后28天仍可被观察到。 实施例17-LC/A-伤害感受肽变异体-HN/A融合体的体外活性的评估 

    根据实施例8和9制备的融合蛋白使用实施例16所述的方法,在eDRG神经元细胞模型中被评估。 

    eDRG神经元暴露于LC/A-伤害感受肽变异体-HN/A融合体(称作CPNv-A)后,P物质释放和SNAP-25的剪切之抑制均被观察到。暴露于融合体24小时后,最大SNAP-25剪切的50%通过融合体浓度1.4±0.4nM达到(图12)。 

    该融合体的效果也在eDRG暴露于CPN-A 16小时后在确定的时间点评估。图13显示了CPN-A融合蛋白延长的作用时间,可测量活性在暴露后24天仍可被观察到。 

    CPNv-A融合蛋白的结合能力也与CPN-A融合体比较评估。图14显示了竞争实验确定在ORL-1受体结合效力的结果。CPNv-A被显示替代了[3H]-伤害感受肽,由此确定了用中央呈递形式的配体可能到达该受体。 实施例18-通过肠激酶处理激活的LC/A-伤害感受肽变异体-HN/A融合蛋白的制备 

    按照实施例1和2中使用的方法,LC/A(SEQ ID1)和HN/A(SEQ ID2)被产生并被插入A血清型伤害感受肽变异体接头,排列为BamHI-SalI-接头-肠激酶蛋白酶位点-伤害感受肽变异体-NheI-间隔分子-SpeI-PstI-XbaI-终止子-HindIII(SEQ ID62)。最终的构建体包含LC-接头-伤害感受肽变异体-间隔分子-HN ORF序列(SEQ ID63),用以表达SEQ ID64所示序列的蛋白。该融合蛋白被称为CPNv(Ek)-A。图15显示了根据实施例9中使用的方法,但使用每100μg融合蛋白0.00064μg肠激酶激活,从大肠杆菌中纯化CPNv(Ek)-A。 实施例19-已经通过肠激酶处理激活的LC/A-伤害感受肽变异体-HN/A融合体体外效力的评估 

    实施例18中制备的CPNv(Ek)-A以纯化的形式获得,并且被加样到eDRG细胞模型以评估SNAP-25的剪切(使用实施例16的方法)。图16显示了eDRG暴露于CPNv(Ek)-A24小时后SNAP-25的剪切。剪切效率据观察与实施例17中记载的,使用因子Xa剪切物质所达到的效率相似。实施例20-带有从血清型A衍生的因子Xa激活接头的LC/C-伤害感受肽变异体-HN/C融合蛋白的制备 

    按照实施例4中使用的方法,LC/C(SEQ ID5)和HN/C(SEQID6)被产生并被插入A血清型股啡肽变异体接头,排列为BamHI-SalI-接头-伤害感受肽变异体-NheI-间隔分子-SpeI-PstI-XbaI-终止子-HindIII(SEQ ID65)。最终的构建体包含LC-接头-伤害感受肽变异体-间隔分子-HN ORF序列(SEQ ID66),用以表达SEQ ID67所示序列的蛋白。该融合蛋白被称为CPNv-C(act.A)。图17显示了CPNv-C产物(act.A)按照实施例9中使用的方法从大肠杆菌中纯化。 实施例21-LC/C-伤害感受肽变异体-HN/C融合蛋白体外效力的评估 

    根据实施例9使用的方法,实施例20中制备的CPNv-C(act.A)以纯化的形式获得,并且被加样到eDRG细胞模型以评估SNAP-25的剪切(使用实施例16的方法)。暴露于融合体24小时后,最大SNAP-25剪切的50%通过融合体浓度3.1±2.0nM达到。图18显示了eDRG暴露于CPNv-C(act.A)24小时后,突触融合蛋白的剪切。 实施例22-LC/A-伤害感受肽-HN/A融合体的体内活性的评估 

    LC/A-伤害感受肽-HN/A融合体(CPN/A)抑制急性辣椒素诱导的机械痛觉异常的能力,在大鼠后爪的皮下足底内注射后被评估。在招入研究之前(预处理),在用CPN/A皮下足底内注射后但在辣椒素刺激之前(Pre-CAP),和在CPN/A注射后且用辣椒素刺激后(平均反应为15′和30′;CAP),实验动物被评估对10g Von Frey纤丝刺激系列 (10刺激×3次试验)的爪回缩频度(PWF%)。辣椒素刺激通过10μL的0.3%溶液的注射完成。样品稀释物在0.5%的BSA/盐水中制备。图19显示了通过用一系列浓度的LC/A-伤害感受肽-HN/A融合体对动物预处理达到的机械性痛觉异常的逆转。 

    LC/A-伤害感受肽-HN/A融合体(CPN/A)抑制链脲酶素(STZ)在大鼠中诱导的机械性痛觉异常的能力,被评估。STZ-诱导的大鼠机械性痛觉异常通过链脲酶素的注射(i.p.或i.v.)达到,链脲酶素导致胰腺β细胞的解体和伴随的代谢压力(高血糖症和高血脂症),β细胞的解体导致胰岛素产生的缺失。因此,STZ诱导I型糖尿病。此外,STZ处理导致神经病变的逐步发展,其发挥带有痛觉过敏和痛觉异常的慢性疼痛的模型,其可能反映了糖尿病患者中观察到的标志(外周糖尿病神经痛)。 

    雄性Sprague-Dawley大鼠(250-300g)用65mg/kg溶解在柠檬酸盐缓冲液中的STZ处理(I.V.),并且血糖和脂质被每周测量以确定该模型的准备状态。爪回缩阈值(PWT)根据一段时间内响应于VonFrey纤丝刺激系列的反应被测量。当两个连续测量日(间隔1周)的PWT测量在尺度上低于6g时,疼痛异常被称为已建立。在这时,大鼠被随机分配到盐水组(阴性效力对照)、加巴喷丁(Gabapentin)组(阳性效力对照)或测试组(CPN/A)。测试物质(20-25μl)作为单一注射剂被皮下注射(不包括加巴喷丁),并且PWT在治疗1天后被测量,并在这之后的两周时间内定期测量。加巴喷丁(30mg/kg i.p.@3ml/kg注射体积)在开始PWT测试之前2小时,被每天注射。图20显示了通过用750ng的CPN/A对动物进行预处理达到的痛觉异常的逆转。数据是在CPN/A单次注射后2周的时间段内获得。 实施例23-LC/A-伤害感受肽变异体-HN/A融合体的体内效力的评估 

    LC/A-伤害感受肽变异体-HN/A融合体(CPNv/A)抑制辣椒素诱导的机械性疼痛异常的能力,在大鼠后爪皮下足底内注射后被评估。在招入研究之前(预处理),在用CPNv/A皮下足底内注射后但在辣椒素刺激之前(Pre-CAP),和在CPNv/A注射后且用辣椒素刺激后(平均反应为15′和30′;CAP),实验动物被评估在对10g Von Frey纤丝刺激 系列(10刺激x 3次试验)的爪回缩频度(PWF%)。辣椒素刺激通过10μL的0.3%溶液的注射完成。样品稀释物在0.5%的BSA/盐溶液中制备。 

    图21显示了通过用一系列浓度的LC/A-伤害感受肽变异体-HN/A融合体对动物预处理达到的机械性痛觉异常的逆转,与通过加入LC/A-伤害感受肽-HN/A融合体达到的逆转的比较。这些数据被表示为标准化的爪回缩频度差异,其中峰值反应(辣椒素之后)和基线反应(辣椒素之前)之间的差异被表示为百分比。用该分析,可以看出CPNv/A比CPN/A更有效,因为达到相似止痛效果需要比CPN/A低剂量的CPNv/A。 实施例24-LC/A-leu脑啡肽-HN/A融合蛋白的制备 

    由于小的、5个氨基酸的、leu-脑啡肽配体的尺寸,则LC/A-leu脑啡肽-HN/A融合体通过位点定向诱变[例如,使用Quickchange(Stratagene Inc.)],使用LC/A-伤害感受肽-HN/A融合体(SEQ ID13)作为模板产生。编码YGGFM leu-脑啡肽的肽的寡核苷酸被设计,保证标准大肠杆菌密码子的使用被保持,并且没有其它限制性酶位点被插入,由与LC/A-伤害感受肽-HN/A融合体(SEQ ID13)任意一侧上伤害感受肽部分的接头区域互补的序列在其侧翼。SDM产物通过测序检查,并且最终的构建体包含LC-接头-leu脑啡肽-间隔分子-HNORF(SEQ ID68)用以表达SEQ ID69所示序列的蛋白。该融合蛋白被称为CPLE-A。图22显示了根据实施例9中使用的方法,从大肠杆菌中纯化CPLE-A。 实施例25-LC/A-β内啡肽-HN/A融合蛋白的表达和纯化 

    使用实施例9所述的方法,并使用实施例7中产生的LC/A-β内啡肽-HN/A融合蛋白(被称为CPBE-A),CPBE-A从大肠杆菌中被纯化。图23显示了通过SDS-PAGE分析的纯化蛋白。 实施例26-LC/A-伤害感受肽变异体-HN/A融合蛋白的制备 

    由于单一氨基酸改变对将伤害感受肽序列第1位置的Phe 诱变为Tyr是必要的,LC/A-伤害感受肽变异体-HN/A融合体通过位点定向诱变[例如,使用Quickchange(Stratagene Inc.)],使用LC/A-伤害感受肽-HN/A融合体(SEQ ID13)作为模板产生。编码伤害感受肽序列中第1位酪氨酸的寡核苷酸被设计,保证标准大肠杆菌密码子的使用被保持,并且没有其它限制性酶位点被插入,由与LC/A-伤害感受肽-HN/A融合体(SEQ ID13)任意一侧上伤害感受肽部分的接头区域互补的序列在其侧翼。SDM产物通过测序检查,并且最终的构建体包含LC/A-伤害感受肽诱变体-间隔分子-HN/A融合体ORF(SEQ ID70)用以表达SEQID71所示序列的蛋白。该融合蛋白被称为CPOP-A。图24显示了根据实施例9中使用的方法,从大肠杆菌中纯化CPOP-A。 实施例27-LC/A-伤害感受肽变异诱变体-HN/A融合蛋白的制备和评估 

    由于单一氨基酸改变对将伤害感受肽序列第1位置的Phe诱变为Tyr是必要的,LC/A-伤害感受肽变异诱变体-HN/A融合体通过位点定向诱变[例如,使用Quickchange(Stratagene Inc.)],使用LC/A-伤害感受肽变异体-HN/A融合体(SEQ ID25)作为模板产生。编码伤害感受肽序列中第1位酪氨酸的寡核苷酸被设计,保证标准大肠杆菌密码子的使用被保持,并且没有其它限制性酶位点被插入,由与LC/A-伤害感受肽变异体-HN/A融合体(SEQ ID25)任意一侧上伤害感受肽部分的接头区域互补的序列在其侧翼。SDM产物通过测序检查,并且最终的构建体包含LC/A-伤害感受肽诱变体-间隔分子-HN/A融合体ORF(SEQID72)用以表达SEQ ID73所示序列的蛋白。该融合蛋白被称为CPOPv-A。图25显示了根据实施例9中使用的方法,从大肠杆菌中纯化CPOPv-A。 

    使用实施例16所述的方法,CPOPv-A被评估其在eDRG细胞模型中剪切SNAP-25的能力。图26显示了CPOPv-A能够在eDRG模型中剪切SNAP-25,细胞暴露于约5.9nM融合体24小时后,达到50%的最大SNAP-25剪切。 实施例28-IgA蛋白酶-伤害感受肽变异体-HN/A融合蛋白的制备 

    IgA蛋白酶的氨基酸序列从免费可用的数据库资源,如GenBank(登录号P09790)获得。关于淋球菌IgA蛋白酶基因结构的信息在文献(Pohlner et al.,Gene structure and extracellular secretion ofNeisseria gonorrhoeae IgA protease,Nature,1987,325(6103),458-62)中可找到。使用Backtranslation tool v2.0(Entelechon),编码为大肠杆菌表达所修饰的IgA蛋白酶的DNA序列被确定。BamHI识别序列被插入5′端,并且编码半胱氨酸氨基酸的密码子和SalI识别序列被插入IgADNA的3′端。DNA序列针对反向翻译过程中被插入的限制性酶剪切序列使用诸如MapDraw(DNASTAR Inc.)被筛选。被发现对克隆系统要求的那些常见的任意剪切序列从提议的编码序列中被手工移除,以保证常见大肠杆菌密码子选择被保持。大肠杆菌密码子选择通过软件程序,如图像密码子使用分析仪(Graphical Codon Usage Analyser(Geneart))被评估,并且%GC含量和密码子使用比例通过公开的密码子使用表来评估。含有IgA开放读码框(ORF)的优化的DNA序列(SEQID74)随后被商业合成。 

    IgA(SEQ ID74)使用BamHI和SalI限制性酶被插入LC-接头-伤害感受肽变异体-间隔分子-HN ORF(SEQ ID25),以用IgA蛋白酶DNA代替LC。最终的构建体包含IgA-接头-伤害感受肽变异体-间隔分子-HN ORF(SEQ ID75),用以表达SEQ ID76所示序列的蛋白。 实施例29-靶向带有可去除组氨酸纯化标记的肽链内切酶融合蛋白的伤害感受肽的制备和评估 

    编码因子Xa可去除his-标记(his-6)的DNA被制备,虽然明显的是可选的蛋白酶位点,如肠激酶,和可选的纯化标记,如更长的组氨酸标记,也是可能的。使用多种反向翻译软件工具之一[例如,EditSeq best E.coli reverse translation(DNASTAR Inc.)或Backtranslationtool v2.0(Entelechon)],编码因子Xa可去除his-标记区域的DNA序列被确定。限制性位点随后被插入DNA序列,并能够被排列为NheI-接头-SpeI-PstI-HN/A-XbaI-LEIEGRSGHHHHHH终止子-HindIII(SEQID77)。DNA序列针对限制性序列的插入被筛选,并且任何其它序列从剩余的序列中被手工移除,以保证了常见大肠杆菌密码子使用被保持。 大肠杆菌密码子使用通过软件程序,如图像密码子使用分析仪(Graphical Codon Usage Analyser(Geneart))被评估,并且%GC含量和密码子使用比例通过参考已经公开的密码子使用表(例如,GenBankRelease 143,2004年9月13日)来评估。优化的DNA序列随后被商业合成(例如,通过Entelechon,Geneart或Sigma-Genosys),并在pCR4载体中被提供。为了产生CPNv-A-FXa-HT(SEQ ID78,可去除his-标记的构建体),编码可去除his-标记的pCR 4载体用NheI和HindIII剪切。NheI-HindIII片段随后被插入也已经用NheI和HindIII剪切的LC/A-CPNv-HN/A载体(SEQ ID25)。最终的构建体包含LC/A-接头-伤害感受肽变异体-间隔分子-HN-FXa-His标记-HindIII ORF序列(SEQID78),用以表达SEQ ID79所示序列的蛋白。图27显示了按照实施例9中使用的方法从大肠杆菌中纯化的CPNv-A-FXa-HT。 实施例30-靶向含有从白喉毒素衍生的转运区域的肽链内切酶融合蛋白的leu-脑啡肽的制备 

    该DNA序列通过白喉毒素转运区域的氨基酸序列(从免费可用的数据库来源,如GenBank(登录号1XDTT)获得),使用多种反向翻译软件工具之一(例如,EditSeq best E.coli reverse translation(DNASTAR Inc.)或Backtranslation tool v2.0(Entelechon))]的反向翻译设计。限制性位点随后被插入DNA序列,并能够被排列为NheI-接头-SpeI-PstI-白喉转运区域-XbaI-终止子-HindIII(SEQ ID80)。PstI/XbaI识别序列分别被插入转运区域的5′和3′端,保持正确的读码框。DNA序列针对反向翻译过程中被插入的限制性酶剪切序列被筛选(使用诸如MapDraw,DNASTAR Inc.的软件)。被发现对克隆系统要求的那些常见的任意剪切序列,从提议的编码序列中被手工移除,所述编码序列保证了常见大肠杆菌密码子选择被保持。大肠杆菌密码子选择通过软件程序,如图像密码子使用分析仪(Graphical Codon Usage Analyser(Geneart))被评估,并且%GC含量和密码子使用比例通过参考公开的密码子使用表(例如,GenBank Release 143,2004年9月13日)来评估。含有白喉转运区域的优化的DNA序列随后被商业合成为NheI-接头-SpeI-PstI-白喉转运区域-XbaI-终止子-HindIII(例如,通过Entelechon, Geneart或Sigma-Genosys),并在pCR4载体中被提供。编码白喉转运区域的pCR 4载体用NheI和XbaI剪切。NheI-XbaI片段随后被插入也已经用NheI和XbaI剪切的LC/A-CPLE-HN/A载体(SEQ ID68)。最终的构建体包含LC/A-leu-脑啡肽-间隔分子-白喉转运区域ORF序列(SEQ ID81),用以表达SEQ ID82所示序列的蛋白。 实施例31-靶向含有从破伤风毒素衍生的LC区域的肽链内切酶融合蛋白的伤害感受肽变异体的制备 

    该DNA序列通过破伤风毒素LC氨基酸序列(从免费可用的数据库来源,如GenBank(登录号X04436)获得),使用多种反向翻译软件工具之一(例如,EditSeq best E.coli reverse translation(DNASTAR Inc.)或Backtranslation tool v2.0(Entelechon))]的反向翻译设计。BamHI/SalI识别序列分别被插入该序列的5′和3′端,保持正确的读码框(SEQ ID83)。DNA序列针对反向翻译过程中被插入的限制性酶剪切序列被筛选(使用诸如MapDraw,DNASTAR Inc.的软件)。被发现对克隆系统要求的那些常见的任意剪切序列,从提议的编码序列中被手工移除,所述编码序列保证了常见大肠杆菌密码子选择被保持。大肠杆菌密码子选择通过软件程序,如图像密码子使用分析仪(Graphical Codon Usage Analyser(Geneart))被评估,并且%GC含量和密码子使用比例通过公开的密码子使用表(例如,GenBank Release143,2004年9月13日)来评估。含有破伤风毒素LC开放读码框的,优化的DNA序列随后被商业合成(例如,通过Entelechon,Geneart或Sigma-Genosys),并在pCR4载体(invitrogen)中被提供。编码TeNT LC的pCR 4载体用BamHI和SalI剪切。BamHI-SalI片段随后被插入也已经用BamHI和SalI剪切的LC/A-CPNv-HN/A载体(SEQ ID25)。最终的构建体包含TeNT LC-接头-伤害感受肽变异体-间隔分子-HN ORF序列(SEQ ID84),用以表达SEQ ID85所示序列的蛋白。 实施例32-带有对因子Xa剪切易感的原生血清型C接头的LC/C-伤害感受肽变异体-HN/C融合蛋白的制备 

    按照实施例4中使用的方法,LC/C(SEQ ID5)和HN/C(SEQ ID6)被产生并被插入C血清型股啡肽变异体接头,排列为BamHI-SalI-接头-伤害感受肽变异体-NheI-间隔分子-SpeI-PstI-XbaI-终止子-HindIII(SEQ ID86)。最终的构建体包含LC-接头-伤害感受肽变异体-间隔分子-HN ORF序列(SEQ ID87),用以表达SEQ ID88所示序列的蛋白。该融合蛋白被称为CPNv-C(act.C)。 

    序列列表

    <110>赛恩泰新公司

         爱力根公司

         J·查多克

         K·福斯特

         P·马科斯

         P·斯坦库姆

         K·R·奥基

         J·弗朗西斯

         L·斯图尔德

     

    <120>疼痛的治疗

     

    <130>P29323GB/MRM

     

    <160>88

     

    <170>PatentIn version 3.3

     

    <210>1

    <211>1302

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>1

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac  180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg  240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt  300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg  360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt  420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct  480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac  540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa  600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg  660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat  720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt  780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa  840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac  900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa  960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc 1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt 1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc 1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct 1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac 1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg ac                    1302

     

    <210>2

    <211>1257

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>2

    ctgcagtgta tcaaggttaa caactgggat ttattcttca gcccgagtga agacaacttc   60

    accaacgacc tgaacaaagg tgaagaaatc acctcagata ctaacatcga agcagccgaa  120

    gaaaacatct cgctggacct gatccagcag tactacctga cctttaattt cgacaacgag  180

    ccggaaaaca tttctatcga aaacctgagc tctgatatca tcggccagct ggaactgatg  240

    ccgaacatcg aacgtttccc aaacggtaaa aagtacgagc tggacaaata taccatgttc  300

    cactacctgc gcgcgcagga atttgaacac ggcaaatccc gtatcgcact gactaactcc  360

    gttaacgaag ctctgctcaa cccgtcccgt gtatacacct tcttctctag cgactacgtg  420

    aaaaaggtca acaaagcgac tgaagctgca atgttcttgg gttgggttga acagcttgtt  480

    tatgatttta ccgacgagac gtccgaagta tctactaccg acaaaattgc ggatatcact  540

    atcatcatcc cgtacatcgg tccggctctg aacattggca acatgctgta caaagacgac  600

    ttcgttggcg cactgatctt ctccggtgcg gtgatcctgc tggagttcat cccggaaatc  660

    gccatcccgg tactgggcac ctttgctctg gtttcttaca ttgcaaacaa ggttctgact  720

    gtacaaacca tcgacaacgc gctgagcaaa cgtaacgaaa aatgggatga agtttacaaa  780

    tatatcgtga ccaactggct ggctaaggtt aatactcaga tcgacctcat ccgcaaaaaa  840

    atgaaagaag cactggaaaa ccaggcggaa gctaccaagg caatcattaa ctaccagtac  900

    aaccagtaca ccgaggaaga aaaaaacaac atcaacttca acatcgacga tctgtcctct  960

    aaactgaacg aatccatcaa caaagctatg atcaacatca acaagttcct gaaccagtgc 1020

    tctgtaagct atctgatgaa ctccatgatc ccgtacggtg ttaaacgtct ggaggacttc 1080

    gatgcgtctc tgaaagacgc cctgctgaaa tacatttacg acaaccgtgg cactctgatc 1140

    ggtcaggttg atcgtctgaa ggacaaagtg aacaatacct tatcgaccga catccctttt 1200

    cagctcagta aatatgtcga taaccaacgc cttttgtcca ctctagacta gaagctt    1257

     

    <210>3

    <211>1323

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>3

    ggatccatgc cggttaccat caacaacttc aactacaacg acccgatcga caacaacaac   60

    atcattatga tggaaccgcc gttcgcacgt ggtaccggac gttactacaa ggcttttaag  120

    atcaccgacc gtatctggat catcccggaa cgttacacct tcggttacaa acctgaggac  180

    ttcaacaaga gtagcgggat tttcaatcgt gacgtctgcg agtactatga tccagattat  240

    ctgaatacca acgataagaa gaacatattc cttcagacta tgattaaact cttcaaccgt  300

    atcaaaagca aaccgctcgg tgaaaaactc ctcgaaatga ttatcaacgg tatcccgtac  360

    ctcggtgacc gtcgtgtccc gcttgaagag ttcaacacca acatcgcaag cgtcaccgtc  420

    aacaaactca tcagcaaccc aggtgaagtc gaacgtaaaa aaggtatctt cgcaaacctc  480

    atcatcttcg gtccgggtcc ggtcctcaac gaaaacgaaa ccatcgacat cggtatccag  540

    aaccacttcg caagccgtga aggtttcggt ggtatcatgc agatgaaatt ctgcccggaa  600

    tacgtcagtg tcttcaacaa cgtccaggaa aacaaaggtg caagcatctt caaccgtcgt  660

    ggttacttca gcgacccggc actcatcctc atgcatgaac tcatccacgt cctccacggt  720

    ctctacggta tcaaagttga cgacctcccg atcgtcccga acgagaagaa attcttcatg  780

    cagagcaccg acgcaatcca ggctgaggaa ctctacacct tcggtggcca agacccaagt  840

    atcataaccc cgtccaccga caaaagcatc tacgacaaag tcctccagaa cttcaggggt  900

    atcgtggaca gactcaacaa agtcctcgtc tgcatcagcg acccgaacat caatatcaac  960

    atatacaaga acaagttcaa agacaagtac aaattcgtcg aggacagcga aggcaaatac 1020

    agcatcgacg tagaaagttt cgacaagctc tacaaaagcc tcatgttcgg tttcaccgaa 1080

    accaacatcg ccgagaacta caagatcaag acaagggcaa gttacttcag cgacagcctc 1140

    ccgcctgtca aaatcaagaa cctcttagac aacgagattt acacaattga agagggcttc 1200

    aacatcagtg acaaagacat ggagaaggaa tacagaggtc agaacaaggc tatcaacaaa 1260

    caggcatacg aggagatcag caaagaacac ctcgcagtct acaagatcca gatgtgcgtc 1320

    gac                                                               1323

     

    <210>4

    <211>1260

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>4

    ctgcagtgca tcgacgttga caacgaagac ctgttcttca tcgctgacaa aaacagcttc   60

    agtgacgacc tgagcaaaaa cgaacgtatc gaatacaaca cccagagcaa ctacatcgaa  120

    aacgacttcc cgatcaacga actgatcctg gacaccgacc tgataagtaa aatcgaactg  180

    ccgagcgaaa acaccgaaag tctgaccgac ttcaacgttg acgttccggt ttacgaaaaa  240

    cagccggcta tcaagaaaat cttcaccgac gaaaacacca tcttccagta cctgtacagc  300

    cagaccttcc cgctggacat ccgtgacatc agtctgacca gcagtttcga cgacgctctg  360

    ctgttcagca acaaagttta cagtttcttc agcatggact acatcaaaac cgctaacaaa  420

    gttgttgaag cagggctgtt cgctggttgg gttaaacaga tcgttaacga cttcgttatc  480

    gaagctaaca aaagcaacac tatggacaaa atcgctgaca tcagtctgat cgttccgtac  540

    atcggtctgg ctctgaacgt tggtaacgaa accgctaaag gtaactttga aaacgctttc  600

    gagatcgctg gtgcaagcat cctgctggag ttcatcccgg aactgctgat cccggttgtt  660

    ggtgctttcc tgctggaaag ttacatcgac aacaaaaaca agatcatcaa aaccatcgac  720

    aacgctctga ccaaacgtaa cgaaaaatgg agtgatatgt acggtctgat cgttgctcag  780

    tggctgagca ccgtcaacac ccagttctac accatcaaag aaggtatgta caaagctctg  840

    aactaccagg ctcaggctct ggaagagatc atcaaatacc gttacaacat ctacagtgag  900

    aaggaaaaga gtaacatcaa catcgacttc aacgacatca acagcaaact gaacgaaggt  960

    atcaaccagg ctatcgacaa catcaacaac ttcatcaacg gttgcagtgt tagctacctg 1020

    atgaagaaga tgatcccgct ggctgttgaa aaactgctgg acttcgacaa caccctgaaa 1080

    aagaacctgc tgaactacat cgacgaaaac aagctgtacc tgatcggtag tgctgaatac 1140

    gaaaaaagta aagtgaacaa atacctgaag accatcatgc cgttcgacct gagtatctac  1200

    accaacgaca ccatcctgat cgaaatgttc aacaaataca actctctaga ctagaagctt  1260

     

    <210>5

    <211>1329

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>5

    ggatccgaat tcatgccgat caccatcaac aacttcaact acagcgatcc ggtggataac   60

    aaaaacatcc tgtacctgga tacccatctg aataccctgg cgaacgaacc ggaaaaagcg  120

    tttcgtatca ccggcaacat ttgggttatt ccggatcgtt ttagccgtaa cagcaacccg  180

    aatctgaata aaccgccgcg tgttaccagc ccgaaaagcg gttattacga tccgaactat  240

    ctgagcaccg atagcgataa agataccttc ctgaaagaaa tcatcaaact gttcaaacgc  300

    atcaacagcc gtgaaattgg cgaagaactg atctatcgcc tgagcaccga tattccgttt  360

    ccgggcaaca acaacacccc gatcaacacc tttgatttcg atgtggattt caacagcgtt  420

    gatgttaaaa cccgccaggg taacaattgg gtgaaaaccg gcagcattaa cccgagcgtg  480

    attattaccg gtccgcgcga aaacattatt gatccggaaa ccagcacctt taaactgacc  540

    aacaacacct ttgcggcgca ggaaggtttt ggcgcgctga gcattattag cattagcccg  600

    cgctttatgc tgacctatag caacgcgacc aacgatgttg gtgaaggccg tttcagcaaa  660

    agcgaatttt gcatggaccc gatcctgatc ctgatgcatg aactgaacca tgcgatgcat  720

    aacctgtatg gcatcgcgat tccgaacgat cagaccatta gcagcgtgac cagcaacatc  780

    ttttacagcc agtacaacgt gaaactggaa tatgcggaaa tctatgcgtt tggcggtccg  840

    accattgatc tgattccgaa aagcgcgcgc aaatacttcg aagaaaaagc gctggattac  900

    tatcgcagca ttgcgaaacg tctgaacagc attaccaccg cgaatccgag cagcttcaac  960

    aaatatatcg gcgaatataa acagaaactg atccgcaaat atcgctttgt ggtggaaagc 1020

    agcggcgaag ttaccgttaa ccgcaataaa ttcgtggaac tgtacaacga actgacccag 1080

    atcttcaccg aatttaacta tgcgaaaatc tataacgtgc agaaccgtaa aatctacctg 1140

    agcaacgtgt ataccccggt gaccgcgaat attctggatg ataacgtgta cgatatccag 1200

    aacggcttta acatcccgaa aagcaacctg aacgttctgt ttatgggcca gaacctgagc 1260

    cgtaatccgg cgctgcgtaa agtgaacccg gaaaacatgc tgtacctgtt caccaaattt 1320

    tgcgtcgac                                                         1329

     

    <210>6

    <211>1263

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>6

    ctgcagtgtc gtgaactgct ggtgaaaaac accgatctgc cgtttattgg cgatatcagc   60

    gatgtgaaaa ccgatatctt cctgcgcaaa gatatcaacg aagaaaccga agtgatctac  120

    tacccggata acgtgagcgt tgatcaggtg atcctgagca aaaacaccag cgaacatggt  180

    cagctggatc tgctgtatcc gagcattgat agcgaaagcg aaattctgcc gggcgaaaac   240

    caggtgtttt acgataaccg tacccagaac gtggattacc tgaacagcta ttactacctg   300

    gaaagccaga aactgagcga taacgtggaa gattttacct ttacccgcag cattgaagaa   360

    gcgctggata acagcgcgaa agtttacacc tattttccga ccctggcgaa caaagttaat   420

    gcgggtgttc agggcggtct gtttctgatg tgggcgaacg atgtggtgga agatttcacc   480

    accaacatcc tgcgtaaaga taccctggat aaaatcagcg atgttagcgc gattattccg   540

    tatattggtc cggcgctgaa cattagcaat agcgtgcgtc gtggcaattt taccgaagcg   600

    tttgcggtta ccggtgtgac cattctgctg gaagcgtttc cggaatttac cattccggcg   660

    ctgggtgcgt ttgtgatcta tagcaaagtg caggaacgca acgaaatcat caaaaccatc   720

    gataactgcc tggaacagcg tattaaacgc tggaaagata gctatgaatg gatgatgggc   780

    acctggctga gccgtattat cacccagttc aacaacatca gctaccagat gtacgatagc   840

    ctgaactatc aggcgggtgc gattaaagcg aaaatcgatc tggaatacaa aaaatacagc   900

    ggcagcgata aagaaaacat caaaagccag gttgaaaacc tgaaaaacag cctggatgtg   960

    aaaattagcg aagcgatgaa taacatcaac aaattcatcc gcgaatgcag cgtgacctac  1020

    ctgttcaaaa acatgctgcc gaaagtgatc gatgaactga acgaatttga tcgcaacacc  1080

    aaagcgaaac tgatcaacct gatcgatagc cacaacatta ttctggtggg cgaagtggat  1140

    aaactgaaag cgaaagttaa caacagcttc cagaacacca tcccgtttaa catcttcagc  1200

    tataccaaca acagcctgct gaaagatatc atcaacgaat acttcaatct agactagaag  1260

    ctt                                                                1263

     

    <210>7

    <211>207

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>7

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat cgaaggtcgt    60

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaat tagctaacca ggcgctagcg   120

    ggcggtggcg gtagcggcgg tggcggtagc ggcggtggcg gtagcgcact agtgctgcag   180

    acgcacggtc tagaatgata aaagctt                                       207

     

    <210>8

    <211>108

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>8

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat agaaggtaga    60

    aacaaagcgc tgaacctgca gacgcacggt ctagaatgat aaaagctt                108

     

    <210>9

    <211>186

    <212>DNA

    <213>人工序列

    <220>

    <223>合成的

     

    <400>9

    catatgaata acctcgggat tgagggtcgt tttggcggtt tcacgggcgc acgcaaatca   60

    gcgcgtaaat tagctaacca gactagtggc ggtgggggta gtggcggtgg cggttcgggc  120

    gggggtggga gccctagggg atccgtcgac ctgcagggtc tagaagcgct agcgtgataa  180

    aagctt                                                             186

     

    <210>10

    <211>180

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>10

    ggatccacgc acgtcgacgc gattgatggt cgttttggcg gtttcacggg cgcacgcaaa   60

    tcagcgcgta aattagctaa ccaggcgcta gcgggcggtg gcggtagcgg cggtggcggt  120

    agcggcggtg gcggtagcgc actagtgctg cagacgcacg gtctagaatg ataaaagctt  180

     

    <210>11

    <211>249

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>11

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat cgaaggtcgt   60

    tacggtggtt tcatgacctc tgaaaaatct cagaccccgc tggttaccct gttcaaaaac  120

    gctatcatca aaaacgctta caaaaaaggt gaagcgctag cgggtggtgg tggttctggt  180

    ggtggtggtt ctggtggtgg tggttctgca ctagtgctgc agacgcacgg tctagaatga  240

    taaaagctt                                                          249

     

    <210>12

    <211>207

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>12

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat cgaaggtcgt   60

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaac gtaagaacca ggcgctagcg  120

    ggcggtggcg gtagcggcgg tggcggtagc ggcggtggcg gtagcgcact agtgctgcag  180

    acgcacggtc tagaatgata aaagctt                                      207

     

    <210>13

    <211>2709

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

    <400>13

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac     60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc    120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac    180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg    240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt    300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg    360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt    420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct    480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac    540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa    600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg    660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat    720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt    780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa    840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac    900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa    960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc   1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt   1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc   1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct   1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac   1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa   1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atcagcgcgt   1380

    aaattagcta accaggcgct agcgggcggt ggcggtagcg gcggtggcgg tagcggcggt   1440

    ggcggtagcg cactagtgct gcagtgtatc aaggttaaca actgggattt attcttcagc   1500

    ccgagtgaag acaacttcac caacgacctg aacaaaggtg aagaaatcac ctcagatact   1560

    aacatcgaag cagccgaaga aaacatctcg ctggacctga tccagcagta ctacctgacc   1620

    tttaatttcg acaacgagcc ggaaaacatt tctatcgaaa acctgagctc tgatatcatc   1680

    ggccagctgg aactgatgcc gaacatcgaa cgtttcccaa acggtaaaaa gtacgagctg   1740

    gacaaatata ccatgttcca ctacctgcgc gcgcaggaat ttgaacacgg caaatcccgt   1800

    atcgcactga ctaactccgt taacgaagct ctgctcaacc cgtcccgtgt atacaccttc   1860

    ttctctagcg actacgtgaa aaaggtcaac aaagcgactg aagctgcaat gttcttgggt   1920

    tgggttgaac agcttgttta tgattttacc gacgagacgt ccgaagtatc tactaccgac   1980

    aaaattgcgg atatcactat catcatcccg tacatcggtc cggctctgaa cattggcaac   2040

    atgctgtaca aagacgactt cgttggcgca ctgatcttct ccggtgcggt gatcctgctg   2100

    gagttcatcc cggaaatcgc catcccggta ctgggcacct ttgctctggt ttcttacatt   2160

    gcaaacaagg ttctgactgt acaaaccatc gacaacgcgc tgagcaaacg taacgaaaaa   2220

    tgggatgaag tttacaaata tatcgtgacc aactggctgg ctaaggttaa tactcagatc   2280

    gacctcatcc gcaaaaaaat gaaagaagca ctggaaaacc aggcggaagc taccaaggca  2340

    atcattaact accagtacaa ccagtacacc gaggaagaaa aaaacaacat caacttcaac  2400

    atcgacgatc tgtcctctaa actgaacgaa tccatcaaca aagctatgat caacatcaac  2460

    aagttcctga accagtgctc tgtaagctat ctgatgaact ccatgatccc gtacggtgtt  2520

    aaacgtctgg aggacttcga tgcgtctctg aaagacgccc tgctgaaata catttacgac  2580

    aaccgtggca ctctgatcgg tcaggttgat cgtctgaagg acaaagtgaa caatacctta  2640

    tcgaccgaca tcccttttca gctcagtaaa tatgtcgata accaacgcct tttgtccact  2700

    ctagactag                                                          2709

     

    <210>14

    <211>902

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>14

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

                    5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Ash Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Leu Ala Asn

        450                 455                 460

    Gln Ala Leu Ala GIy Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp

                    485                 490                 495

    Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys

                500                 505                 510

    Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn

            515                 520                 525

    Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp

        530                 535                 540

    Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile

    545                 550                 555                 560

    Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys

                    565                 570                 575

    Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln

                580                 585                 590

    Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn

            595                 600                 605

    Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp

        610                 615                 620

    Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly

    625                 630                 635                 640

    Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val

                    645                 650                 655

    Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile

                660                 665                 670

    Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val

            675                 680                 685

    Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro

        690                 695                 700

    Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile

    705                 710                 715                 720

    Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys

                    725                 730                 735

    Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp

                740                 745                 750

    Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys

            755                 760                 765

    Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr

        770                 775                 780

    Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn

    785                 790                 795                 800

    Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met

                    805                 810                 815

    Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met

                820                 825                 830

    Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala

            835                 840                 845

    Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr

        850                 855                 860

    Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu

    865                 870                 875                 880

    Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg

                    885                 890                 895

    Leu Leu Ser Thr Leu Asp

                900

     

    <210>15

    <211>2736

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>15

    ctcgggattg agggtcgttt tggcggtttc acgggcgcac gcaaatcagc gcgtaaatta   60

    gctaaccaga ctagtggcgg tgggggtagt ggcggtggcg gttcgggcgg gggtgggagc  120

    cctaggggat ccatggagtt cgttaacaaa cagttcaact ataaagaccc agttaacggt  180

    gttgacattg cttacatcaa aatcccgaac gctggccaga tgcagccggt aaaggcattc  240

    aaaatccaca acaaaatctg ggttatcccg gaacgtgata cctttactaa cccggaagaa  300

    ggtgacctga acccgccacc ggaagcgaaa caggtgccgg tatcttacta tgactccacc  360

    tacctgtcta ccgataacga aaaggacaac tacctgaaag gtgttactaa actgttcgag  420

    cgtatttact ccaccgacct gggccgtatg ctgctgacta gcatcgttcg cggtatcccg  480

    ttctggggcg gttctaccat cgataccgaa ctgaaagtaa tcgacactaa ctgcatcaac  540

    gttattcagc cggacggttc ctatcgttcc gaagaactga acctggtgat catcggcccg  600

    tctgctgata tcatccagtt cgagtgtaag agctttggtc acgaagttct gaacctcacc  660

    cgtaacggct acggttccac tcagtacatc cgtttctctc cggacttcac cttcggtttt  720

    gaagaatccc tggaagtaga cacgaaccca ctgctgggcg ctggtaaatt cgcaactgat  780

    cctgcggtta ccctggctca cgaactgatt catgcaggcc accgcctgta cggtatcgcc  840

    atcaatccga accgtgtctt caaagttaac accaacgcgt attacgagat gtccggtctg  900

    gaagttagct tcgaagaact gcgtactttt ggcggtcacg acgctaaatt catcgactct  960

    ctgcaagaaa acgagttccg tctgtactac tataacaagt tcaaagatat cgcatccacc 1020

    ctgaacaaag cgaaatccat cgtgggtacc actgcttctc tccagtacat gaagaacgtt 1080

    tttaaagaaa aatacctgct cagcgaagac acctccggca aattctctgt agacaagttg 1140

    aaattcgata aactttacaa aatgctgact gaaatttaca ccgaagacaa cttcgttaag 1200

    ttctttaaag ttctgaaccg caaaacctat ctgaacttcg acaaggcagt attcaaaatc  1260

    aacatcgtgc cgaaagttaa ctacactatc tacgatggtt tcaacctgcg taacaccaac  1320

    ctggctgcta attttaacgg ccagaacacg gaaatcaaca acatgaactt cacaaaactg  1380

    aaaaacttca ctggtctgtt cgagttttac aagctgctgt gcgtcgacgg catcattacc  1440

    tccaaaacta aatctctgat agaaggtaga aacaaagcgc tgaacgacct ctgtatcaag  1500

    gttaacaact gggatttatt cttcagcccg agtgaagaca acttcaccaa cgacctgaac  1560

    aaaggtgaag aaatcacctc agatactaac atcgaagcag ccgaagaaaa catctcgctg  1620

    gacctgatcc agcagtacta cctgaccttt aatttcgaca acgagccgga aaacatttct  1680

    atcgaaaacc tgagctctga tatcatcggc cagctggaac tgatgccgaa catcgaacgt  1740

    ttcccaaacg gtaaaaagta cgagctggac aaatatacca tgttccacta cctgcgcgcg  1800

    caggaatttg aacacggcaa atcccgtatc gcactgacta actccgttaa cgaagctctg  1860

    ctcaacccgt cccgtgtata caccttcttc tctagcgact acgtgaaaaa ggtcaacaaa  1920

    gcgactgaag ctgcaatgtt cttgggttgg gttgaacagc ttgtttatga ttttaccgac  1980

    gagacgtccg aagtatctac taccgacaaa attgcggata tcactatcat catcccgtac  2040

    atcggtccgg ctctgaacat tggcaacatg ctgtacaaag acgacttcgt tggcgcactg  2100

    atcttctccg gtgcggtgat cctgctggag ttcatcccgg aaatcgccat cccggtactg  2160

    ggcacctttg ctctggtttc ttacattgca aacaaggttc tgactgtaca aaccatcgac  2220

    aacgcgctga gcaaacgtaa cgaaaaatgg gatgaagttt acaaatatat cgtgaccaac  2280

    tggctggcta aggttaatac tcagatcgac ctcatccgca aaaaaatgaa agaagcactg  2340

    gaaaaccagg cggaagctac caaggcaatc attaactacc agtacaacca gtacaccgag  2400

    gaagaaaaaa acaacatcaa cttcaacatc gacgatctgt cctctaaact gaacgaatcc  2460

    atcaacaaag ctatgatcaa catcaacaag ttcctgaacc agtgctctgt aagctatctg  2520

    atgaactcca tgatcccgta cggtgttaaa cgtctggagg acttcgatgc gtctctgaaa  2580

    gacgccctgc tgaaatacat ttacgacaac cgtggcactc tgatcggtca ggttgatcgt  2640

    ctgaaggaca aagtgaacaa taccttatcg accgacatcc cttttcagct cagtaaatat  2700

    gtcgataacc aacgcctttt gtccactcta gactag                            2736

     

    <210>16

    <211>911

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>16

     

    Leu Gly Ile Glu Gly Arg Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser

    1               5                   10                  15

    Ala Arg Lys Leu Ala Asn Gln Thr Ser Gly Gly Gly Gly Ser Gly Gly

                20                  25                  30

    Gly Gly Ser Gly Gly Gly Gly Ser Pro Arg Gly Ser Met Glu Phe Val

            35                  40                  45

    Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly Val Asp Ile Ala

        50                  55                  60

    Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met Gln Pro Val Lys Ala Phe

    65                  70                  75                  80

    Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg Asp Thr Phe Thr

                    85                  90                  95

    Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu Ala Lys Gln Val

                100                 105                 110

    Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr Asp Asn Glu Lys

            115                 120                 125

    Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu Arg Ile Tyr Ser

        130                 135                 140

    Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val Arg Gly Ile Pro

    145                 150                 155                 160

    Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys Val Ile Asp Thr

                    165                 170                 175

    Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr Arg Ser Glu Glu

                180                 185                 190

    Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile Ile Gln Phe Glu

            195                 200                 205

    Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr Arg Asn Gly Tyr

        210                 215                 220

    Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe Thr Phe Gly Phe

    225                 230                 235                 240

    Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu Gly Ala Gly Lys

                    245                 250                 255

    Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu Leu Ile His Ala

                260                 265                 270

    Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn Arg Val Phe Lys

            275                 280                 285

    Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu Glu Val Ser Phe

        290                 295                 300

    Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys Phe Ile Asp Ser

    305                 310                 315                 320

    Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn Lys Phe Lys Asp

                    325                 330                 335

    Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val Gly Thr Thr Ala

                340                 345                 350

    Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys Tyr Leu Leu Ser

            355                 360                 365

    Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu Lys Phe Asp Lys

        370                 375                 380

    Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp Asn Phe Val Lys

    385                 390                 395                 400

    Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn Phe Asp Lys Ala

                    405                 410                 415

    Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr Thr Ile Tyr Asp

                420                 425                 430

    Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn Phe Asn Gly Gln

            435                 440                 445

    Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu Lys Asn Phe Thr

        450                 455                 460

    Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Asp Gly Ile Ile Thr

    465                 470                 475                 480

    Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn Lys Ala Leu Asn Asp

                    485                 490                 495

    Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu

                500                 505                 510

    Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp

            515                 520                 525

    Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln

        530                 535                 540

    Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser

    545                 550                 555                 560

    Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro

                    565                 570                 575

    Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr

                580                 585                 590

    Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser

            595                 600                 605

    Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser

        610                 615                 620

    Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys

    625                 630                 635                 640

    Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr

                    645                 650                 655

    Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala

                660                 665                 670

    Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly

            675                 680                 685

    Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly

        690                 695                 700

    Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu

    705                 710                 715                 720

    Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val

                    725                 730                 735

    Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu

                740                 745                 750

    Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln

            755                 760                 765

    Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala

        770                 775                 780

    Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu

    785                 790                 795                 800

    Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys

                    805                 810                 815

    Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu

                820                 825                 830

    Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly

            835                 840                 845

    Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu

        850                 855                 860

    Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg

    865                 870                 875                 880

    Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln

                    885                 890                 895

    Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Leu Asp

                900                 905                 910

     

    <210>17

    <211>2715

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>17

    ggatccgaat tcatgccgat caccatcaac aacttcaact acagcgatcc ggtggataac   60

    aaaaacatcc tgtacctgga tacccatctg aataccctgg cgaacgaacc ggaaaaagcg  120

    tttcgtatca ccggcaacat ttgggttatt ccggatcgtt ttagccgtaa cagcaacccg    180

    aatctgaata aaccgccgcg tgttaccagc ccgaaaagcg gttattacga tccgaactat    240

    ctgagcaccg atagcgataa agataccttc ctgaaagaaa tcatcaaact gttcaaacgc    300

    atcaacagcc gtgaaattgg cgaagaactg atctatcgcc tgagcaccga tattccgttt    360

    ccgggcaaca acaacacccc gatcaacacc tttgatttcg atgtggattt caacagcgtt    420

    gatgttaaaa cccgccaggg taacaattgg gtgaaaaccg gcagcattaa cccgagcgtg    480

    attattaccg gtccgcgcga aaacattatt gatccggaaa ccagcacctt taaactgacc    540

    aacaacacct ttgcggcgca ggaaggtttt ggcgcgctga gcattattag cattagcccg    600

    cgctttatgc tgacctatag caacgcgacc aacgatgttg gtgaaggccg tttcagcaaa    660

    agcgaatttt gcatggaccc gatcctgatc ctgatgcatg aactgaacca tgcgatgcat    720

    aacctgtatg gcatcgcgat tccgaacgat cagaccatta gcagcgtgac cagcaacatc    780

    ttttacagcc agtacaacgt gaaactggaa tatgcggaaa tctatgcgtt tggcggtccg    840

    accattgatc tgattccgaa aagcgcgcgc aaatacttcg aagaaaaagc gctggattac    900

    tatcgcagca ttgcgaaacg tctgaacagc attaccaccg cgaatccgag cagcttcaac    960

    aaatatatcg gcgaatataa acagaaactg atccgcaaat atcgctttgt ggtggaaagc   1020

    agcggcgaag ttaccgttaa ccgcaataaa ttcgtggaac tgtacaacga actgacccag   1080

    atcttcaccg aatttaacta tgcgaaaatc tataacgtgc agaaccgtaa aatctacctg   1140

    agcaacgtgt ataccccggt gaccgcgaat attctggatg ataacgtgta cgatatccag   1200

    aacggcttta acatcccgaa aagcaacctg aacgttctgt ttatgggcca gaacctgagc   1260

    cgtaatccgg cgctgcgtaa agtgaacccg gaaaacatgc tgtacctgtt caccaaattt   1320

    tgcgtcgacg cgatagatgg tagatttggc ggtttcacgg gcgcacgcaa atcagcgcgt   1380

    aaattagcta accaggcgct agcgggcggt ggcggtagcg gcggtggcgg tagcggcggt   1440

    ggcggtagcg cactagtgct gcagtgtcgt gaactgctgg tgaaaaacac cgatctgccg   1500

    tttattggcg atatcagcga tgtgaaaacc gatatcttcc tgcgcaaaga tatcaacgaa   1560

    gaaaccgaag tgatctacta cccggataac gtgagcgttg atcaggtgat cctgagcaaa   1620

    aacaccagcg aacatggtca gctggatctg ctgtatccga gcattgatag cgaaagcgaa   1680

    attctgccgg gcgaaaacca ggtgttttac gataaccgta cccagaacgt ggattacctg   1740

    aacagctatt actacctgga aagccagaaa ctgagcgata acgtggaaga ttttaccttt   1800

    acccgcagca ttgaagaagc gctggataac agcgcgaaag tttacaccta ttttccgacc   1860

    ctggcgaaca aagttaatgc gggtgttcag ggcggtctgt ttctgatgtg ggcgaacgat   1920

    gtggtggaag atttcaccac caacatcctg cgtaaagata ccctggataa aatcagcgat   1980

    gttagcgcga ttattccgta tattggtccg gcgctgaaca ttagcaatag cgtgcgtcgt   2040

    ggcaatttta ccgaagcgtt tgcggttacc ggtgtgacca ttctgctgga agcgtttccg   2100

    gaatttacca ttccggcgct gggtgcgttt gtgatctata gcaaagtgca ggaacgcaac   2160

    gaaatcatca aaaccatcga taactgcctg gaacagcgta ttaaacgctg gaaagatagc   2220

    tatgaatgga tgatgggcac ctggctgagc cgtattatca cccagttcaa caacatcagc   2280

    taccagatgt acgatagcct gaactatcag gcgggtgcga ttaaagcgaa aatcgatctg   2340

    gaatacaaaa aatacagcgg cagcgataaa gaaaacatca aaagccaggt tgaaaacctg   2400

    aaaaacagcc tggatgtgaa aattagcgaa gcgatgaata acatcaacaa attcatccgc  2460

    gaatgcagcg tgacctacct gttcaaaaac atgctgccga aagtgatcga tgaactgaac  2520

    gaatttgatc gcaacaccaa agcgaaactg atcaacctga tcgatagcca caacattatt  2580

    ctggtgggcg aagtggataa actgaaagcg aaagttaaca acagcttcca gaacaccatc  2640

    ccgtttaaca tcttcagcta taccaacaac agcctgctga aagatatcat caacgaatac  2700

    ttcaatctag actag                                                   2715

     

    <210>18

    <211>904

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>18

     

    Gly Ser Glu Phe Met Pro Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp

    1               5                   10                  15

    Pro Val Asp Asn Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr

                20                  25                  30

    Leu Ala Asn Glu Pro Glu Lys Ala Phe Arg Ile Thr Gly Asn Ile Trp

            35                  40                  45

    Val Ile Pro Asp Arg Phe Ser Arg Asn Ser Asn Pro Asn Leu Asn Lys

        50                  55                  60

    Pro Pro Arg Val Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr

    65                  70                  75                  80

    Leu Ser Thr Asp Ser Asp Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys

                    85                  90                  95

    Leu Phe Lys Arg Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr

                100                 105                 110

    Arg Leu Ser Thr Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile

            115                 120                 125

    Asn Thr Phe Asp Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr

        130                 135                 140

    Arg Gln Gly Asn Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val

    145                 150                 155                 160

    Ile Ile Thr Gly Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr

                    165                 170                 175

    Phe Lys Leu Thr Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala

                180                 185                 190

    Leu Ser Ile Ile Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn

            195                 200                 205

    Ala Thr Asn Asp Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys

        210                 215                 220

    Met Asp Pro Ile Leu Ile Leu Met His Glu Leu Asn His Ala Met His

    225                 230                 235                 240

    Asn Leu Tyr Gly Ile Ala Ile Pro Asn Asp Gln Thr Ile Ser Ser Val

                    245                 250                 255

    Thr Ser Asn Ile Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala

                260                 265                 270

    Glu Ile Tyr Ala Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser

            275                 280                 285

    Ala Arg Lys Tyr Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile

        290                 295                 300

    Ala Lys Arg Leu Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn

    305                 310                 315                 320

    Lys Tyr Ile Gly Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe

                    325                 330                 335

    Val Val Glu Ser Ser Gly Glu Val Thr Val Asn Arg Asn Lys Phe Val

                340                 345                 350

    Glu Leu Tyr Asn Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala

            355                 360                 365

    Lys Ile Tyr Asn Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr

        370                 375                 380

    Thr Pro Val Thr Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln

    385                 390                 395                 400

    Asn Gly Phe Asn Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly

                    405                 410                 415

    Gln Asn Leu Ser Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn

                420                 425                 430

    Met Leu Tyr Leu Phe Thr Lys Phe Cys Val Asp Ala Ile Asp Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Leu Ala Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Ala Leu Val Leu Gln Cys Arg Glu Leu Leu Val Lys Asn

                    485                 490                 495

    Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Val Lys Thr Asp Ile

                500                 505                 510

    Phe Leu Arg Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Tyr Tyr Pro

            515                 520                 525

    Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr Ser Glu

        530                 535                 540

    His Gly Gln Leu Asp Leu Leu Tyr Pro Ser Ile Asp Ser Glu Ser Glu

    545                 550                 555                 560

    Ile Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr Gln Asn

                    565                 570                 575

    Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser

                580                 585                 590

    Asp Asn Val Glu Asp Phe Thr Phe Thr Arg Ser Ile Glu Glu Ala Leu

            595                 600                 605

    Asp Asn Ser Ala Lys Val Tyr Thr Tyr Phe Pro Thr Leu Ala Asn Lys

        610                 615                 620

    Val Asn Ala Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala Asn Asp

    625                 630                 635                 640

    Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr Leu Asp

                    645                 650                 655

    Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro Ala Leu

                660                 665                 670

    Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala Phe Ala

            675                 680                 685

    Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Pro Glu Phe Thr Ile

        690                 695                 700

    Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu Arg Asn

    705                 710                 715                 720

    Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile Lys Arg

                    725                 730                 735

    Trp Lys Asp Ser Tyr Glu Trp Met Met Gly Thr Trp Leu Ser Arg Ile

                740                 745                 750

    Ile Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser Leu Asn

            755                 760                 765

    Tyr Gln Ala Gly Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys

        770                 775                 780

    Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu

    785                 790                 795                 800

    Lys Asn Ser Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn

                    805                 810                 815

    Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu

                820                 825                 830

    Pro Lys Val Ile Asp Glu Leu Asn Glu Phe Asp Arg Asn Thr Lys Ala

            835                 840                 845

    Lys Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu

        850                 855                 860

    Val Asp Lys Leu Lys Ala Lys Val Asn Asn Ser Phe Gln Asn Thr Ile

    865                 870                 875                 880

    Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile

                    885                 890                 895

    Ile Asn Glu Tyr Phe Asn Leu Asp

                900

     

    <210>19

    <211>2742

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>19

    ggatccgaat tcatgccgat caccatcaac aacttcaact acagcgatcc ggtggataac   60

    aaaaacatcc tgtacctgga tacccatctg aataccctgg cgaacgaacc ggaaaaagcg  120

    tttcgtatca ccggcaacat ttgggttatt ccggatcgtt ttagccgtaa cagcaacccg  180

    aatctgaata aaccgccgcg tgttaccagc ccgaaaagcg gttattacga tccgaactat  240

    ctgagcaccg atagcgataa agataccttc ctgaaagaaa tcatcaaact gttcaaacgc  300

    atcaacagcc gtgaaattgg cgaagaactg atctatcgcc tgagcaccga tattccgttt  360

    ccgggcaaca acaacacccc gatcaacacc tttgatttcg atgtggattt caacagcgtt  420

    gatgttaaaa cccgccaggg taacaattgg gtgaaaaccg gcagcattaa cccgagcgtg  480

    attattaccg gtccgcgcga aaacattatt gatccggaaa ccagcacctt taaactgacc  540

    aacaacacct ttgcggcgca ggaaggtttt ggcgcgctga gcattattag cattagcccg  600

    cgctttatgc tgacctatag caacgcgacc aacgatgttg gtgaaggccg tttcagcaaa  660

    agcgaatttt gcatggaccc gatcctgatc ctgatgcatg aactgaacca tgcgatgcat  720

    aacctgtatg gcatcgcgat tccgaacgat cagaccatta gcagcgtgac cagcaacatc  780

    ttttacagcc agtacaacgt gaaactggaa tatgcggaaa tctatgcgtt tggcggtccg  840

    accattgatc tgattccgaa aagcgcgcgc aaatacttcg aagaaaaagc gctggattac  900

    tatcgcagca ttgcgaaacg tctgaacagc attaccaccg cgaatccgag cagcttcaac  960

    aaatatatcg gcgaatataa acagaaactg atccgcaaat atcgctttgt ggtggaaagc 1020

    agcggcgaag ttaccgttaa ccgcaataaa ttcgtggaac tgtacaacga actgacccag 1080

    atcttcaccg aatttaacta tgcgaaaatc tataacgtgc agaaccgtaa aatctacctg 1140

    agcaacgtgt ataccccggt gaccgcgaat attctggatg ataacgtgta cgatatccag 1200

    aacggcttta acatcccgaa aagcaacctg aacgttctgt ttatgggcca gaacctgagc 1260

    cgtaatccgg cgctgcgtaa agtgaacccg gaaaacatgc tgtacctgtt caccaaattt 1320

    tgcgtcgacg gcatcattac ctccaaaact aaatctctga tagaaggtag atttggcggt  1380

    ttcacgggcg cacgcaaatc agcgcgtaaa ttagctaacc aggcgctagc gggcggtggc  1440

    ggtagcggcg gtggcggtag cggcggtggc ggtagcgcac tagtgctgca gtgtcgtgaa  1500

    ctgctggtga aaaacaccga tctgccgttt attggcgata tcagcgatgt gaaaaccgat  1560

    atcttcctgc gcaaagatat caacgaagaa accgaagtga tctactaccc ggataacgtg  1620

    agcgttgatc aggtgatcct gagcaaaaac accagcgaac atggtcagct ggatctgctg  1680

    tatccgagca ttgatagcga aagcgaaatt ctgccgggcg aaaaccaggt gttttacgat  1740

    aaccgtaccc agaacgtgga ttacctgaac agctattact acctggaaag ccagaaactg  1800

    agcgataacg tggaagattt tacctttacc cgcagcattg aagaagcgct ggataacagc  1860

    gcgaaagttt acacctattt tccgaccctg gcgaacaaag ttaatgcggg tgttcagggc  1920

    ggtctgtttc tgatgtgggc gaacgatgtg gtggaagatt tcaccaccaa catcctgcgt  1980

    aaagataccc tggataaaat cagcgatgtt agcgcgatta ttccgtatat tggtccggcg  2040

    ctgaacatta gcaatagcgt gcgtcgtggc aattttaccg aagcgtttgc ggttaccggt  2100

    gtgaccattc tgctggaagc gtttccggaa tttaccattc cggcgctggg tgcgtttgtg  2160

    atctatagca aagtgcagga acgcaacgaa atcatcaaaa ccatcgataa ctgcctggaa  2220

    cagcgtatta aacgctggaa agatagctat gaatggatga tgggcacctg gctgagccgt  2280

    attatcaccc agttcaacaa catcagctac cagatgtacg atagcctgaa ctatcaggcg  2340

    ggtgcgatta aagcgaaaat cgatctggaa tacaaaaaat acagcggcag cgataaagaa  2400

    aacatcaaaa gccaggttga aaacctgaaa aacagcctgg atgtgaaaat tagcgaagcg  2460

    atgaataaca tcaacaaatt catccgcgaa tgcagcgtga cctacctgtt caaaaacatg  2520

    ctgccgaaag tgatcgatga actgaacgaa tttgatcgca acaccaaagc gaaactgatc  2580

    aacctgatcg atagccacaa cattattctg gtgggcgaag tggataaact gaaagcgaaa  2640

    gttaacaaca gcttccagaa caccatcccg tttaacatct tcagctatac caacaacagc  2700

    ctgctgaaag atatcatcaa cgaatacttc aatctagact ag                     2742

     

    <210>20

    <211>913

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>20

     

    Gly Ser Glu Phe Met Pro Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp

    1               5                   10                  15

    Pro Val Asp Asn Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr

                20                  25                  30

    Leu Ala Asn Glu Pro Glu Lys Ala Phe Arg Ile Thr Gly Asn Ile Trp

            35                  40                  45

    Val Ile Pro Asp Arg Phe Ser Arg Asn Ser Asn Pro Asn Leu Asn Lys

        50                  55                  60

    Pro Pro Arg Val Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr

    65                  70                  75                  80

    Leu Ser Thr Asp Ser Asp Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys

                    85                  90                  95

    Leu Phe Lys Arg Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr

                100                 105                 110

    Arg Leu Ser Thr Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile

            115                 120                 125

    Asn Thr Phe Asp Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr

        130                 135                 140

    Arg Gln Gly Asn Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val

    145                 150                 155                 160

    Ile Ile Thr Gly Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr

                    165                 170                 175

    Phe Lys Leu Thr Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala

                180                 185                 190

    Leu Ser Ile Ile Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn

            195                 200                 205

    Ala Thr Asn Asp Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys

        210                 215                 220

    Met Asp Pro Ile Leu Ile Leu Met His Glu Leu Asn His Ala Met His

    225                 230                 235                 240

    Asn Leu Tyr Gly Ile Ala Ile Pro Asn Asp Gln Thr Ile Ser Ser Val

                    245                 250                 255

    Thr Ser Asn Ile Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala

                260                 265                 270

    Glu Ile Tyr Ala Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser

            275                 280                 285

    Ala Arg Lys Tyr Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile

        290                 295                 300

    Ala Lys Arg Leu Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn

    305                 310                 315                 320

    Lys Tyr Ile Gly Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe

                    325                 330                 335

    Val Val Glu Ser Ser Gly Glu Val Thr Val Asn Arg Asn Lys Phe Val

                340                 345                 350

    Glu Leu Tyr Asn Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala

            355                 360                 365

    Lys Ile Tyr Asn Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr

        370                 375                 380

    Thr Pro Val Thr Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln

    385                 390                 395                 400

    Asn Gly Phe Asn Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly

                    405                 410                 415

    Gln Asn Leu Ser Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn

                420                 425                 430

    Met Leu Tyr Leu Phe Thr Lys Phe Cys Val Asp Gly Ile Ile Thr Ser

            435                 440                 445

    Lys Thr Lys Ser Leu Ile Glu Gly Arg Phe Gly Gly Phe Thr Gly Ala

        450                 455                 460

    Arg Lys Ser Ala Arg Lys Leu Ala Asn Gln Ala Leu Ala Gly Gly Gly

    465                 470                 475                 480

    Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Leu Val Leu

                    485                 490                 495

    Gln Cys Arg Glu Leu Leu Val Lys Asn Thr Asp Leu Pro Phe Ile Gly

                500                 505                 510

    Asp Ile Ser Asp Val Lys Thr Asp Ile Phe Leu Arg Lys Asp Ile Asn

            515                 520                 525

    Glu Glu Thr Glu Val Ile Tyr Tyr Pro Asp Asn Val Ser Val Asp Gln

        530                 535                 540

    Val Ile Leu Ser Lys Asn Thr Ser Glu His Gly Gln Leu Asp Leu Leu

    545                 550                 555                 560

    Tyr Pro Ser Ile Asp Ser Glu Ser Glu Ile Leu Pro Gly Glu Asn Gln

                    565                 570                 575

    Val Phe Tyr Asp Asn Arg Thr Gln Asn Val Asp Tyr Leu Asn Ser Tyr

                580                 585                 590

    Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asp Asn Val Glu Asp Phe Thr

            595                 600                 605

    Phe Thr Arg Ser Ile Glu Glu Ala Leu Asp Asn Ser Ala Lys Val Tyr

        610                 615                 620

    Thr Tyr Phe Pro Thr Leu Ala Asn Lys Val Asn Ala Gly Val Gln Gly

    625                 630                 635                 640

    Gly Leu Phe Leu Met Trp Ala Asn Asp Val Val Glu Asp Phe Thr Thr

                    645                 650                 655

    Asn Ile Leu Arg Lys Asp Thr Leu Asp Lys Ile Ser Asp Val Ser Ala

                660                 665                 670

    Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Ser Asn Ser Val Arg

            675                 680                 685

    Arg Gly Asn Phe Thr Glu Ala Phe Ala Val Thr Gly Val Thr Ile Leu

        690                 695                 700

    Leu Glu Ala Phe Pro Glu Phe Thr Ile Pro Ala Leu Gly Ala Phe Val

    705                 710                 715                 720

    Ile Tyr Ser Lys Val Gln Glu Arg Asn Glu Ile Ile Lys Thr Ile Asp

                    725                 730                 735

    Asn Cys Leu Glu Gln Arg Ile Lys Arg Trp Lys Asp Ser Tyr Glu Trp

                740                 745                 750

    Met Met Gly Thr Trp Leu Ser Arg Ile Ile Thr Gln Phe Asn Asn Ile

            755                 760                 765

    Ser Tyr Gln Met Tyr Asp Ser Leu Asn Tyr Gln Ala Gly Ala Ile Lys

        770                 775                 780

    Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly Ser Asp Lys Glu

    785                 790                 795                 800

    Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser Leu Asp Val Lys

                    805                 810                 815

    Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile Arg Glu Cys Ser

                820                 825                 830

    Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val Ile Asp Glu Leu

            835                 840                 845

    Asn Glu Phe Asp Arg Asn Thr Lys Ala Lys Leu Ile Asn Leu Ile Asp

        850                 855                 860

    Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Lys Leu Lys Ala Lys

    865                 870                 875                 880

    Val Asn Asn Ser Phe Gln Asn Thr Ile Pro Phe Asn I1e Phe Ser Tyr

                    885                 890                 895

    Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu Tyr Phe Asn Leu

                900                 905                 910

    Asp

     

    <210>21

    <211>2673

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>21

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac     180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg     240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt     300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg     360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt     420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct     480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac     540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa     600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg     660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat     720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt     780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa     840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac     900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa     960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc    1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt    1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc    1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct    1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac    1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa    1320

    actaaatctc tgatagaagg tagatacggt ggtttcatgg cgctagcggg cggtggcggt    1380

    agcggcggtg gcggtagcgg cggtggcggt agcgcactag tgctgcagtg tatcaaggtt    1440

    aacaactggg atttattctt cagcccgagt gaagacaact tcaccaacga cctgaacaaa    1500

    ggtgaagaaa tcacctcaga tactaacatc gaagcagccg aagaaaacat ctcgctggac    1560

    ctgatccagc agtactacct gacctttaat ttcgacaacg agccggaaaa catttctatc    1620

    gaaaacctga gctctgatat catcggccag ctggaactga tgccgaacat cgaacgtttc    1680

    ccaaacggta aaaagtacga gctggacaaa tataccatgt tccactacct gcgcgcgcag    1740

    gaatttgaac acggcaaatc ccgtatcgca ctgactaact ccgttaacga agctctgctc    1800

    aacccgtccc gtgtatacac cttcttctct agcgactacg tgaaaaaggt caacaaagcg    1860

    actgaagctg caatgttctt gggttgggtt gaacagcttg tttatgattt taccgacgag    1920

    acgtccgaag tatctactac cgacaaaatt gcggatatca ctatcatcat cccgtacatc    1980

    ggtccggctc tgaacattgg caacatgctg tacaaagacg acttcgttgg cgcactgatc    2040

    ttctccggtg cggtgatcct gctggagttc atcccggaaa tcgccatccc ggtactgggc    2100

    acctttgctc tggtttctta cattgcaaac aaggttctga ctgtacaaac catcgacaac    2160

    gcgctgagca aacgtaacga aaaatgggat gaagtttaca aatatatcgt gaccaactgg    2220

    ctggctaagg ttaatactca gatcgacctc atccgcaaaa aaatgaaaga agcactggaa    2280

    aaccaggcgg aagctaccaa ggcaatcatt aactaccagt acaaccagta caccgaggaa    2340

    gaaaaaaaca acatcaactt caacatcgac gatctgtcct ctaaactgaa cgaatccatc    2400

    aacaaagcta tgatcaacat caacaagttc ctgaaccagt gctctgtaag ctatctgatg  2460

    aactccatga tcccgtacgg tgttaaacgt ctggaggact tcgatgcgtc tctgaaagac  2520

    gccctgctga aatacattta cgacaaccgt ggcactctga tcggtcaggt tgatcgtctg  2580

    aaggacaaag tgaacaatac cttatcgacc gacatccctt ttcagctcag taaatatgtc  2640

    gataaccaac gccttttgtc cactctagac tag                               2673

     

    <210>22

    <211>890

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>22

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Tyr Gly Gly Phe Met Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly

        450                 455                 460

    Gly Ser Gly Gly Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys Val

    465                 470                 475                 480

    Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn

                    485                 490                 495

    Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala

                500                 505                 510

    Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr

            515                 520                 525

    Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser

        530                 535                 540

    Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg Phe

    545                 550                 555                 560

    Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His Tyr

                    565                 570                 575

    Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu Thr

                580                 585                 590

    Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe

            595                 600                 605

    Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala Ala

        610                 615                 620

    Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu

    625                 630                 635                 640

    Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile

                    645                 650                 655

    Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys

                660                 665                 670

    Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu Leu

            675                 680                 685

    Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala Leu

        690                 695                 700

    Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp Asn

    705                 710                 715                 720

    Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile

                    725                 730                 735

    Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile Arg

                740                 745                 750

    Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala

            755                 760                 765

    Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn

        770                 775                 780

    Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile

    785                 790                 795                 800

    Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser Val

                    805                 810                 815

    Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu Glu

                820                 825                 830

    Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp

            835                 840                 845

    Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys Val

        850                 855                 860

    Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val

    865                 870                 875                 880

    Asp Asn Gln Arg Leu Leu Ser Thr Leu Asp

                    885                 890

     

    <210>23

    <211>2751

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>23

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac  180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg  240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt  300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg  360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt  420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct  480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac  540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa  600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg  660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat  720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt  780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa  840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac  900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa  960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc 1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt 1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc 1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct 1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac 1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa 1320

    actaaatctc tgatcgaagg tcgttacggt ggtttcatga cctctgaaaa atctcagacc 1380

    ccgctggtta ccctgttcaa aaacgctatc atcaaaaacg cttacaaaaa aggtgaagcg 1440

    ctagcgggtg gtggtggttc tggtggtggt ggttctggtg gtggtggttc tgcactagtg 1500

    ctgcagtgta tcaaggttaa caactgggat ttattcttca gcccgagtga agacaacttc  1560

    accaacgacc tgaacaaagg tgaagaaatc acctcagata ctaacatcga agcagccgaa  1620

    gaaaacatct cgctggacct gatccagcag tactacctga cctttaattt cgacaacgag  1680

    ccggaaaaca tttctatcga aaacctgagc tctgatatca tcggccagct ggaactgatg  1740

    ccgaacatcg aacgtttccc aaacggtaaa aagtacgagc tggacaaata taccatgttc  1800

    cactacctgc gcgcgcagga atttgaacac ggcaaatccc gtatcgcact gactaactcc  1860

    gttaacgaag ctctgctcaa cccgtcccgt gtatacacct tcttctctag cgactacgtg  1920

    aaaaaggtca acaaagcgac tgaagctgca atgttcttgg gttgggttga acagcttgtt  1980

    tatgatttta ccgacgagac gtccgaagta tctactaccg acaaaattgc ggatatcact  2040

    atcatcatcc cgtacatcgg tccggctctg aacattggca acatgctgta caaagacgac  2100

    ttcgttggcg cactgatctt ctccggtgcg gtgatcctgc tggagttcat cccggaaatc  2150

    gccatcccgg tactgggcac ctttgctctg gtttcttaca ttgcaaacaa ggttctgact  2220

    gtacaaacca tcgacaacgc gctgagcaaa cgtaacgaaa aatgggatga agtttacaaa  2280

    tatatcgtga ccaactggct ggctaaggtt aatactcaga tcgacctcat ccgcaaaaaa  2340

    atgaaagaag cactggaaaa ccaggcggaa gctaccaagg caatcattaa ctaccagtac  2400

    aaccagtaca ccgaggaaga aaaaaacaac atcaacttca acatcgacga tctgtcctct  2460

    aaactgaacg aatccatcaa caaagctatg atcaacatca acaagttcct gaaccagtgc  2520

    tctgtaagct atctgatgaa ctccatgatc ccgtacggtg ttaaacgtct ggaggacttc  2580

    gatgcgtctc tgaaagacgc cctgctgaaa tacatttacg acaaccgtgg cactctgatc  2640

    ggtcaggttg atcgtctgaa ggacaaagtg aacaatacct tatcgaccga catccctttt  2700

    cagctcagta aatatgtcga taaccaacgc cttttgtcca ctctagacta g           2751

     

    <210>24

    <211>916

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>24

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Tyr Gly Gly Phe Met Thr Ser Glu Lys Ser Gln Thr Pro Leu Val Thr

        450                 455                 460

    Leu Phe Lys Asn Ala Ile Ile Lys Asn Ala Tyr Lys Lys Gly Glu Ala

    465                 470                 475                 480

    Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly

                    485                 490                 495

    Ser Ala Leu Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp Leu Phe

                500                 505                 510

    Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu

            515                 520                 525

    Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser

        530                 535                 540

    Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu

    545                 550                 555                 560

    Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln

                    565                 570                 575

    Leu Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr

                580                 585                 590

    Glu Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe

            595                 600                 605

    Glu His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala

        610                 615                 620

    Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val

    625                 630                 635                 640

    Lys Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val

                    645                 650                 655

    Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr

                660                 665                 670

    Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro

            675                 680                 685

    Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala

        690                 695                 700

    Leu Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile

    705                 710                 715                 720

    Ala Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn

                    725                 730                 735

    Lys Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn

                740                 745                 750

    Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala

            755                 760                 765

    Lys Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala

        770                 775                 780

    Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr

    785                 790                 795                 800

    Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp

                    805                 810                 815

    Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn

                820                 825                 830

    Ile Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser

            835                 840                 845

    Met Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu

        850                 855                 860

    Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile

    865                 870                 875                 880

    Gly Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr

                    885                 890                 895

    Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu

                900                 905                 910

    Ser Thr Leu Asp

            915

     

    <210>25

    <211>2709

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>25

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac  180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg  240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt  300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg     360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt     420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct     480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac     540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa     600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg     660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat     720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt     780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa     840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac     900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa     960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc    1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt    1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc    1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct    1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac    1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa    1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atcagcgcgt    1380

    aaacgtaaga accaggcgct agcgggcggt ggcggtagcg gcggtggcgg tagcggcggt    1440

    ggcggtagcg cactagtgct gcagtgtatc aaggttaaca actgggattt attcttcagc    1500

    ccgagtgaag acaacttcac caacgacctg aacaaaggtg aagaaatcac ctcagatact    1560

    aacatcgaag cagccgaaga aaacatctcg ctggacctga tccagcagta ctacctgacc    1620

    tttaatttcg acaacgagcc ggaaaacatt tctatcgaaa acctgagctc tgatatcatc    1680

    ggccagctgg aactgatgcc gaacatcgaa cgtttcccaa acggtaaaaa gtacgagctg    1740

    gacaaatata ccatgttcca ctacctgcgc gcgcaggaat ttgaacacgg caaatcccgt    1800

    atcgcactga ctaactccgt taacgaagct ctgctcaacc cgtcccgtgt atacaccttc    1860

    ttctctagcg actacgtgaa aaaggtcaac aaagcgactg aagctgcaat gttcttgggt    1920

    tgggttgaac agcttgttta tgattttacc gacgagacgt ccgaagtatc tactaccgac    1980

    aaaattgcgg atatcactat catcatcccg tacatcggtc cggctctgaa cattggcaac    2040

    atgctgtaca aagacgactt cgttggcgca ctgatcttct ccggtgcggt gatcctgctg    2100

    gagttcatcc cggaaatcgc catcccggta ctgggcacct ttgctctggt ttcttacatt    2160

    gcaaacaagg ttctgactgt acaaaccatc gacaacgcgc tgagcaaacg taacgaaaaa    2220

    tgggatgaag tttacaaata tatcgtgacc aactggctgg ctaaggttaa tactcagatc    2280

    gacctcatcc gcaaaaaaat gaaagaagca ctggaaaacc aggcggaagc taccaaggca    2340

    atcattaact accagtacaa ccagtacacc gaggaagaaa aaaacaacat caacttcaac    2400

    atcgacgatc tgtcctctaa actgaacgaa tccatcaaca aagctatgat caacatcaac    2460

    aagttcctga accagtgctc tgtaagctat ctgatgaact ccatgatccc gtacggtgtt    2520

    aaacgtctgg aggacttcga tgcgtctctg aaagacgccc tgctgaaata catttacgac    2580

    aaccgtggca ctctgatcgg tcaggttgat cgtctgaagg acaaagtgaa caatacctta  2640

    tcgaccgaca tcccttttca gctcagtaaa tatgtcgata accaacgcct tttgtccact  2700

    ctagactag                                                          2709

     

    <210>26

    <211>902

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>26

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Arg Lys Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp

                    485                 490                 495

    Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys

                500                 505                 510

    Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn

            515                 520                 525

    Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp

        530                 535                 540

    Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile

    545                 550                 555                 560

    Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys

                    565                 570                 575

    Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln

                580                 585                 590

    Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn

            595                 600                 605

    Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp

        610                 615                 620

    Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly

    625                 630                 635                 640

    Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val

                    645                 650                 655

    Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile

                660                 665                 670

    Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val

            675                 680                 685

    Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro

        690                 695                 700

    Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile

    705                 710                 715                 720

    Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys

                    725                 730                 735

    Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp

                740                 745                 750

    Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys

            755                 760                 765

    Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr

        770                 775                 780

    Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn

    785                 790                 795                 800

    Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met

                    805                 810                 815

    Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met

                820                 825                 830

    Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala

            835                 840                 845

    Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr

        850                 855                 860

    Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu

    865                 870                 875                 880

    Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg

                    885                 890                 895

    Leu Leu Ser Thr Leu Asp

                900

     

    <210>27

    <211>2691

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>27

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac  180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg  240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt  300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg  360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt  420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct  480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac  540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa  600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg  660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat  720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt  780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa  840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac  900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa  960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc 1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt 1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc 1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct 1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac 1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa 1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atcagcggcg 1380

    ctagcgggcg gtggcggtag cggcggtggc ggtagcggcg gtggcggtag cgcactagtg 1440

    ctgcagtgta tcaaggttaa caactgggat ttattcttca gcccgagtga agacaacttc 1500

    accaacgacc tgaacaaagg tgaagaaatc acctcagata ctaacatcga agcagccgaa  1560

    gaaaacatct cgctggacct gatccagcag tactacctga cctttaattt cgacaacgag  1620

    ccggaaaaca tttctatcga aaacctgagc tctgatatca tcggccagct ggaactgatg  1680

    ccgaacatcg aacgtttccc aaacggtaaa aagtacgagc tggacaaata taccatgttc  1740

    cactacctgc gcgcgcagga atttgaacac ggcaaatccc gtatcgcact gactaactcc  1800

    gttaacgaag ctctgctcaa cccgtcccgt gtatacacct tcttctctag cgactacgtg  1860

    aaaaaggtca acaaagcgac tgaagctgca atgttcttgg gttgggttga acagcttgtt  1920

    tatgatttta ccgacgagac gtccgaagta tctactaccg acaaaattgc ggatatcact  1980

    atcatcatcc cgtacatcgg tccggctctg aacattggca acatgctgta caaagacgac  2040

    ttcgttggcg cactgatctt ctccggtgcg gtgatcctgc tggagttcat cccggaaatc  2100

    gccatcccgg tactgggcac ctttgctctg gtttcttaca ttgcaaacaa ggttctgact  2160

    gtacaaacca tcgacaacgc gctgagcaaa cgtaacgaaa aatgggatga agtttacaaa  2220

    tatatcgtga ccaactggct ggctaaggtt aatactcaga tcgacctcat ccgcaaaaaa  2280

    atgaaagaag cactggaaaa ccaggcggaa gctaccaagg caatcattaa ctaccagtac  2340

    aaccagtaca ccgaggaaga aaaaaacaac atcaacttca acatcgacga tctgtcctct  2400

    aaactgaacg aatccatcaa caaagctatg atcaacatca acaagttcct gaaccagtgc  2460

    tctgtaagct atctgatgaa ctccatgatc ccgtacggtg ttaaacgtct ggaggacttc  2520

    gatgcgtctc tgaaagacgc cctgctgaaa tacatttacg acaaccgtgg cactctgatc  2580

    ggtcaggttg atcgtctgaa ggacaaagtg aacaatacct tatcgaccga catccctttt  2640

    cagctcagta aatatgtcga taaccaacgc cttttgtcca ctctagacta g           2691

     

    <210>28

    <211>896

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>28

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Ala Leu Ala Gly Gly

        450                 455                 460

    Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Leu Val

    465                 470                 475                 480

    Leu Gln Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser

                    485                 490                 495

    Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser

                500                 505                 510

    Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile

            515                 520                 525

    Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile

        530                 535                 540

    Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met

    545                 550                 555                 560

    Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys

                    565                 570                 575

    Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys

                580                 585                 590

    Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro

            595                 600                 605

    Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn

        610                 615                 620

    Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val

    625                 630                 635                 640

    Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile

                    645                 650                 655

    Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile

                660                 665                 670

    Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser

            675                 680                 685

    Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val

        690                 695                 700

    Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr

    705                 710                 715                 720

    Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp

                    725                 730                 735

    Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr

                740                 745                 750

    Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln

            755                 760                 765

    Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr

        770                 775                 780

    Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser

    785                 790                 795                 800

    Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe

                    805                 810                 815

    Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr

                820                 825                 830

    Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu

            835                 840                 845

    Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp

        850                 855                 860

    Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe

    865                 870                 875                 880

    Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Leu Asp

                    885                 890                 895

     

    <210>29

    <211>2691

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>29

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac  180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg  240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt  300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg  360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt  420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct  480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac  540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa  600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg   660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat   720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt   780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa   840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac   900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa   960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc  1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt  1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc  1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct  1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac  1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa  1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atatgcggcg  1380

    ctagcgggcg gtggcggtag cggcggtggc ggtagcggcg gtggcggtag cgcactagtg  1440

    ctgcagtgta tcaaggttaa caactgggat ttattcttca gcccgagtga agacaacttc  1500

    accaacgacc tgaacaaagg tgaagaaatc acctcagata ctaacatcga agcagccgaa  1560

    gaaaacatct cgctggacct gatccagcag tactacctga cctttaattt cgacaacgag  1620

    ccggaaaaca tttctatcga aaacctgagc tctgatatca tcggccagct ggaactgatg  1680

    ccgaacatcg aacgtttccc aaacggtaaa aagtacgagc tggacaaata taccatgttc  1740

    cactacctgc gcgcgcagga atttgaacac ggcaaatccc gtatcgcact gactaactcc  1800

    gttaacgaag ctctgctcaa cccgtcccgt gtatacacct tcttctctag cgactacgtg  1860

    aaaaaggtca acaaagcgac tgaagctgca atgttcttgg gttgggttga acagcttgtt  1920

    tatgatttta ccgacgagac gtccgaagta tctactaccg acaaaattgc ggatatcact  1980

    atcatcatcc cgtacatcgg tccggctctg aacattggca acatgctgta caaagacgac  2040

    ttcgttggcg cactgatctt ctccggtgcg gtgatcctgc tggagttcat cccggaaatc  2100

    gccatcccgg tactgggcac ctttgctctg gtttcttaca ttgcaaacaa ggttctgact  2160

    gtacaaacca tcgacaacgc gctgagcaaa cgtaacgaaa aatgggatga agtttacaaa  2220

    tatatcgtga ccaactggct ggctaaggtt aatactcaga tcgacctcat ccgcaaaaaa  2280

    atgaaagaag cactggaaaa ccaggcggaa gctaccaagg caatcattaa ctaccagtac  2340

    aaccagtaca ccgaggaaga aaaaaacaac atcaacttca acatcgacga tctgtcctct  2400

    aaactgaacg aatccatcaa caaagctatg atcaacatca acaagttcct gaaccagtgc  2460

    tctgtaagct atctgatgaa ctccatgatc ccgtacggtg ttaaacgtct ggaggacttc  2520

    gatgcgtctc tgaaagacgc cctgctgaaa tacatttacg acaaccgtgg cactctgatc  2580

    ggtcaggttg atcgtctgaa ggacaaagtg aacaatacct tatcgaccga catccctttt  2640

    cagctcagta aatatgtcga taaccaacgc cttttgtcca ctctagacta g           2691

     

    <210>30

    <211>896

    <212>PRT

    <213>人工序列

    <220>

    <223>合成的

     

    <400>30

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Tyr Ala Ala Leu Ala Gly Gly

        450                 455                 460

    Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Leu Val

    465                 470                 475                 480

    Leu Gln Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser

                    485                 490                 495

    Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser

                500                 505                 510

    Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile

            515                 520                 525

    Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile

        530                 535                 540

    Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met

    545                 550                 555                 560

    Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys

                    565                 570                 575

    Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys

                580                 585                 590

    Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro

            595                 600                 605

    Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn

        610                 615                 620

    Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val

    625                 630                 635                 640

    Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile

                    645                 650                 655

    Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile

                660                 665                 670

    Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser

            675                 680                 685

    Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val

        690                 695                 700

    Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr

    705                 710                 715                 720

    Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp

                    725                 730                 735

    Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr

                740                 745                 750

    Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln

            755                 760                 765

    Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr

        770                 775                 780

    Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser

    785                 790                 795                 800

    Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe

                    805                 810                 815

    Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr

                820                 825                 830

    Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu

            835                 840                 845

    Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp

        850                 855                 860

    Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe

    865                 870                 875                 880

    Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Leu Asp

                    885                 890                 895

    <210>31

    <211>2691

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>31

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac    60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc   120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac   180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg   240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt   300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg   360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt   420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct   480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac   540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa   600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg   660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat   720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt   780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa   840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac   900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa   960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc  1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt  1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc  1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct  1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac  1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa  1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atcatatgcg  1380

    ctagcgggcg gtggcggtag cggcggtggc ggtagcggcg gtggcggtag cgcactagtg  1440

    ctgcagtgta tcaaggttaa caactgggat ttattcttca gcccgagtga agacaacttc  1500

    accaacgacc tgaacaaagg tgaagaaatc acctcagata ctaacatcga agcagccgaa  1560

    gaaaacatct cgctggacct gatccagcag tactacctga cctttaattt cgacaacgag  1620

    ccggaaaaca tttctatcga aaacctgagc tctgatatca tcggccagct ggaactgatg  1680

    ccgaacatcg aacgtttccc aaacggtaaa aagtacgagc tggacaaata taccatgttc  1740

    cactacctgc gcgcgcagga atttgaacac ggcaaatccc gtatcgcact gactaactcc  1800

    gttaacgaag ctctgctcaa cccgtcccgt gtatacacct tcttctctag cgactacgtg  1860

    aaaaaggtca acaaagcgac tgaagctgca atgttcttgg gttgggttga acagcttgtt  1920

    tatgatttta ccgacgagac gtccgaagta tctactaccg acaaaattgc ggatatcact  1980

    atcatcatcc cgtacatcgg tccggctctg aacattggca acatgctgta caaagacgac  2040

    ttcgttggcg cactgatctt ctccggtgcg gtgatcctgc tggagttcat cccggaaatc  2100

    gccatcccgg tactgggcac ctttgctctg gtttcttaca ttgcaaacaa ggttctgact  2160

    gtacaaacca tcgacaacgc gctgagcaaa cgtaacgaaa aatgggatga agtttacaaa  2220

    tatatcgtga ccaactggct ggctaaggtt aatactcaga tcgacctcat ccgcaaaaaa  2280

    atgaaagaag cactggaaaa ccaggcggaa gctaccaagg caatcattaa ctaccagtac  2340

    aaccagtaca ccgaggaaga aaaaaacaac atcaacttca acatcgacga tctgtcctct  2400

    aaactgaacg aatccatcaa caaagctatg atcaacatca acaagttcct gaaccagtgc  2460

    tctgtaagct atctgatgaa ctccatgatc ccgtacggtg ttaaacgtct ggaggacttc  2520

    gatgcgtctc tgaaagacgc cctgctgaaa tacatttacg acaaccgtgg cactctgatc  2580

    ggtcaggttg atcgtctgaa ggacaaagtg aacaatacct tatcgaccga catccctttt  2640

    cagctcagta aatatgtcga taaccaacgc cttttgtcca ctctagacta g           2691

     

    <210>32

    <211>896

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>32

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Tyr Ala Leu Ala Gly Gly

        450                 455                 460

    Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Leu Val

    465                 470                 475                 480

    Leu Gln Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser

                    485                 490                 495

    Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser

                500                 505                 510

    Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile

            515                 520                 525

    Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile

        530                 535                 540

    Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met

    545                 550                 555                 560

    Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys

                    565                 570                 575

    Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys

                580                 585                 590

    Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro

            595                 600                 605

    Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn

        610                 615                 620

    Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val

    625                 630                 635                 640

    Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile

                    645                 650                 655

    Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile

                660                 665                 670

    Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser

            675                 680                 685

    Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val

        690                 695                 700

    Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr

    705                 710                 715                 720

    Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp

                    725                 730                 735

    Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr

                740                 745                 750

    Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln

            755                 760                 765

    Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr

        770                 775                 780

    Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser

    785                 790                 795                 800

    Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe

                    805                 810                 815

    Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr

                820                 825                 830

    Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu

            835                 840                 845

    Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp

        850                 855                 860

    Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe

    865                 870                 875                 880

    Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Leu Asp

                    885                 890                 895

     

    <210>33

    <211>2709

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>33

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac  180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg  240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt  300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg  360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt  420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct  480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac  540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa  600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg  660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat  720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt  780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa  840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac  900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa  960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc 1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt 1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc  1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct  1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac  1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa  1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atcagcgcgt  1380

    aaatatgcta accaggcgct agcgggcggt ggcggtagcg gcggtggcgg tagcggcggt  1440

    ggcggtagcg cactagtgct gcagtgtatc aaggttaaca actgggattt attcttcagc  1500

    ccgagtgaag acaacttcac caacgacctg aacaaaggtg aagaaatcac ctcagatact  1560

    aacatcgaag cagccgaaga aaacatctcg ctggacctga tccagcagta ctacctgacc  1620

    tttaatttcg acaacgagcc ggaaaacatt tctatcgaaa acctgagctc tgatatcatc  1680

    ggccagctgg aactgatgcc gaacatcgaa cgtttcccaa acggtaaaaa gtacgagctg  1740

    gacaaatata ccatgttcca ctacctgcgc gcgcaggaat ttgaacacgg caaatcccgt  1800

    atcgcactga ctaactccgt taacgaagct ctgctcaacc cgtcccgtgt atacaccttc  1860

    ttctctagcg actacgtgaa aaaggtcaac aaagcgactg aagctgcaat gttcttgggt  1920

    tgggttgaac agcttgttta tgattttacc gacgagacgt ccgaagtatc tactaccgac  1980

    aaaattgcgg atatcactat catcatcccg tacatcggtc cggctctgaa cattggcaac  2040

    atgctgtaca aagacgactt cgttggcgca ctgatcttct ccggtgcggt gatcctgctg  2100

    gagttcatcc cggaaatcgc catcccggta ctgggcacct ttgctctggt ttcttacatt  2160

    gcaaacaagg ttctgactgt acaaaccatc gacaacgcgc tgagcaaacg taacgaaaaa  2220

    tgggatgaag tttacaaata tatcgtgacc aactggctgg ctaaggttaa tactcagatc  2280

    gacctcatcc gcaaaaaaat gaaagaagca ctggaaaacc aggcggaagc taccaaggca  2340

    atcattaact accagtacaa ccagtacacc gaggaagaaa aaaacaacat caacttcaac  2400

    atcgacgatc tgtcctctaa actgaacgaa tccatcaaca aagctatgat caacatcaac  2460

    aagttcctga accagtgctc tgtaagctat ctgatgaact ccatgatccc gtacggtgtt  2520

    aaacgtctgg aggacttcga tgcgtctctg aaagacgccc tgctgaaata catttacgac  2580

    aaccgtggca ctctgatcgg tcaggttgat cgtctgaagg acaaagtgaa caatacctta  2640

    tcgaccgaca tcccttttca gctcagtaaa tatgtcgata accaacgcct tttgtccact  2700

    ctagactag                                                          2709

     

    <210>34

    <211>902

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>34

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Tyr Ala Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp

                    485                 490                 495

    Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys

                500                 505                 510

    Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn

            515                 520                 525

    Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp

        530                 535                 540

    Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile

    545                 550                 555                 560

    Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys

                    565                 570                 575

    Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln

                580                 585                 590

    Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn

            595                 600                 605

    Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp

        610                 615                 620

    Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly

    625                 630                 635                 640

    Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val

                    645                 650                 655

    Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile

                660                 665                 670

    Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val

            675                 680                 685

    Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro

        690                 695                 700

    Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile

    705                 710                 715                 720

    Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys

                    725                 730                 735

    Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp

                740                 745                 750

    Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys

            755                 760                 765

    Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr

        770                 775                 780

    Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn

    785                 790                 795                 800

    Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met

                    805                 810                 815

    Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met

                820                 825                 830

    Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala

            835                 840                 845

    Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr

        850                 855                 860

    Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu

    865                 870                 875                 880

    Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg

                    885                 890                 895

    Leu Leu Ser Thr Leu Asp

                900

     

    <210>35

    <211>2697

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

    <400>35

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac      60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc     120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac     180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg     240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt     300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg     360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt     420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct     480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac     540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa     600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg     660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat     720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt     780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa     840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac     900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa     960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc    1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt    1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc    1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct    1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac    1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa    1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atcagcgcgt    1380

    aaagcgctag cgggcggtgg cggtagcggc ggtggcggta gcggcggtgg cggtagcgca    1440

    ctagtgctgc agtgtatcaa ggttaacaac tgggatttat tcttcagccc gagtgaagac    1500

    aacttcacca acgacctgaa caaaggtgaa gaaatcacct cagatactaa catcgaagca    1560

    gccgaagaaa acatctcgct ggacctgatc cagcagtact acctgacctt taatttcgac    1620

    aacgagccgg aaaacatttc tatcgaaaac ctgagctctg atatcatcgg ccagctggaa    1680

    ctgatgccga acatcgaacg tttcccaaac ggtaaaaagt acgagctgga caaatatacc    1740

    atgttccact acctgcgcgc gcaggaattt gaacacggca aatcccgtat cgcactgact    1800

    aactccgtta acgaagctct gctcaacccg tcccgtgtat acaccttctt ctctagcgac    1860

    tacgtgaaaa aggtcaacaa agcgactgaa gctgcaatgt tcttgggttg ggttgaacag    1920

    cttgtttatg attttaccga cgagacgtcc gaagtatcta ctaccgacaa aattgcggat    1980

    atcactatca tcatcccgta catcggtccg gctctgaaca ttggcaacat gctgtacaaa    2040

    gacgacttcg ttggcgcact gatcttctcc ggtgcggtga tcctgctgga gttcatcccg    2100

    gaaatcgcca tcccggtact gggcaccttt gctctggttt cttacattgc aaacaaggtt    2160

    ctgactgtac aaaccatcga caacgcgctg agcaaacgta acgaaaaatg ggatgaagtt    2220

    tacaaatata tcgtgaccaa ctggctggct aaggttaata ctcagatcga cctcatccgc    2280

    aaaaaaatga aagaagcact ggaaaaccag gcggaagcta ccaaggcaat cattaactac  2340

    cagtacaacc agtacaccga ggaagaaaaa aacaacatca acttcaacat cgacgatctg  2400

    tcctctaaac tgaacgaatc catcaacaaa gctatgatca acatcaacaa gttcctgaac  2460

    cagtgctctg taagctatct gatgaactcc atgatcccgt acggtgttaa acgtctggag  2520

    gacttcgatg cgtctctgaa agacgccctg ctgaaataca tttacgacaa ccgtggcact  2580

    ctgatcggtc aggttgatcg tctgaaggac aaagtgaaca ataccttatc gaccgacatc  2640

    ccttttcagc tcagtaaata tgtcgataac caacgccttt tgtccactct agactag     2697

     

    <210>36

    <211>898

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>36

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Ala Leu Ala

        450                 455                 460

    Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala

    465                 470                 475                 480

    Leu Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser

                    485                 490                 495

    Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile

                500                 505                 510

    Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp

            515                 520                 525

    Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu

        530                 535                 540

    Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu

    545                 550                 555                 560

    Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu

                    565                 570                 575

    Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His

                580                 585                 590

    Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu

            595                 600                 605

    Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys

        610                 615                 620

    Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln

    625                 630                 635                 640

    Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp

                    645                 650                 655

    Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu

                660                 665                 670

    Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile

            675                 680                 685

    Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile

        690                 695                 700

    Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val

    705                 710                 715                 720

    Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys

                    725                 730                 735

    Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val

                740                 745                 750

    Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu

            755                 760                 765

    Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln

        770                 775                 780

    Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu

    785                 790                 795                 800

    Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn

                    805                 810                 815

    Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile

                820                 825                 830

    Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp

            835                 840                 845

    Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln

        850                 855                 860

    Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile

    865                 870                 875                 880

    Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr

                    885                 890                 895

    Leu Asp

     

    <210>37

    <211>51

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>37

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaat tagctaacca g              51

     

    <210>38

    <211>17

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>38

     

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Leu Ala Asn

    1               5                   10                  15

    Gln

     

    <210>39

    <211>33

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>39

    tttggcggtt tcacgggcgc acgcaaatca gcg                                  33

     

    <210>40

    <211>11

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

    <400>40

     

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala

    1               5                   10

     

    <210>41

    <211>33

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>41

    tttggcggtt tcacgggcgc acgcaaatat gcg                                 33

     

    <210>42

    <211>11

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>42

     

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Tyr Ala

    1               5                   10

     

    <210>43

    <211>33

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>43

    tttggcggtt tcacgggcgc acgcaaatca tat                                 33

     

    <210>44

    <211>11

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>44

     

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Tyr

    1               5                   10

     

    <210>45

    <211>51

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>45

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaat atgctaacca g             51

     

    <210>46

    <211>17

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>46

     

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Tyr Ala Asn

    1               5                   10                  15

    Gln

     

    <210>47

    <211>39

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>47

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaa                           39

     

    <210>48

    <211>13

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>48

     

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys

    1               5                   10

     

    <210>49

    <211>51

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>49

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaac gcaaaaacca g             51

     

    <210>50

    <211>17

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>50

     

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Arg Lys Asn

    1               5                   10                  15

    Gln

     

    <210>51

    <211>2736

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

    <400>51

    ctcgggattg agggtcgttt tggcggtttc acgggcgcac gcaaatcagc gcgtaaatta      60

    gctaaccaga ctagtggcgg tgggggtagt ggcggtggcg gttcgggcgg gggtgggagc     120

    cctaggggat ccatggagtt cgttaacaaa cagttcaact ataaagaccc agttaacggt     180

    gttgacattg cttacatcaa aatcccgaac gctggccaga tgcagccggt aaaggcattc     240

    aaaatccaca acaaaatctg ggttatcccg gaacgtgata cctttactaa cccggaagaa     300

    ggtgacctga acccgccacc ggaagcgaaa caggtgccgg tatcttacta tgactccacc     360

    tacctgtcta ccgataacga aaaggacaac tacctgaaag gtgttactaa actgttcgag     420

    cgtatttact ccaccgacct gggccgtatg ctgctgacta gcatcgttcg cggtatcccg     480

    ttctggggcg gttctaccat cgataccgaa ctgaaagtaa tcgacactaa ctgcatcaac     540

    gttattcagc cggacggttc ctatcgttcc gaagaactga acctggtgat catcggcccg     600

    tctgctgata tcatccagtt cgagtgtaag agctttggtc acgaagttct gaacctcacc     660

    cgtaacggct acggttccac tcagtacatc cgtttctctc cggacttcac cttcggtttt     720

    gaagaatccc tggaagtaga cacgaaccca ctgctgggcg ctggtaaatt cgcaactgat     780

    cctgcggtta ccctggctca cgaactgatt catgcaggcc accgcctgta cggtatcgcc     840

    atcaatccga accgtgtctt caaagttaac accaacgcgt attacgagat gtccggtctg     900

    gaagttagct tcgaagaact gcgtactttt ggcggtcacg acgctaaatt catcgactct     960

    ctgcaagaaa acgagttccg tctgtactac tataacaagt tcaaagatat cgcatccacc    1020

    ctgaacaaag cgaaatccat cgtgggtacc actgcttctc tccagtacat gaagaacgtt    1080

    tttaaagaaa aatacctgct cagcgaagac acctccggca aattctctgt agacaagttg    1140

    aaattcgata aactttacaa aatgctgact gaaatttaca ccgaagacaa cttcgttaag    1200

    ttctttaaag ttctgaaccg caaaacctat ctgaacttcg acaaggcagt attcaaaatc    1260

    aacatcgtgc cgaaagttaa ctacactatc tacgatggtt tcaacctgcg taacaccaac    1320

    ctggctgcta attttaacgg ccagaacacg gaaatcaaca acatgaactt cacaaaactg    1380

    aaaaacttca ctggtctgtt cgagttttac aagctgctgt gcgtcgacgg catcattacc    1440

    tccaaaacta aatctctgat agaaggtaga aacaaagcgc tgaacctgca gtgtatcaag    1500

    gttaacaact gggatttatt cttcagcccg agtgaagaca acttcaccaa cgacctgaac    1560

    aaaggtgaag aaatcacctc agatactaac atcgaagcag ccgaagaaaa catctcgctg    1620

    gacctgatcc agcagtacta cctgaccttt aatttcgaca acgagccgga aaacatttct    1680

    atcgaaaacc tgagctctga tatcatcggc cagctggaac tgatgccgaa catcgaacgt    1740

    ttcccaaacg gtaaaaagta cgagctggac aaatatacca tgttccacta cctgcgcgcg    1800

    caggaatttg aacacggcaa atcccgtatc gcactgacta actccgttaa cgaagctctg    1860

    ctcaacccgt cccgtgtata caccttcttc tctagcgact acgtgaaaaa ggtcaacaaa    1920

    gcgactgaag ctgcaatgtt cttgggttgg gttgaacagc ttgtttatga ttttaccgac    1980

    gagacgtccg aagtatctac taccgacaaa attgcggata tcactatcat catcccgtac    2040

    atcggtccgg ctctgaacat tggcaacatg ctgtacaaag acgacttcgt tggcgcactg    2100

    atcttctccg gtgcggtgat cctgctggag ttcatcccgg aaatcgccat cccggtactg    2160

    ggcacctttg ctctggtttc ttacattgca aacaaggttc tgactgtaca aaccatcgac    2220

    aacgcgctga gcaaacgtaa cgaaaaatgg gatgaagttt acaaatatat cgtgaccaac    2280

    tggctggcta aggttaatac tcagatcgac ctcatccgca aaaaaatgaa agaagcactg  2340

    gaaaaccagg cggaagctac caaggcaatc attaactacc agtacaacca gtacaccgag  2400

    gaagaaaaaa acaacatcaa cttcaacatc gacgatctgt cctctaaact gaacgaatcc  2460

    atcaacaaag ctatgatcaa catcaacaag ttcctgaacc agtgctctgt aagctatctg  2520

    atgaactcca tgatcccgta cggtgttaaa cgtctggagg acttcgatgc gtctctgaaa  2580

    gacgccctgc tgaaatacat ttacgacaac cgtggcactc tgatcggtca ggttgatcgt  2640

    ctgaaggaca aagtgaacaa taccttatcg accgacatcc cttttcagct cagtaaatat  2700

    gtcgataacc aacgcctttt gtccactcta gactag                            2736

     

    <210>52

    <211>911

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>52

     

    Leu Gly Ile Glu Gly Arg Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser

    1               5                   10                  15

    Ala Arg Lys Leu Ala Asn Gln Thr Ser Gly Gly Gly Gly Ser Gly Gly

                20                  25                  30

    Gly Gly Ser Gly Gly Gly Gly Ser Pro Arg Gly Ser Met Glu Phe Val

            35                  40                  45

    Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly Val Asp Ile Ala

        50                  55                  60

    Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met Gln Pro Val Lys Ala Phe

    65                  70                  75                  80

    Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg Asp Thr Phe Thr

                    85                  90                  95

    Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu Ala Lys Gln Val

                100                 105                 110

    Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr Asp Asn Glu Lys

            115                 120                 125

    Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu Arg Ile Tyr Ser

        130                 135                 140

    Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val Arg Gly Ile Pro

    145                 150                 155                 160

    Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys Val Ile Asp Thr

                    165                 170                 175

    Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr Arg Ser Glu Glu

                180                 185                 190

    Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile Ile Gln Phe Glu

            195                 200                 205

    Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr Arg Asn Gly Tyr

        210                 215                 220

    Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe Thr Phe Gly Phe

    225                 230                 235                 240

    Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu Gly Ala Gly Lys

                    245                 250                 255

    Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu Leu Ile His Ala

                260                 265                 270

    Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn Arg Val Phe Lys

            275                 280                 285

    Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu Glu Val Ser Phe

        290                 295                 300

    Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys Phe Ile Asp Ser

    305                 310                 315                 320

    Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn Lys Phe Lys Asp

                    325                 330                 335

    Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val Gly Thr Thr Ala

                340                 345                 350

    Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys Tyr Leu Leu Ser

            355                 360                 365

    Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu Lys Phe Asp Lys

        370                 375                 380

    Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp Asn Phe Val Lys

    385                 390                 395                 400

    Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn Phe Asp Lys Ala

                    405                 410                 415

    Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr Thr Ile Tyr Asp

                420                 425                 430

    Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn Phe Asn Gly Gln

            435                 440                 445

    Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu Lys Asn Phe Thr

        450                 455                 460

    Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Asp Gly Ile Ile Thr

    465                 470                 475                 480

    Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn Lys Ala Leu Asn Leu

                    485                 490                 495

    Gln Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu

                500                 505                 510

    Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp

            515                 520                 525

    Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln

        530                 535                 540

    Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser

    545                 550                 555                 560

    Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro

                    565                 570                 575

    Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr

                580                 585                 590

    Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser

            595                 600                 605

    Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser

        610                 615                 620

    Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys

    625                 630                 635                 640

    Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr

                    645                 650                 655

    Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala

                660                 665                 670

    Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly

            675                 680                 685

    Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly

        690                 695                 700

    Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu

    705                 710                 715                 720

    Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val

                    725                 730                 735

    Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu

                740                 745                 750

    Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln

            755                 760                 765

    Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala

        770                 775                 780

    Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu

    785                 790                 795                 800

    Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys

                    805                 810                 815

    Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu

                820                 825                 830

    Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly

            835                 840                 845

    Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu

        850                 855                 860

    Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg

    865                 870                 875                 880

    Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln

                    885                 890                 895

    Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Leu Asp

                900                 905                 910

     

    <210>53

    <211>177

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>53

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat agaaggtaga    60

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaat tagctaacca ggcgctagcg   120

    ggtggtggtg gttctgcact agtgctgcag acgcacggtc tagaatgata aaagctt      177

     

    <210>54

    <211>192

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>54

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat agaaggtaga    60

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaat tagctaacca ggcgctagcg   120

    ggtggtggtg gttctggtgg tggtggttct gcactagtgc tgcagacgca cggtctagaa   180

    tgataaaagc tt                                                       192

     

    <210>55

    <211>222

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>55

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat agaaggtaga    60

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaat tagctaacca ggcgctagcg   120

    ggtggtggtg gttctggtgg tggtggttct ggtggtggtg gttctggtgg tggtggttct   180

    gcactagtgc tgcagacgca cggtctagaa tgataaaagc tt                      222

     

    <210>56

    <211>237

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>56

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat agaaggtaga    60

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaat tagctaacca ggcgctagcg   120

    ggtggtggtg gttctggtgg tggtggttct ggtggtggtg gttctggtgg tggtggttct   180

    ggtggtggtg gttctgcact agtgctgcag acgcacggtc tagaatgata aaagctt      237

     

    <210>57

    <211>228

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>57

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat agaaggtaga    60

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaat tagctaacca ggcgctagcg   120

    gctgaagctg ctgctaaaga agctgctgct aaagaagctg ctgctaaagc tggtggcggt   180

    ggttccgcac tagtgctgca gacgcacggt ctagaatgat aaaagctt                228

     

    <210>58

    <211>2694

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>58

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac    60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc   120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac   180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg   240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt   300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg   360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt   420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct   480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac   540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa   600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg   660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat   720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt   780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa   840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac   900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa   960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc  1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt  1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc  1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct  1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac  1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa  1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atcagcgcgt  1380

    aaattagcta accaggcgct agcgggtggt ggtggttctg gtggtggtgg ttctgcacta  1440

    gtgctgcagt gtatcaaggt taacaactgg gatttattct tcagcccgag tgaagacaac  1500

    ttcaccaacg acctgaacaa aggtgaagaa atcacctcag atactaacat cgaagcagcc  1560

    gaagaaaaca tctcgctgga cctgatccag cagtactacc tgacctttaa tttcgacaac  1620

    gagccggaaa acatttctat cgaaaacctg agctctgata tcatcggcca gctggaactg  1680

    atgccgaaca tcgaacgttt cccaaacggt aaaaagtacg agctggacaa atataccatg  1740

    ttccactacc tgcgcgcgca ggaatttgaa cacggcaaat cccgtatcgc actgactaac  1800

    tccgttaacg aagctctgct caacccgtcc cgtgtataca ccttcttctc tagcgactac  1860

    gtgaaaaagg tcaacaaagc gactgaagct gcaatgttct tgggttgggt tgaacagctt  1920

    gtttatgatt ttaccgacga gacgtccgaa gtatctacta ccgacaaaat tgcggatatc  1980

    actatcatca tcccgtacat cggtccggct ctgaacattg gcaacatgct gtacaaagac  2040

    gacttcgttg gcgcactgat cttctccggt gcggtgatcc tgctggagtt catcccggaa  2100

    atcgccatcc cggtactggg cacctttgct ctggtttctt acattgcaaa caaggttctg  2160

    actgtacaaa ccatcgacaa cgcgctgagc aaacgtaacg aaaaatggga tgaagtttac  2220

    aaatatatcg tgaccaactg gctggctaag gttaatactc agatcgacct catccgcaaa  2280

    aaaatgaaag aagcactgga aaaccaggcg gaagctacca aggcaatcat taactaccag  2340

    tacaaccagt acaccgagga agaaaaaaac aacatcaact tcaacatcga cgatctgtcc  2400

    tctaaactga acgaatccat caacaaagct atgatcaaca tcaacaagtt cctgaaccag  2460

    tgctctgtaa gctatctgat gaactccatg atcccgtacg gtgttaaacg tctggaggac  2520

    ttcgatgcgt ctctgaaaga cgccctgctg aaatacattt acgacaaccg tggcactctg  2580

    atcggtcagg ttgatcgtct gaaggacaaa gtgaacaata ccttatcgac cgacatccct  2640

    tttcagctca gtaaatatgt cgataaccaa cgccttttgt ccactctaga ctag        2694

     

    <210>59

    <211>897

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>59

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Leu Ala Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Leu

    465                 470                 475                 480

    Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro

                    485                 490                 495

    Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr

                500                 505                 510

    Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu

            515                 520                 525

    Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn

        530                 535                 540

    Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu

    545                 550                 555                 560

    Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp

                    565                 570                 575

    Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly

                580                 585                 590

    Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn

            595                 600                 605

    Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val

        610                 615                 620

    Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu

    625                 630                 635                 640

    Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys

                    645                 650                 655

    Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn

                660                 665                 670

    Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe

            675                 680                 685

    Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro

        690                 695                 700

    Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu

    705                 710                 715                 720

    Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp

                    725                 730                 735

    Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn

                740                 745                 750

    Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn

            755                 760                 765

    Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr

        770                 775                 780

    Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser

    785                 790                 795                 800

    Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys

                    805                 810                 815

    Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro

                820                 825                 830

    Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala

            835                 840                 845

    Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val

        850                 855                 860

    Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro

    865                 870                 875                 880

    Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Leu

                    885                 890                 895

    Asp

     

    <210>60

    <211>2724

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>60

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac     60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc    120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac    180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg    240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt    300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg    360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt    420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct    480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac    540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa    600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg    660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat    720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt    780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa    840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac    900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa    960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc   1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt   1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc   1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct   1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac   1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa   1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atcagcgcgt   1380

    aaattagcta accaggcgct agcgggtggt ggtggttctg gtggtggtgg ttctggtggt   1440

    ggtggttctg gtggtggtgg ttctgcacta gtgctgcagt gtatcaaggt taacaactgg   1500

    gatttattct tcagcccgag tgaagacaac ttcaccaacg acctgaacaa aggtgaagaa   1560

    atcacctcag atactaacat cgaagcagcc gaagaaaaca tctcgctgga cctgatccag   1620

    cagtactacc tgacctttaa tttcgacaac gagccggaaa acatttctat cgaaaacctg   1680

    agctctgata tcatcggcca gctggaactg atgccgaaca tcgaacgttt cccaaacggt   1740

    aaaaagtacg agctggacaa atataccatg ttccactacc tgcgcgcgca ggaatttgaa   1800

    cacggcaaat cccgtatcgc actgactaac tccgttaacg aagctctgct caacccgtcc   1860

    cgtgtataca ccttcttctc tagcgactac gtgaaaaagg tcaacaaagc gactgaagct   1920

    gcaatgttct tgggttgggt tgaacagctt gtttatgatt ttaccgacga gacgtccgaa   1980

    gtatctacta ccgacaaaat tgcggatatc actatcatca tcccgtacat cggtccggct   2040

    ctgaacattg gcaacatgct gtacaaagac gacttcgttg gcgcactgat cttctccggt   2100

    gcggtgatcc tgctggagtt catcccggaa atcgccatcc cggtactggg cacctttgct  2160

    ctggtttctt acattgcaaa caaggttctg actgtacaaa ccatcgacaa cgcgctgagc  2220

    aaacgtaacg aaaaatggga tgaagtttac aaatatatcg tgaccaactg gctggctaag  2280

    gttaatactc agatcgacct catccgcaaa aaaatgaaag aagcactgga aaaccaggcg  2340

    gaagctacca aggcaatcat taactaccag tacaaccagt acaccgagga agaaaaaaac  2400

    aacatcaact tcaacatcga cgatctgtcc tctaaactga acgaatccat caacaaagct  2460

    atgatcaaca tcaacaagtt cctgaaccag tgctctgtaa gctatctgat gaactccatg  2520

    atcccgtacg gtgttaaacg tctggaggac ttcgatgcgt ctctgaaaga cgccctgctg  2580

    aaatacattt acgacaaccg tggcactctg atcggtcagg ttgatcgtct gaaggacaaa  2640

    gtgaacaata ccttatcgac cgacatccct tttcagctca gtaaatatgt cgataaccaa  2700

    cgccttttgt ccactctaga ctag                                         2724

     

    <210>61

    <211>907

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>61

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Leu Ala Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Gly Gly Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys

                    485                 490                 495

    Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr

                500                 505                 510

    Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu

            515                 520                 525

    Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu

        530                 535                 540

    Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu

    545                 550                 555                 560

    Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg

                    565                 570                 575

    Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His

                580                 585                 590

    Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu

            595                 600                 605

    Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr

        610                 615                 620

    Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala

    625                 630                 635                 640

    Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp

                    645                 650                 655

    Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile

                660                 665                 670

    Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr

            675                 680                 685

    Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu

        690                 695                 700

    Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala

    705                 710                 715                 720

    Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp

                    725                 730                 735

    Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr

                740                 745                 750

    Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile

            755                 760                 765

    Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys

        770                 775                 780

    Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn

    785                 790                 795                 800

    Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser

                    805                 810                 815

    Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser

                820                 825                 830

    Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu

            835                 840                 845

    Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr

        850                 855                 860

    Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys

    865                 870                 875                 880

    Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr

                    885                 890                 895

    Val Asp Asn Gln Arg Leu Leu Ser Thr Leu Asp

                900                 905

     

    <210>62

    <211>207

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>62

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctgacga tgacgataaa    60

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaac gtaagaacca ggcgctagcg   120

    ggcggtggcg gtagcggcgg tggcggtagc ggcggtggcg gtagcgcact agtgctgcag   180

    acgcacggtc tagaatgata aaagctt                                       207

     

    <210>63

    <211>2709

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>63

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac    60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc   120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac   180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg   240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt   300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg   360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt   420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct   480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac     540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa     600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg     660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat     720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt     780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa     840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac     900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa     960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc    1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt    1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc    1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct    1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac    1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa    1320

    actaaatctg acgatgacga taaatttggc ggtttcacgg gcgcacgcaa atcagcgcgt    1380

    aaacgtaaga accaggcgct agcgggcggt ggcggtagcg gcggtggcgg tagcggcggt    1440

    ggcggtagcg cactagtgct gcagtgtatc aaggttaaca actgggattt attcttcagc    1500

    ccgagtgaag acaacttcac caacgacctg aacaaaggtg aagaaatcac ctcagatact    1560

    aacatcgaag cagccgaaga aaacatctcg ctggacctga tccagcagta ctacctgacc    1620

    tttaatttcg acaacgagcc ggaaaacatt tctatcgaaa acctgagctc tgatatcatc    1680

    ggccagctgg aactgatgcc gaacatcgaa cgtttcccaa acggtaaaaa gtacgagctg    1740

    gacaaatata ccatgttcca ctacctgcgc gcgcaggaat ttgaacacgg caaatcccgt    1800

    atcgcactga ctaactccgt taacgaagct ctgctcaacc cgtcccgtgt atacaccttc    1860

    ttctctagcg actacgtgaa aaaggtcaac aaagcgactg aagctgcaat gttcttgggt    1920

    tgggttgaac agcttgttta tgattttacc gacgagacgt ccgaagtatc tactaccgac    1980

    aaaattgcgg atatcactat catcatcccg tacatcggtc cggctctgaa cattggcaac    2040

    atgctgtaca aagacgactt cgttggcgca ctgatcttct ccggtgcggt gatcctgctg    2100

    gagttcatcc cggaaatcgc catcccggta ctgggcacct ttgctctggt ttcttacatt    2160

    gcaaacaagg ttctgactgt acaaaccatc gacaacgcgc tgagcaaacg taacgaaaaa    2220

    tgggatgaag tttacaaata tatcgtgacc aactggctgg ctaaggttaa tactcagatc    2280

    gacctcatcc gcaaaaaaat gaaagaagca ctggaaaacc aggcggaagc taccaaggca    2340

    atcattaact accagtacaa ccagtacacc gaggaagaaa aaaacaacat caacttcaac    2400

    atcgacgatc  tgtcctctaa actgaacgaa tccatcaaca aagctatgat caacatcaac   2460

    aagttcctga accagtgctc tgtaagctat ctgatgaact ccatgatccc gtacggtgtt    2520

    aaacgtctgg aggacttcga tgcgtctctg aaagacgccc tgctgaaata catttacgac    2580

    aaccgtggca ctctgatcgg tcaggttgat cgtctgaagg acaaagtgaa caatacctta    2640

    tcgaccgaca tcccttttca gctcagtaaa tatgtcgata accaacgcct tttgtccact    2700

    ctagactag                                                            2709

    <210>64

    <211>902

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>64

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Asp Asp Asp Asp Lys

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Arg Lys Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp

                    485                 490                 495

    Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys

                500                 505                 510

    Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn

            515                 520                 525

    Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp

        530                 535                 540

    Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile

    545                 550                 555                 560

    Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys

                    565                 570                 575

    Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln

                580                 585                 590

    Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn

            595                 600                 605

    Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp

        610                 615                 620

    Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly

    625                 630                 635                 640

    Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val

                    645                 650                 655

    Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile

                660                 665                 670

    Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val

            675                 680                 685

    Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro

        690                 695                 700

    Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile

    705                 710                 715                 720

    Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys

                    725                 730                 735

    Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp

                740                 745                 750

    Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys

            755                 760                 765

    Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr

        770                 775                 780

    Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn

    785                 790                 795                 800

    Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met

                    805                 810                 815

    Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met

                820                 825                 830

    Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala

            835                 840                 845

    Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr

        850                 855                 860

    Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu

    865                 870                 875                 880

    Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg

                    885                 890                 895

    Leu Leu Ser Thr Leu Asp

                900

     

    <210>65

    <211>207

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>65

    ggatccacgc acgtcgacgg catcattacc tccaaaacta aatctctgat agaaggtaga     60

    tttggcggtt tcacgggcgc acgcaaatca gcgcgtaaac gtaagaacca ggcgctagcg    120

    ggcggtggcg gtagcggcgg tggcggtagc ggcggtggcg gtagcgcact agtgctgcag    180

    acgcacggtc tagaatgata aaagctt                                        207

     

    <210>66

    <211>2742

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>66

    ggatccgaat tcatgccgat caccatcaac aacttcaact acagcgatcc ggtggataac     60

    aaaaacatcc tgtacctgga tacccatctg aataccctgg cgaacgaacc ggaaaaagcg    120

    tttcgtatca ccggcaacat ttgggttatt ccggatcgtt ttagccgtaa cagcaacccg    180

    aatctgaata aaccgccgcg tgttaccagc ccgaaaagcg gttattacga tccgaactat    240

    ctgagcaccg atagcgataa agataccttc ctgaaagaaa tcatcaaact gttcaaacgc    300

    atcaacagcc gtgaaattgg cgaagaactg atctatcgcc tgagcaccga tattccgttt    360

    ccgggcaaca acaacacccc gatcaacacc tttgatttcg atgtggattt caacagcgtt    420

    gatgttaaaa cccgccaggg taacaattgg gtgaaaaccg gcagcattaa cccgagcgtg    480

    attattaccg gtccgcgcga aaacattatt gatccggaaa ccagcacctt taaactgacc    540

    aacaacacct ttgcggcgca ggaaggtttt ggcgcgctga gcattattag cattagcccg    600

    cgctttatgc tgacctatag caacgcgacc aacgatgttg gtgaaggccg tttcagcaaa    660

    agcgaatttt gcatggaccc gatcctgatc ctgatgcatg aactgaacca tgcgatgcat    720

    aacctgtatg gcatcgcgat tccgaacgat cagaccatta gcagcgtgac cagcaacatc    780

    ttttacagcc agtacaacgt gaaactggaa tatgcggaaa tctatgcgtt tggcggtccg    840

    accattgatc tgattccgaa aagcgcgcgc aaatacttcg aagaaaaagc gctggattac    900

    tatcgcagca ttgcgaaacg tctgaacagc attaccaccg cgaatccgag cagcttcaac    960

    aaatatatcg gcgaatataa acagaaactg atccgcaaat atcgctttgt ggtggaaagc   1020

    agcggcgaag ttaccgttaa ccgcaataaa ttcgtggaac tgtacaacga actgacccag   1080

    atcttcaccg aatttaacta tgcgaaaatc tataacgtgc agaaccgtaa aatctacctg   1140

    agcaacgtgt ataccccggt gaccgcgaat attctggatg ataacgtgta cgatatccag  1200

    aacggcttta acatcccgaa aagcaacctg aacgttctgt ttatgggcca gaacctgagc  1260

    cgtaatccgg cgctgcgtaa agtgaacccg gaaaacatgc tgtacctgtt caccaaattt  1320

    tgcgtcgacg gcatcattac ctccaaaact aaatctctga tagaaggtag atttggcggt  1380

    ttcacgggcg cacgcaaatc agcgcgtaaa cgtaagaacc aggcgctagc gggcggtggc  1440

    ggtagcggcg gtggcggtag cggcggtggc ggtagcgcac tagtgctgca gtgtcgtgaa  1500

    ctgctggtga aaaacaccga tctgccgttt attggcgata tcagcgatgt gaaaaccgat  1560

    atcttcctgc gcaaagatat caacgaagaa accgaagtga tctactaccc ggataacgtg  1620

    agcgttgatc aggtgatcct gagcaaaaac accagcgaac atggtcagct ggatctgctg  1680

    tatccgagca ttgatagcga aagcgaaatt ctgccgggcg aaaaccaggt gttttacgat  1740

    aaccgtaccc agaacgtgga ttacctgaac agctattact acctggaaag ccagaaactg  1800

    agcgataacg tggaagattt tacctttacc cgcagcattg aagaagcgct ggataacagc  1860

    gcgaaagttt acacctattt tccgaccctg gcgaacaaag ttaatgcggg tgttcagggc  1920

    ggtctgtttc tgatgtgggc gaacgatgtg gtggaagatt tcaccaccaa catcctgcgt  1980

    aaagataccc tggataaaat cagcgatgtt agcgcgatta ttccgtatat tggtccggcg  2040

    ctgaacatta gcaatagcgt gcgtcgtggc aattttaccg aagcgtttgc ggttaccggt  2100

    gtgaccattc tgctggaagc gtttccggaa tttaccattc cggcgctggg tgcgtttgtg  2160

    atctatagca aagtgcagga acgcaacgaa atcatcaaaa ccatcgataa ctgcctggaa  2220

    cagcgtatta aacgctggaa agatagctat gaatggatga tgggcacctg gctgagccgt  2280

    attatcaccc agttcaacaa catcagctac cagatgtacg atagcctgaa ctatcaggcg  2340

    ggtgcgatta aagcgaaaat cgatctggaa tacaaaaaat acagcggcag cgataaagaa  2400

    aacatcaaaa gccaggttga aaacctgaaa aacagcctgg atgtgaaaat tagcgaagcg  2460

    atgaataaca tcaacaaatt catccgcgaa tgcagcgtga cctacctgtt caaaaacatg  2520

    ctgccgaaag tgatcgatga actgaacgaa tttgatcgca acaccaaagc gaaactgatc  2580

    aacctgatcg atagccacaa cattattctg gtgggcgaag tggataaact gaaagcgaaa  2640

    gttaacaaca gcttccagaa caccatcccg tttaacatct tcagctatac caacaacagc  2700

    ctgctgaaag atatcatcaa cgaatacttc aatctagact ag                     2742

     

    <210>67

    <211>913

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>67

     

    Gly Ser Glu Phe Met Pro Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp

    1               5                   10                  15

    Pro Val Asp Asn Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr

                20                  25                  30

    Leu Ala Asn Glu Pro Glu Lys Ala Phe Arg Ile Thr Gly Asn Ile Trp

            35                  40                  45

    Val Ile Pro Asp Arg Phe Ser Arg Asn Ser Asn Pro Asn Leu Asn Lys

        50                  55                  60

    Pro Pro Arg Val Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr

    65                  70                  75                  80

    Leu Ser Thr Asp Ser Asp Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys

                    85                  90                  95

    Leu Phe Lys Arg Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr

                100                 105                 110

    Arg Leu Ser Thr Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile

            115                 120                 125

    Asn Thr Phe Asp Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr

        130                 135                 140

    Arg Gln Gly Asn Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val

    145                 150                 155                 160

    Ile Ile Thr Gly Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr

                    165                 170                 175

    Phe Lys Leu Thr Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala

                180                 185                 190

    Leu Ser Ile Ile Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn

            195                 200                 205

    Ala Thr Asn Asp Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys

        210                 215                 220

    Met Asp Pro Ile Leu Ile Leu Met His Glu Leu Asn His Ala Met His

    225                 230                 235                 240

    Asn Leu Tyr Gly Ile Ala Ile Pro Asn Asp Gln Thr Ile Ser Ser Val

                    245                 250                 255

    Thr Ser Asn Ile Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala

                260                 265                 270

    Glu Ile Tyr Ala Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser

            275                 280                 285

    Ala Arg Lys Tyr Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile

        290                 295                 300

    Ala Lys Arg Leu Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn

    305                 310                 315                 320

    Lys Tyr Ile Gly Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe

                    325                 330                 335

    Val Val Glu Ser Ser Gly Glu Val Thr Val Asn Arg Asn Lys Phe Val

                340                 345                 350

    Glu Leu Tyr Asn Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala

            355                 360                 365

    Lys Ile Tyr Asn Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr

        370                 375                 380

    Thr Pro Val Thr Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln

    385                 390                 395                 400

    Asn Gly Phe Asn Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly

                    405                 410                 415

    Gln Asn Leu Ser Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn

                420                 425                 430

    Met Leu Tyr Leu Phe Thr Lys Phe Cys Val Asp Gly Ile Ile Thr Ser

            435                 440                 445

    Lys Thr Lys Ser Leu Ile Glu Gly Arg Phe Gly Gly Phe Thr Gly Ala

        450                 455                 460

    Arg Lys Ser Ala Arg Lys Arg Lys Asn Gln Ala Leu Ala Gly Gly Gly

    465                 470                 475                 480

    Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Leu Val Leu

                    485                 490                 495

    Gln Cys Arg Glu Leu Leu Val Lys Asn Thr Asp Leu Pro Phe Ile Gly

                500                 505                 510

    Asp Ile Ser Asp Val Lys Thr Asp Ile Phe Leu Arg Lys Asp Ile Asn

            515                 520                 525

    Glu Glu Thr Glu Val Ile Tyr Tyr Pro Asp Asn Val Ser Val Asp Gln

        530                 535                 540

    Val Ile Leu Ser Lys Asn Thr Ser Glu His Gly Gln Leu Asp Leu Leu

    545                 550                 555                 560

    Tyr Pro Ser Ile Asp Ser Glu Ser Glu Ile Leu Pro Gly Glu Asn Gln

                    565                 570                 575

    Val Phe Tyr Asp Asn Arg Thr Gln Asn Val Asp Tyr Leu Asn Ser Tyr

                580                 585                 590

    Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asp Asn Val Glu Asp Phe Thr

            595                 600                 605

    Phe Thr Arg Ser Ile Glu Glu Ala Leu Asp Asn Ser Ala Lys Val Tyr

        610                 615                 620

    Thr Tyr Phe Pro Thr Leu Ala Asn Lys Val Asn Ala Gly Val Gln Gly

    625                 630                 635                 640

    Gly Leu Phe Leu Met Trp Ala Asn Asp Val Val Glu Asp Phe Thr Thr

                    645                 650                 655

    Asn Ile Leu Arg Lys Asp Thr Leu Asp Lys Ile Ser Asp Val Ser Ala

                660                 665                 670

    Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Ser Asn Ser Val Arg

            675                 680                 685

    Arg Gly Asn Phe Thr Glu Ala Phe Ala Val Thr Gly Val Thr Ile Leu

        690                 695                 700

    Leu Glu Ala Phe Pro Glu Phe Thr Ile Pro Ala Leu Gly Ala Phe Val

    705                 710                 715                 720

    Ile Tyr Ser Lys Val Gln Glu Arg Asn Glu Ile Ile Lys Thr Ile Asp

                    725                 730                 735

    Asn Cys Leu Glu Gln Arg Ile Lys Arg Trp Lys Asp Ser Tyr Glu Trp

                740                 745                 750

    Met Met Gly Thr Trp Leu Ser Arg Ile Ile Thr Gln Phe Asn Asn Ile

            755                 760                 765

    Ser Tyr Gln Met Tyr Asp Ser Leu Asn Tyr Gln Ala Gly Ala Ile Lys

        770                 775                 780

    Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly Ser Asp Lys Glu

    785                 790                 795                 800

    Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser Leu Asp Val Lys

                    805                 810                 815

    Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile Arg Glu Cys Ser

                820                 825                 830

    Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val Ile Asp Glu Leu

            835                 840                 845

    Asn Glu Phe Asp Arg Asn Thr Lys Ala Lys Leu Ile Asn Leu Ile Asp

        850                 855                 860

    Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Lys Leu Lys Ala Lys

    865                 870                 875                 880

    Val Asn Asn Ser Phe Gln Asn Thr Ile Pro Phe Asn Ile Phe Ser Tyr

                    885                 890                 895

    Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu Tyr Phe Asn Leu

                900                 905                 910

    Asp

     

    <210>68

    <211>2673

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>68

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac      60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc     120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac     180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg     240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt     300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg     360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt     420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct     480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac     540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa     600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg     660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat     720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt     780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa     840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac     900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa     960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc    1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt    1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc    1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct    1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac    1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa    1320

    actaaatctc tgatagaagg tagatacggt ggtttcctgg cgctagcggg cggtggcggt    1380

    agcggcggtg gcggtagcgg cggtggcggt agcgcactag tgctgcagtg tatcaaggtt    1440

    aacaactggg atttattctt cagcccgagt gaagacaact tcaccaacga cctgaacaaa    1500

    ggtgaagaaa tcacctcaga tactaacatc gaagcagccg aagaaaacat ctcgctggac    1560

    ctgatccagc agtactacct gacctttaat ttcgacaacg agccggaaaa catttctatc    1620

    gaaaacctga gctctgatat catcggccag ctggaactga tgccgaacat cgaacgtttc    1680

    ccaaacggta aaaagtacga gctggacaaa tataccatgt tccactacct gcgcgcgcag    1740

    gaatttgaac acggcaaatc ccgtatcgca ctgactaact ccgttaacga agctctgctc    1800

    aacccgtccc gtgtatacac cttcttctct agcgactacg tgaaaaaggt caacaaagcg    1860

    actgaagctg caatgttctt gggttgggtt gaacagcttg tttatgattt taccgacgag    1920

    acgtccgaag tatctactac cgacaaaatt gcggatatca ctatcatcat cccgtacatc    1980

    ggtccggctc tgaacattgg caacatgctg tacaaagacg acttcgttgg cgcactgatc    2040

    ttctccggtg cggtgatcct gctggagttc atcccggaaa tcgccatccc ggtactgggc    2100

    acctttgctc tggtttctta cattgcaaac aaggttctga ctgtacaaac catcgacaac    2160

    gcgctgagca aacgtaacga aaaatgggat gaagtttaca aatatatcgt gaccaactgg    2220

    ctggctaagg ttaatactca gatcgacctc atccgcaaaa aaatgaaaga agcactggaa  2280

    aaccaggcgg aagctaccaa ggcaatcatt aactaccagt acaaccagta caccgaggaa  2340

    gaaaaaaaca acatcaactt caacatcgac gatctgtcct ctaaactgaa cgaatccatc  2400

    aacaaagcta tgatcaacat caacaagttc ctgaaccagt gctctgtaag ctatctgatg  2460

    aactccatga tcccgtacgg tgttaaacgt ctggaggact tcgatgcgtc tctgaaagac  2520

    gccctgctga aatacattta cgacaaccgt ggcactctga tcggtcaggt tgatcgtctg  2580

    aaggacaaag tgaacaatac cttatcgacc gacatccctt ttcagctcag taaatatgtc  2640

    gataaccaac gccttttgtc cactctagac tag                               2673

     

    <210>69

    <211>890

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>69

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile 1le Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Tyr Gly Gly Phe Leu Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly

        450                 455                 460

    Gly Ser Gly Gly Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys Val

    465                 470                 475                 480

    Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn

                    485                 490                 495

    Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala

                500                 505                 510

    Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr

            515                 520                 525

    Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser

        530                 535                 540

    Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg Phe

    545                 550                 555                 560

    Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His Tyr

                    565                 570                 575

    Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu Thr

                580                 585                 590

    Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe

            595                 600                 605

    Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala Ala

        610                 615                 620

    Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu

    625                 630                 635                 640

    Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile

                    645                 650                 655

    Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys

                660                 665                 670

    Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu Leu

            675                 680                 685

    Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala Leu

        690                 695                 700

    Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp Asn

    705                 710                 715                 720

    Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile

                    725                 730                 735

    Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile Arg

                740                 745                 750

    Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala

            755                 760                 765

    Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn

        770                 775                 780

    Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile

    785                 790                 795                 800

    Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser Val

                    805                 810                 815

    Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu Glu

                820                 825                 830

    Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp

            835                 840                 845

    Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys Val

        850                 855                 860

    Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val

    865                 870                 875                 880

    Asp Asn Gln Arg Leu Leu Ser Thr Leu Asp

                    885                 890

     

    <210>70

    <211>2709

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>70

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac  180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg  240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt  300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg  360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt  420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct  480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac  540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa  600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg  660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat  720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt  780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa  840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac  900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa  960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc 1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt 1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc 1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct 1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac 1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa 1320

    actaaatctc tgatagaagg tagatatggc ggtttcacgg gcgcacgcaa atcagcgcgt  1380

    aaattagcta accaggcgct agcgggcggt ggcggtagcg gcggtggcgg tagcggcggt  1440

    ggcggtagcg cactagtgct gcagtgtatc aaggttaaca actgggattt attcttcagc  1500

    ccgagtgaag acaacttcac caacgacctg aacaaaggtg aagaaatcac ctcagatact  1560

    aacatcgaag cagccgaaga aaacatctcg ctggacctga tccagcagta ctacctgacc  1620

    tttaatttcg acaacgagcc ggaaaacatt tctatcgaaa acctgagctc tgatatcatc  1680

    ggccagctgg aactgatgcc gaacatcgaa cgtttcccaa acggtaaaaa gtacgagctg  1740

    gacaaatata ccatgttcca ctacctgcgc gcgcaggaat ttgaacacgg caaatcccgt  1800

    atcgcactga ctaactccgt taacgaagct ctgctcaacc cgtcccgtgt atacaccttc  1860

    ttctctagcg actacgtgaa aaaggtcaac aaagcgactg aagctgcaat gttcttgggt  1920

    tgggttgaac agcttgttta tgattttacc gacgagacgt ccgaagtatc tactaccgac  1980

    aaaattgcgg atatcactat catcatcccg tacatcggtc cggctctgaa cattggcaac  2040

    atgctgtaca aagacgactt cgttggcgca ctgatcttct ccggtgcggt gatcctgctg  2100

    gagttcatcc cggaaatcgc catcccggta ctgggcacct ttgctctggt ttcttacatt  2160

    gcaaacaagg ttctgactgt acaaaccatc gacaacgcgc tgagcaaacg taacgaaaaa  2220

    tgggatgaag tttacaaata tatcgtgacc aactggctgg ctaaggttaa tactcagatc  2280

    gacctcatcc gcaaaaaaat gaaagaagca ctggaaaacc aggcggaagc taccaaggca  2340

    atcattaact accagtacaa ccagtacacc gaggaagaaa aaaacaacat caacttcaac  2400

    atcgacgatc tgtcctctaa actgaacgaa tccatcaaca aagctatgat caacatcaac  2460

    aagttcctga accagtgctc tgtaagctat ctgatgaact ccatgatccc gtacggtgtt  2520

    aaacgtctgg aggacttcga tgcgtctctg aaagacgccc tgctgaaata catttacgac  2580

    aaccgtggca ctctgatcgg tcaggttgat cgtctgaagg acaaagtgaa caatacctta  2640

    tcgaccgaca tcccttttca gctcagtaaa tatgtcgata accaacgcct tttgtccact  2700

    ctagactag                                                          2709

     

    <210>71

    <211>902

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>71

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Tyr Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Leu Ala Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp

                    485                 490                 495

    Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys

                500                 505                 510

    Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn

            515                 520                 525

    Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp

        530                 535                 540

    Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile

    545                 550                 555                 560

    Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys

                    565                 570                 575

    Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln

                580                 585                 590

    Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn

            595                 600                 605

    Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp

        610                 615                 620

    Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly

    625                 630                 635                 640

    Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val

                    645                 650                 655

    Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile

                660                 665                 670

    Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val

            675                 680                 685

    Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro

        690                 695                 700

    Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile

    705                 710                 715                 720

    Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys

                    725                 730                 735

    Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp

                740                 745                 750

    Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys

            755                 760                 765

    Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr

        770                 775                 780

    Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn

    785                 790                 795                 800

    Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met

                    805                 810                 815

    Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met

                820                 825                 830

    Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala

            835                 840                 845

    Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr

        850                 855                 860

    Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu

    865                 870                 875                 880

    Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg

                    885                 890                 895

    Leu Leu Ser Thr Leu Asp

                900

     

    <210>72

    <211>2709

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>72

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac  180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg  240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt     300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg     360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt     420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct     480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac     540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa     600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg     660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat     720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt     780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa     840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac     900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa     960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc    1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt    1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc    1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct    1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac    1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa    1320

    actaaatctc tgatagaagg tagatatggc ggtttcacgg gcgcacgcaa atcagcgcgt    1380

    aaacgtaaga accaggcgct agcgggcggt ggcggtagcg gcggtggcgg tagcggcggt    1440

    ggcggtagcg cactagtgct gcagtgtatc aaggttaaca actgggattt attcttcagc    1500

    ccgagtgaag acaacttcac caacgacctg aacaaaggtg aagaaatcac ctcagatact    1560

    aacatcgaag cagccgaaga aaacatctcg ctggacctga tccagcagta ctacctgacc    1620

    tttaatttcg acaacgagcc ggaaaacatt tctatcgaaa acctgagctc tgatatcatc    1680

    ggccagctgg aactgatgcc gaacatcgaa cgtttcccaa acggtaaaaa gtacgagctg    1740

    gacaaatata ccatgttcca ctacctgcgc gcgcaggaat ttgaacacgg caaatcccgt    1800

    atcgcactga ctaactccgt taacgaagct ctgctcaacc cgtcccgtgt atacaccttc    1860

    ttctctagcg actacgtgaa aaaggtcaac aaagcgactg aagctgcaat gttcttgggt    1920

    tgggttgaac agcttgttta tgattttacc gacgagacgt ccgaagtatc tactaccgac    1980

    aaaattgcgg atatcactat catcatcccg tacatcggtc cggctctgaa cattggcaac    2040

    atgctgtaca aagacgactt cgttggcgca ctgatcttct ccggtgcggt gatcctgctg    2100

    gagttcatcc cggaaatcgc catcccggta ctgggcacct ttgctctggt ttcttacatt    2160

    gcaaacaagg ttctgactgt acaaaccatc gacaacgcgc tgagcaaacg taacgaaaaa    2220

    tgggatgaag tttacaaata tatcgtgacc aactggctgg ctaaggttaa tactcagatc    2280

    gacctcatcc gcaaaaaaat gaaagaagca ctggaaaacc aggcggaagc taccaaggca    2340

    atcattaact accagtacaa ccagtacacc gaggaagaaa aaaacaacat caacttcaac    2400

    atcgacgatc tgtcctctaa actgaacgaa tccatcaaca aagctatgat caacatcaac    2460

    aagttcctga accagtgctc tgtaagctat ctgatgaact ccatgatccc gtacggtgtt    2520

    aaacgtctgg aggacttcga tgcgtctctg aaagacgccc tgctgaaata catttacgac  2580

    aaccgtggca ctctgatcgg tcaggttgat cgtctgaagg acaaagtgaa caatacctta  2640

    tcgaccgaca tcccttttca gctcagtaaa tatgtcgata accaacgcct tttgtccact  2700

    ctagactag                                                          2709

     

    <210>73

    <211>902

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>73

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Tyr Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Arg Lys Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp

                    485                 490                 495

    Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys

                500                 505                 510

    Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn

            515                 520                 525

    Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp

        530                 535                 540

    Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile

    545                 550                 555                 560

    Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys

                    565                 570                 575

    Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln

                580                 585                 590

    Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn

            595                 600                 605

    Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp

        610                 615                 620

    Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly

    625                 630                 635                 640

    Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val

                    645                 650                 655

    Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile

                660                 665                 670

    Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val

            675                 680                 685

    Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro

        690                 695                 700

    Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile

    705                 710                 715                 720

    Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys

                    725                 730                 735

    Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp

                740                 745                 750

    Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys

            755                 760                 765

    Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr

        770                 775                 780

    Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn

    785                 790                 795                 800

    Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met

                    805                 810                 815

    Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met

                820                 825                 830

    Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala

            835                 840                 845

    Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr

        850                 855                 860

    Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu

    865                 870                 875                 880

    Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg

                    885                 890                 895

    Leu Leu Ser Thr Leu Asp

                900

     

    <210>74

    <211>2889

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>74

    ggatccttgg tacgagatga cgttgactat caaattttcc gcgactttgc ggaaaataaa   60

    ggtaagtttt tcgtcggcgc cacagacctg tccgtcaaaa ataagagagg ccagaacatc  120

    ggtaacgcac tgagcaacgt ccctatgatt gattttagtg tagcggacgt taataaacgg  180

    attgcaaccg tcgttgatcc gcagtatgct gtcagcgtca aacatgctaa agcggaagtt  240

    catacgttct attacgggca atataacggc cataacgatg tggctgataa agaaaatgaa  300

    tatcgcgtgg tcgagcagaa caattacgaa ccgcacaaag cgtggggcgc gagtaattta  360

    ggccgcctgg aggactataa catggcccgt ttcaataaat tcgtgaccga ggtagcaccg  420

    atcgccccca cagatgctgg tgggggcctg gatacctaca aagataaaaa ccgcttctct  480

    agcttcgtgc gcattggcgc cggtcgtcag ctcgtgtacg agaagggtgt ctatcaccag  540

    gaaggtaatg aaaaggggta cgacctccgt gatttgtccc aggcgtatcg ctacgctatt  600

    gccggaaccc cgtataaaga tattaatatc gatcaaacca tgaataccga aggcctaatt  660

    ggtttcggga atcataataa gcaatatagc gcagaagagc taaagcaggc cctcagccaa  720

    gatgcgttaa ccaattacgg agtgttaggc gatagcggca gtccgctgtt tgccttcgat  780

    aaacagaaaa atcaatgggt gtttctgggc acttatgatt attgggccgg atatggtaaa  840

    aagagctggc aggaatggaa tatttataaa aaggaattcg cagacaaaat caagcagcat  900

    gacaacgcag gtacggtgaa ggggaacggc gaacatcact ggaagacgac cggcacgaat  960

    agtcatatcg gatcgacggc cgttcgcctg gcgaacaatg agggcgatgc aaacaatggg 1020

    caaaacgtga cctttgagga caacggtacc ctggtcctta accagaacat aaatcagggc 1080

    gcgggaggct tgttctttaa aggcgactat actgttaagg gagcaaacaa tgacatcacc 1140

    tggttagggg ccggtattga cgttgcggat ggaaaaaagg tggtttggca ggttaaaaac 1200

    cctaacgggg accggctggc aaaaatcggc aaagggacat tggaaattaa tggtaccggt 1260

    gtgaatcagg gtcagctgaa agtgggagat gggaccgtga ttctgaacca gaaagcagac 1320

    gctgacaaaa aggtgcaagc ctttagccaa gtaggaattg ttagtggtcg tggcacactc 1380

    gtcttgaact caagcaacca aataaatccg gataacctgt actttggatt tcgtggcgga 1440

    cgcctggatg ctaacgggaa tgatctgacc tttgaacata tccgtaacgt tgacgagggt  1500

    gcgcgcatag ttaatcataa tactgaccat gcatcaacta tcaccttgac cgggaaaagt  1560

    ctgattacaa acccaaactc tctgtcagta cattccatcc agaatgatta tgatgaagac  1620

    gattactcat actattaccg gccgcgtaga ccaattccac aaggtaaaga tctttattac  1680

    aaaaattacc gttattacgc attaaaatcc ggagggcggc tgaatgcacc tatgccggaa  1740

    aatggcgtgg ccgaaaacaa tgactggatt tttatgggtt atactcaaga agaggctcgc  1800

    aaaaatgcaa tgaaccataa aaataaccga aggatcggtg atttcggcgg atttttcgat  1860

    gaggaaaatg gtaaaggtca caatggtgcg ctgaatctaa attttaacgg caaaagtgcc  1920

    cagaaacgtt tccttctgac tggtggcgct aatctgaatg gtaaaatcag tgtgacgcag  1980

    ggtaacgtgc tgctttctgg ccggccaact ccgcatgcac gtgattttgt aaataaatcg  2040

    agcgctcgta aagatgcgca tttttctaaa aataacgagg tcgtgtttga agatgactgg  2100

    ataaatcgca cctttaaagc ggcagaaatc gcggttaatc agagtgcgag cttttcatcg  2160

    ggtaggaatg tatctgatat tacagcaaac attacagcca ctgataatgc gaaggtcaac  2220

    ctgggttata aaaacggtga tgaagtttgt gttcgatcgg attacacggg ctatgttacc  2280

    tgcaacactg gcaatctgtc tgataaagcg cttaactctt ttgacgccac gcgcattaac  2340

    gggaatgtga acctgaacca aaacgctgcc ttggtacttg gtaaggccgc gttgtggggt  2400

    aaaattcagg gccagggcaa ctcccgtgtg tctctgaacc agcactcgaa gtggcacctg  2460

    acgggggact cgcaggtgca caacttgtcc ctggccgata gccatattca ccttaacaat  2520

    gcgtccgatg cccagtcagc taataaatat catacgatca aaatcaatca cctctctggc  2580

    aacggtcact ttcactactt aacggattta gcaaaaaact taggggataa agtcctggta  2640

    aaagaatcag cgagcggaca ttatcagtta catgtacaga acaaaacagg cgagccaaat  2700

    caggaaggcc ttgacttatt tgatgcttca tcggtacaag atcgttccag actgttcgtt  2760

    tcactcgcga atcactacgt tgatctgggt gcgctgcgct atactataaa gacggaaaat  2820

    ggcataacac gcctctataa tccctatgcc ggtaacggcc gtccggtgaa acctgctccc  2880

    tgcgtcgac                                                          2889

     

    <210>75

    <211>4296

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>75

    ggatccttgg tacgagatga cgttgactat caaattttcc gcgactttgc ggaaaataaa    60

    ggtaagtttt tcgtcggcgc cacagacctg tccgtcaaaa ataagagagg ccagaacatc   120

    ggtaacgcac tgagcaacgt ccctatgatt gattttagtg tagcggacgt taataaacgg   180

    attgcaaccg tcgttgatcc gcagtatgct gtcagcgtca aacatgctaa agcggaagtt   240

    catacgttct attacgggca atataacggc cataacgatg tggctgataa agaaaatgaa   300

    tatcgcgtgg tcgagcagaa caattacgaa ccgcacaaag cgtggggcgc gagtaattta   360

    ggccgcctgg aggactataa catggcccgt ttcaataaat tcgtgaccga ggtagcaccg   420

    atcgccccca cagatgctgg tgggggcctg gatacctaca aagataaaaa ccgcttctct   480

    agcttcgtgc gcattggcgc cggtcgtcag ctcgtgtacg agaagggtgt ctatcaccag     540

    gaaggtaatg aaaaggggta cgacctccgt gatttgtccc aggcgtatcg ctacgctatt     600

    gccggaaccc cgtataaaga tattaatatc gatcaaacca tgaataccga aggcctaatt     660

    ggtttcggga atcataataa gcaatatagc gcagaagagc taaagcaggc cctcagccaa     720

    gatgcgttaa ccaattacgg agtgttaggc gatagcggca gtccgctgtt tgccttcgat     780

    aaacagaaaa atcaatgggt gtttctgggc acttatgatt attgggccgg atatggtaaa     840

    aagagctggc aggaatggaa tatttataaa aaggaattcg cagacaaaat caagcagcat     900

    gacaacgcag gtacggtgaa ggggaacggc gaacatcact ggaagacgac cggcacgaat     960

    agtcatatcg gatcgacggc cgttcgcctg gcgaacaatg agggcgatgc aaacaatggg    1020

    caaaacgtga cctttgagga caacggtacc ctggtcctta accagaacat aaatcagggc    1080

    gcgggaggct tgttctttaa aggcgactat actgttaagg gagcaaacaa tgacatcacc    1140

    tggttagggg ccggtattga cgttgcggat ggaaaaaagg tggtttggca ggttaaaaac    1200

    cctaacgggg accggctggc aaaaatcggc aaagggacat tggaaattaa tggtaccggt    1260

    gtgaatcagg gtcagctgaa agtgggagat gggaccgtga ttctgaacca gaaagcagac    1320

    gctgacaaaa aggtgcaagc ctttagccaa gtaggaattg ttagtggtcg tggcacactc    1380

    gtcttgaact caagcaacca aataaatccg gataacctgt actttggatt tcgtggcgga    1440

    cgcctggatg ctaacgggaa tgatctgacc tttgaacata tccgtaacgt tgacgagggt    1500

    gcgcgcatag ttaatcataa tactgaccat gcatcaacta tcaccttgac cgggaaaagt    1560

    ctgattacaa acccaaactc tctgtcagta cattccatcc agaatgatta tgatgaagac    1620

    gattactcat actattaccg gccgcgtaga ccaattccac aaggtaaaga tctttattac    1680

    aaaaattacc gttattacgc attaaaatcc ggagggcggc tgaatgcacc tatgccggaa    1740

    aatggcgtgg ccgaaaacaa tgactggatt tttatgggtt atactcaaga agaggctcgc    1800

    aaaaatgcaa tgaaccataa aaataaccga aggatcggtg atttcggcgg atttttcgat    1860

    gaggaaaatg gtaaaggtca caatggtgcg ctgaatctaa attttaacgg caaaagtgcc    1920

    cagaaacgtt tccttctgac tggtggcgct aatctgaatg gtaaaatcag tgtgacgcag    1980

    ggtaacgtgc tgctttctgg ccggccaact ccgcatgcac gtgattttgt aaataaatcg    2040

    agcgctcgta aagatgcgca tttttctaaa aataacgagg tcgtgtttga agatgactgg    2100

    ataaatcgca cctttaaagc ggcagaaatc gcggttaatc agagtgcgag cttttcatcg    2160

    ggtaggaatg tatctgatat tacagcaaac attacagcca ctgataatgc gaaggtcaac    2220

    ctgggttata aaaacggtga tgaagtttgt gttcgatcgg attacacggg ctatgttacc    2280

    tgcaacactg gcaatctgtc tgataaagcg cttaactctt ttgacgccac gcgcattaac    2340

    gggaatgtga acctgaacca aaacgctgcc ttggtacttg gtaaggccgc gttgtggggt    2400

    aaaattcagg gccagggcaa ctcccgtgtg tctctgaacc agcactcgaa gtggcacctg    2460

    acgggggact cgcaggtgca caacttgtcc ctggccgata gccatattca ccttaacaat    2520

    gcgtccgatg cccagtcagc taataaatat catacgatca aaatcaatca cctctctggc    2580

    aacggtcact ttcactactt aacggattta gcaaaaaact taggggataa agtcctggta    2640

    aaagaatcag cgagcggaca ttatcagtta catgtacaga acaaaacagg cgagccaaat    2700

    caggaaggcc ttgacttatt tgatgcttca tcggtacaag atcgttccag actgttcgtt    2760

    tcactcgcga atcactacgt tgatctgggt gcgctgcgct atactataaa gacggaaaat  2820

    ggcataacac gcctctataa tccctatgcc ggtaacggcc gtccggtgaa acctgctccc  2880

    tgcgtcgacg gcatcattac ctccaaaact aaatctctga tagaaggtag atttggcggt  2940

    ttcacgggcg cacgcaaatc agcgcgtaaa cgtaagaacc aggcgctagc gggcggtggc  3000

    ggtagcggcg gtggcggtag cggcggtggc ggtagcgcac tagtgctgca gtgtatcaag  3060

    gttaacaact gggatttatt cttcagcccg agtgaagaca acttcaccaa cgacctgaac  3120

    aaaggtgaag aaatcacctc agatactaac atcgaagcag ccgaagaaaa catctcgctg  3180

    gacctgatcc agcagtacta cctgaccttt aatttcgaca acgagccgga aaacatttct  3240

    atcgaaaacc tgagctctga tatcatcggc cagctggaac tgatgccgaa catcgaacgt  3300

    ttcccaaacg gtaaaaagta cgagctggac aaatatacca tgttccacta cctgcgcgcg  3360

    caggaatttg aacacggcaa atcccgtatc gcactgacta actccgttaa cgaagctctg  3420

    ctcaacccgt cccgtgtata caccttcttc tctagcgact acgtgaaaaa ggtcaacaaa  3480

    gcgactgaag ctgcaatgtt cttgggttgg gttgaacagc ttgtttatga ttttaccgac  3540

    gagacgtccg aagtatctac taccgacaaa attgcggata tcactatcat catcccgtac  3600

    atcggtccgg ctctgaacat tggcaacatg ctgtacaaag acgacttcgt tggcgcactg  3660

    atcttctccg gtgcggtgat cctgctggag ttcatcccgg aaatcgccat cccggtactg  3720

    ggcacctttg ctctggtttc ttacattgca aacaaggttc tgactgtaca aaccatcgac  3780

    aacgcgctga gcaaacgtaa cgaaaaatgg gatgaagttt acaaatatat cgtgaccaac  3840

    tggctggcta aggttaatac tcagatcgac ctcatccgca aaaaaatgaa agaagcactg  3900

    gaaaaccagg cggaagctac caaggcaatc attaactacc agtacaacca gtacaccgag  3960

    gaagaaaaaa acaacatcaa cttcaacatc gacgatctgt cctctaaact gaacgaatcc  4020

    atcaacaaag ctatgatcaa catcaacaag ttcctgaacc agtgctctgt aagctatctg  4080

    atgaactcca tgatcccgta cggtgttaaa cgtctggagg acttcgatgc gtctctgaaa  4140

    gacgccctgc tgaaatacat ttacgacaac cgtggcactc tgatcggtca ggttgatcgt  4200

    ctgaaggaca aagtgaacaa taccttatcg accgacatcc cttttcagct cagtaaatat  4260

    gtcgataacc aacgcctttt gtccactcta gactag                            4296

     

    <210>76

    <211>1431

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>76

     

    Gly Ser Leu Val Arg Asp Asp Val Asp Tyr Gln Ile Phe Arg Asp Phe

    1               5                   10                  15

    Ala Glu Asn Lys Gly Lys Phe Phe Val Gly Ala Thr Asp Leu Ser Val

                20                  25                  30

    Lys Asn Lys Arg Gly Gln Asn Ile Gly Asn Ala Leu Ser Asn Val Pro

            35                  40                  45

    Met Ile Asp Phe Ser Val Ala Asp Val Asn Lys Arg Ile Ala Thr Val

        50                  55                  60

    Val Asp Pro Gln Tyr Ala Val Ser Val Lys His Ala Lys Ala Glu Val

    65                  70                  75                  80

    His Thr Phe Tyr Tyr Gly Gln Tyr Asn Gly His Asn Asp Val Ala Asp

                    85                  90                  95

    Lys Glu Asn Glu Tyr Arg Val Val Glu Gln Asn Asn Tyr Glu Pro His

                100                 105                 110

    Lys Ala Trp Gly Ala Ser Asn Leu Gly Arg Leu Glu Asp Tyr Asn Met

            115                 120                 125

    Ala Arg Phe Asn Lys Phe Val Thr Glu Val Ala Pro Ile Ala Pro Thr

        130                 135                 140

    Asp Ala Gly Gly Gly Leu Asp Thr Tyr Lys Asp Lys Asn Arg Phe Ser

    145                 150                 155                 160

    Ser Phe Val Arg Ile Gly Ala Gly Arg Gln Leu Val Tyr Glu Lys Gly

                    165                 170                 175

    Val Tyr His Gln Glu Gly Asn Glu Lys Gly Tyr Asp Leu Arg Asp Leu

                180                 185                 190

    Ser Gln Ala Tyr Arg Tyr Ala Ile Ala Gly Thr Pro Tyr Lys Asp Ile

            195                 200                 205

    Asn Ile Asp Gln Thr Met Asn Thr Glu Gly Leu Ile Gly Phe Gly Asn

        210                 215                 220

    His Asn Lys Gln Tyr Ser Ala Glu Glu Leu Lys Gln Ala Leu Ser Gln

    225                 230                 235                 240

    Asp Ala Leu Thr Asn Tyr Gly Val Leu Gly Asp Ser Gly Ser Pro Leu

                    245                 250                 255

    Phe Ala Phe Asp Lys Gln Lys Asn Gln Trp Val Phe Leu Gly Thr Tyr

                260                 265                 270

    Asp Tyr Trp Ala Gly Tyr Gly Lys Lys Ser Trp Gln Glu Trp Asn Ile

            275                 280                 285

    Tyr Lys Lys Glu Phe Ala Asp Lys Ile Lys Gln His Asp Asn Ala Gly

        290                 295                 300

    Thr Val Lys Gly Asn Gly Glu His His Trp Lys Thr Thr Gly Thr Asn

    305                 310                 315                 320

    Ser His Ile Gly Ser Thr Ala Val Arg Leu Ala Asn Asn Glu Gly Asp

                    325                 330                 335

    Ala Asn Asn Gly Gln Asn Val Thr Phe Glu Asp Asn Gly Thr Leu Val

                340                 345                 350

    Leu Asn Gln Asn Ile Asn Gln Gly Ala Gly Gly Leu Phe Phe Lys Gly

            355                 360                 365

    Asp Tyr Thr Val Lys Gly Ala Asn Asn Asp Ile Thr Trp Leu Gly Ala

        370                 375                 380

    Gly Ile Asp Val Ala Asp Gly Lys Lys Val Val Trp Gln Val Lys Asn

    385                 390                 395                 400

    Pro Asn Gly Asp Arg Leu Ala Lys Ile Gly Lys Gly Thr Leu Glu Ile

                    405                 410                 415

    Asn Gly Thr Gly Val Asn Gln Gly Gln Leu Lys Val Gly Asp Gly Thr

                420                 425                 430

    Val Ile Leu Asn Gln Lys Ala Asp Ala Asp Lys Lys Val Gln Ala Phe

            435                 440                 445

    Ser Gln Val Gly Ile Val Ser Gly Arg Gly Thr Leu Val Leu Asn Ser

        450                 455                 460

    Ser Asn Gln Ile Asn Pro Asp Asn Leu Tyr Phe Gly Phe Arg Gly Gly

    465                 470                 475                 480

    Arg Leu Asp Ala Asn Gly Asn Asp Leu Thr Phe Glu His Ile Arg Asn

                    485                 490                 495

    Val Asp Glu Gly Ala Arg Ile Val Asn His Asn Thr Asp His Ala Ser

                500                 505                 510

    Thr Ile Thr Leu Thr Gly Lys Ser Leu Ile Thr Asn Pro Asn Ser Leu

            515                 520                 525

    Ser Val His Ser Ile Gln Asn Asp Tyr Asp Glu Asp Asp Tyr Ser Tyr

        530                 535                 540

    Tyr Tyr Arg Pro Arg Arg Pro Ile Pro Gln Gly Lys Asp Leu Tyr Tyr

    545                 550                 555                 560

    Lys Asn Tyr Arg Tyr Tyr Ala Leu Lys Ser Gly Gly Arg Leu Asn Ala

                    565                 570                 575

    Pro Met Pro Glu Asn Gly Val Ala Glu Asn Asn Asp Trp Ile Phe Met

                580                 585                 590

    Gly Tyr Thr Gln Glu Glu Ala Arg Lys Asn Ala Met Asn His Lys Asn

            595                 600                 605

    Asn Arg Arg Ile Gly Asp Phe Gly Gly Phe Phe Asp Glu Glu Asn Gly

        610                 615                 620

    Lys Gly His Asn Gly Ala Leu Asn Leu Asn Phe Asn Gly Lys Ser Ala

    625                 630                 635                 640

    Gln Lys Arg Phe Leu Leu Thr Gly Gly Ala Asn Leu Asn Gly Lys Ile

                    645                 650                 655

    Ser Val Thr Gln Gly Asn Val Leu Leu Ser Gly Arg Pro Thr Pro His

                660                 665                 670

    Ala Arg Asp Phe Val Asn Lys Ser Ser Ala Arg Lys Asp Ala His Phe

            675                 680                 685

    Ser Lys Asn Asn Glu Val Val Phe Glu Asp Asp Trp Ile Asn Arg Thr

        690                 695                 700

    Phe Lys Ala Ala Glu Ile Ala Val Asn Gln Ser Ala Ser Phe Ser Ser

    705                 710                 715                 720

    Gly Arg Asn Val Ser Asp Ile Thr Ala Asn Ile Thr Ala Thr Asp Asn

                    725                 730                 735

    Ala Lys Val Asn Leu Gly Tyr Lys Asn Gly Asp Glu Val Cys Val Arg

                740                 745                 750

    Ser Asp Tyr Thr Gly Tyr Val Thr Cys Asn Thr Gly Asn Leu Ser Asp

            755                 760                 765

    Lys Ala Leu Asn Ser Phe Asp Ala Thr Arg Ile Asn Gly Asn Val Asn

        770                 775                 780

    Leu Asn Gln Asn Ala Ala Leu Val Leu Gly Lys Ala Ala Leu Trp Gly

    785                 790                 795                 800

    Lys Ile Gln Gly Gln Gly Asn Ser Arg Val Ser Leu Asn Gln His Ser

                    805                 810                 815

    Lys Trp His Leu Thr Gly Asp Ser Gln Val His Asn Leu Ser Leu Ala

                820                 825                 830

    Asp Ser His Ile His Leu Asn Asn Ala Ser Asp Ala Gln Ser Ala Asn

            835                 840                 845

    Lys Tyr His Thr Ile Lys Ile Asn His Leu Ser Gly Asn Gly His Phe

        850                 855                 860

    His Tyr Leu Thr Asp Leu Ala Lys Asn Leu Gly Asp Lys Val Leu Val

    865                 870                 875                 880

    Lys Glu Ser Ala Ser Gly His Tyr Gln Leu His Val Gln Asn Lys Thr

                    885                 890                 895

    Gly Glu Pro Asn Gln Glu Gly Leu Asp Leu Phe Asp Ala Ser Ser Val

                900                 905                 910

    Gln Asp Arg Ser Arg Leu Phe Val Ser Leu Ala Asn His Tyr Val Asp

            915                 920                 925

    Leu Gly Ala Leu Arg Tyr Thr Ile Lys Thr Glu Asn Gly Ile Thr Arg

        930                 935                 940

    Leu Tyr Asn Pro Tyr Ala Gly Asn Gly Arg Pro Val Lys Pro Ala Pro

    945                 950                 955                 960

    Cys Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly

                    965                 970                 975

    Arg Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Arg Lys

                980                 985                 990

    Asn Gln Ala Leu Ala Gly Gly Gly  Gly Ser Gly Gly Gly  Gly Ser Gly

            995                 1000                 1005

    Gly Gly  Gly Ser Ala Leu Val  Leu Gln Cys Ile Lys  Val Asn Asn

        1010                 1015                 1020

    Trp Asp  Leu Phe Phe Ser Pro  Ser Glu Asp Asn Phe  Thr Asn Asp

        1025                 1030                 1035

    Leu Asn  Lys Gly Glu Glu Ile  Thr Ser Asp Thr Asn  Ile Glu Ala

        1040                 1045                 1050

    Ala Glu  Glu Asn Ile Ser Leu  Asp Leu Ile Gln Gln  Tyr Tyr Leu

        l055                 1060                 1065

    Thr Phe  Asn Phe Asp Asn Glu  Pro Glu Asn Ile Ser  Ile Glu Asn

        1070                 1075                 1080

    Leu Ser  Ser Asp Ile Ile Gly  Gln Leu Glu Leu Met  Pro Asn Ile

        1085                 1090                 1095

    Glu Arg  Phe Pro Asn Gly Lys  Lys Tyr Glu Leu Asp  Lys Tyr Thr

        1100                 1105                 1110

    Met Phe  His Tyr Leu Arg Ala  Gln Glu Phe Glu His  Gly Lys Ser

        1115                 1120                 1125

    Arg Ile  Ala Leu Thr Asn Ser  Val Asn Glu Ala Leu  Leu Asn Pro

        1130                 1135                 1140

    Ser Arg  Val Tyr Thr Phe Phe  Ser Ser Asp Tyr Val  Lys Lys Val

        1145                 1150                 1155

    Asn Lys  Ala Thr Glu Ala Ala  Met Phe Leu Gly Trp  Val Glu Gln

        1160                 1165                 1170

    Leu Val  Tyr Asp Phe Thr Asp  Glu Thr Ser Glu Val  Ser Thr Thr

        1175                 1180                 1185

    Asp Lys  Ile Ala Asp Ile Thr  Ile Ile Ile Pro Tyr  Ile Gly Pro

        1190                 1195                 1200

    Ala Leu  Asn Ile Gly Asn Met  Leu Tyr Lys Asp Asp  Phe Val Gly

        1205                 1210                 1215

    Ala Leu  Ile Phe Ser Gly Ala  Val Ile Leu Leu Glu  Phe Ile Pro

        1220                 1225                 1230

    Glu Ile  Ala Ile Pro Val Leu  Gly Thr Phe Ala Leu  Val Ser Tyr

        1235                 1240                 1245

    Ile Ala  Asn Lys Val Leu Thr  Val Gln Thr Ile Asp  Asn Ala Leu

        1250                 1255                 1260

    Ser Lys  Arg Asn Glu Lys Trp  Asp Glu Val Tyr Lys  Tyr Ile Val

        1265                 1270                 1275

    Thr Asn  Trp Leu Ala Lys Val  Asn Thr Gln Ile Asp  Leu Ile Arg

        1280                 1285                 1290

    Lys Lys  Met Lys Glu Ala Leu  Glu Asn Gln Ala Glu  Ala Thr Lys

        1295                 1300                 1305

    Ala Ile  Ile Asn Tyr Gln Tyr  Asn Gln Tyr Thr Glu  Glu Glu Lys

        1310                 1315                 1320

    Asn Asn  Ile Asn Phe Asn Ile  Asp Asp Leu Ser Ser  Lys Leu Asn

        1325                 1330                 1335

    Glu Ser  Ile Asn Lys Ala Met  Ile Asn Ile Asn Lys  Phe Leu Asn

        1340                 1345                 1350

    Gln Cys  Ser Val Ser Tyr Leu  Met Asn Ser Met Ile  Pro Tyr Gly

        1355                 1360                 1365

    Val Lys  Arg Leu Glu Asp Phe  Asp Ala Ser Leu Lys  Asp Ala Leu

        1370                 1375                 1380

    Leu Lys  Tyr Ile Tyr Asp Asn  Arg Gly Thr Leu Ile  Gly Gln Val

        1385                 1390                 1395

    Asp Arg  Leu Lys Asp Lys Val  Asn Asn Thr Leu Ser  Thr Asp Ile

        1400                 1405                 1410

    Pro Phe  Gln Leu Ser Lys Tyr  Val Asp Asn Gln Arg  Leu Leu Ser

        1415                 1420                 1425

    Thr Leu  Asp

        1430

     

    <210>77

    <211>1357

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>77

    gctagcgggc ggtggcggta gcggcggtgg cggtagcggc ggtggcggta gcgcactagt     60

    gctgcagtgt atcaaggtta acaactggga tttattcttc agcccgagtg aagacaactt    120

    caccaacgac ctgaacaaag gtgaagaaat cacctcagat actaacatcg aagcagccga    180

    agaaaacatc tcgctggacc tgatccagca gtactacctg acctttaatt tcgacaacga    240

    gccggaaaac atttctatcg aaaacctgag ctctgatatc atcggccagc tggaactgat    300

    gccgaacatc gaacgtttcc caaacggtaa aaagtacgag ctggacaaat ataccatgtt    360

    ccactacctg cgcgcgcagg aatttgaaca cggcaaatcc cgtatcgcac tgactaactc    420

    cgttaacgaa gctctgctca acccgtcccg tgtatacacc ttcttctcta gcgactacgt    480

    gaaaaaggtc aacaaagcga ctgaagctgc aatgttcttg ggttgggttg aacagcttgt   540

    ttatgatttt accgacgaga cgtccgaagt atctactacc gacaaaattg cggatatcac   600

    tatcatcatc ccgtacatcg gtccggctct gaacattggc aacatgctgt acaaagacga   660

    cttcgttggc gcactgatct tctccggtgc ggtgatcctg ctggagttca tcccggaaat   720

    cgccatcccg gtactgggca cctttgctct ggtttcttac attgcaaaca aggttctgac   780

    tgtacaaacc atcgacaacg cgctgagcaa acgtaacgaa aaatgggatg aagtttacaa   840

    atatatcgtg accaactggc tggctaaggt taatactcag atcgacctca tccgcaaaaa   900

    aatgaaagaa gcactggaaa accaggcgga agctaccaag gcaatcatta actaccagta   960

    caaccagtac accgaggaag aaaaaaacaa catcaacttc aacatcgacg atctgtcctc  1020

    taaactgaac gaatccatca acaaagctat gatcaacatc aacaagttcc tgaaccagtg  1080

    ctctgtaagc tatctgatga actccatgat cccgtacggt gttaaacgtc tggaggactt  1140

    cgatgcgtct ctgaaagacg ccctgctgaa atacatttac gacaaccgtg gcactctgat  1200

    cggtcaggtt gatcgtctga aggacaaagt gaacaatacc ttatcgaccg acatcccttt  1260

    tcagctcagt aaatatgtcg ataaccaacg ccttttgtcc actctagaaa tagaaggtag  1320

    aagtgggcac catcaccatc accattaatg aaagctt                           1357

     

    <210>78

    <211>2745

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>78

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac    60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc   120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac   180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg   240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt   300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg   360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt   420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct   480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac   540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa   600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg   660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat   720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt   780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa   840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac   900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa   960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc  1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt  1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc  1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct  1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac  1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa  1320

    actaaatctc tgatagaagg tagatttggc ggtttcacgg gcgcacgcaa atcagcgcgt  1380

    aaacgtaaga accaggcgct agcgggcggt ggcggtagcg gcggtggcgg tagcggcggt  1440

    ggcggtagcg cactagtgct gcagtgtatc aaggttaaca actgggattt attcttcagc  1500

    ccgagtgaag acaacttcac caacgacctg aacaaaggtg aagaaatcac ctcagatact  1560

    aacatcgaag cagccgaaga aaacatctcg ctggacctga tccagcagta ctacctgacc  1620

    tttaatttcg acaacgagcc ggaaaacatt tctatcgaaa acctgagctc tgatatcatc  1680

    ggccagctgg aactgatgcc gaacatcgaa cgtttcccaa acggtaaaaa gtacgagctg  1740

    gacaaatata ccatgttcca ctacctgcgc gcgcaggaat ttgaacacgg caaatcccgt  1800

    atcgcactga ctaactccgt taacgaagct ctgctcaacc cgtcccgtgt atacaccttc  1860

    ttctctagcg actacgtgaa aaaggtcaac aaagcgactg aagctgcaat gttcttgggt  1920

    tgggttgaac agcttgttta tgattttacc gacgagacgt ccgaagtatc tactaccgac  1980

    aaaattgcgg atatcactat catcatcccg tacatcggtc cggctctgaa cattggcaac  2040

    atgctgtaca aagacgactt cgttggcgca ctgatcttct ccggtgcggt gatcctgctg  2100

    gagttcatcc cggaaatcgc catcccggta ctgggcacct ttgctctggt ttcttacatt  2160

    gcaaacaagg ttctgactgt acaaaccatc gacaacgcgc tgagcaaacg taacgaaaaa  2220

    tgggatgaag tttacaaata tatcgtgacc aactggctgg ctaaggttaa tactcagatc  2280

    gacctcatcc gcaaaaaaat gaaagaagca ctggaaaacc aggcggaagc taccaaggca  2340

    atcattaact accagtacaa ccagtacacc gaggaagaaa aaaacaacat caacttcaac  2400

    atcgacgatc tgtcctctaa actgaacgaa tccatcaaca aagctatgat caacatcaac  2460

    aagttcctga accagtgctc tgtaagctat ctgatgaact ccatgatccc gtacggtgtt  2520

    aaacgtctgg aggacttcga tgcgtctctg aaagacgccc tgctgaaata catttacgac  2580

    aaccgtggca ctctgatcgg tcaggttgat cgtctgaagg acaaagtgaa caatacctta  2640

    tcgaccgaca tcccttttca gctcagtaaa tatgtcgata accaacgcct tttgtccact  2700

    ctagaaatag aaggtagaag tgggcaccat caccatcacc attaa                  2745

     

    <210>79

    <211>914

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>79

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Arg Lys Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Lys Val Asn Asn Trp Asp

                    485                 490                 495

    Leu Phe Phe Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys

                500                 505                 510

    Gly Glu Glu Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn

            515                 520                 525

    Ile Ser Leu Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp

        530                 535                 540

    Asn Glu Pro Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile

    545                 550                 555                 560

    Gly Gln Leu Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys

                    565                 570                 575

    Lys Tyr Glu Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln

                580                 585                 590

    Glu Phe Glu His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn

            595                 600                 605

    Glu Ala Leu Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp

        610                 615                 620

    Tyr Val Lys Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly

    625                 630                 635                 640

    Trp Val Glu Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val

                    645                 650                 655

    Ser Thr Thr Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile

                660                 665                 670

    Gly Pro Ala Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val

            675                 680                 685

    Gly Ala Leu Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro

        690                 695                 700

    Glu Ile Ala Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile

    705                 710                 715                 720

    Ala Asn Lys Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys

                    725                 730                 735

    Arg Asn Glu Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp

                740                 745                 750

    Leu Ala Lys Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys

            755                 760                 765

    Glu Ala Leu Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr

        770                 775                 780

    Gln Tyr Asn Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn

    785                 790                 795                 800

    Ile Asp Asp Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met

                    805                 810                 815

    Ile Asn Ile Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met

                820                 825                 830

    Asn Ser Met Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala

            835                 840                 845

    Ser Leu Lys Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr

        850                 855                 860

    Leu Ile Gly Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu

    865                 870                 875                 880

    Ser Thr Asp Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg

                    885                 890                 895

    Leu Leu Ser Thr Leu Glu Ile Glu Gly Arg Ser Gly His His His His

                900                 905                 910

    His His

     

    <210>80

    <211>619

    <212>DNA

    <213>人工序列

    <220>

    <223>合成的

     

    <400>80

    gctagcgggc ggtggcggta gcggcggtgg cggtagcggc ggtggcggta gcgcactagt   60

    gctgcagtgt atcaatctgg attgggacgt aatccgtgat aagaccaaaa caaaaatcga  120

    gtctttgaaa gaacacggcc cgatcaaaaa taagatgtct gaatcaccca ataaaactgt  180

    ttcggaggaa aaagcgaaac agtatttgga agagtttcat caaaccgcgc ttgaacatcc  240

    ggagctcagt gaactgaaaa cagtgacggg aacgaatcct gtttttgcag gcgcaaacta  300

    tgcggcttgg gccgtgaatg ttgcccaagt aattgatagt gagaccgcag acaacctgga  360

    aaagacgacc gcagcgttaa gcattttacc ggggattggt tccgtgatgg gtatagcgga  420

    tggagcggtc caccataaca ctgaggaaat tgtcgcccag tcaatcgctc tgagttccct  480

    gatggttgca caggctatcc cactcgtggg ggaactggtt gacataggtt tcgccgccta  540

    caacttcgta gaaagcatta ttaatctttt tcaggtggtg cataacagct acaaccgccc  600

    tctagaatga taaaagctt                                               619

     

    <210>81

    <211>1971

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>81

    ggatccatgg agttcgttaa caaacagttc aactataaag acccagttaa cggtgttgac   60

    attgcttaca tcaaaatccc gaacgctggc cagatgcagc cggtaaaggc attcaaaatc  120

    cacaacaaaa tctgggttat cccggaacgt gataccttta ctaacccgga agaaggtgac  180

    ctgaacccgc caccggaagc gaaacaggtg ccggtatctt actatgactc cacctacctg  240

    tctaccgata acgaaaagga caactacctg aaaggtgtta ctaaactgtt cgagcgtatt  300

    tactccaccg acctgggccg tatgctgctg actagcatcg ttcgcggtat cccgttctgg  360

    ggcggttcta ccatcgatac cgaactgaaa gtaatcgaca ctaactgcat caacgttatt  420

    cagccggacg gttcctatcg ttccgaagaa ctgaacctgg tgatcatcgg cccgtctgct  480

    gatatcatcc agttcgagtg taagagcttt ggtcacgaag ttctgaacct cacccgtaac  540

    ggctacggtt ccactcagta catccgtttc tctccggact tcaccttcgg ttttgaagaa  600

    tccctggaag tagacacgaa cccactgctg ggcgctggta aattcgcaac tgatcctgcg  660

    gttaccctgg ctcacgaact gattcatgca ggccaccgcc tgtacggtat cgccatcaat  720

    ccgaaccgtg tcttcaaagt taacaccaac gcgtattacg agatgtccgg tctggaagtt  780

    agcttcgaag aactgcgtac ttttggcggt cacgacgcta aattcatcga ctctctgcaa  840

    gaaaacgagt tccgtctgta ctactataac aagttcaaag atatcgcatc caccctgaac  900

    aaagcgaaat ccatcgtggg taccactgct tctctccagt acatgaagaa cgtttttaaa  960

    gaaaaatacc tgctcagcga agacacctcc ggcaaattct ctgtagacaa gttgaaattc 1020

    gataaacttt acaaaatgct gactgaaatt tacaccgaag acaacttcgt taagttcttt 1080

    aaagttctga accgcaaaac ctatctgaac ttcgacaagg cagtattcaa aatcaacatc 1140

    gtgccgaaag ttaactacac tatctacgat ggtttcaacc tgcgtaacac caacctggct 1200

    gctaatttta acggccagaa cacggaaatc aacaacatga acttcacaaa actgaaaaac  1260

    ttcactggtc tgttcgagtt ttacaagctg ctgtgcgtcg acggcatcat tacctccaaa  1320

    actaaatctc tgatagaagg tagatacggt ggtttcctgg cgctagcggg cggtggcggt  1380

    agcggcggtg gcggtagcgg cggtggcggt agcgcactag tgctgcagtg tatcaatctg  1440

    gattgggacg taatccgtga taagaccaaa acaaaaatcg agtctttgaa agaacacggc  1500

    ccgatcaaaa ataagatgtc tgaatcaccc aataaaactg tttcggagga aaaagcgaaa  1560

    cagtatttgg aagagtttca tcaaaccgcg cttgaacatc cggagctcag tgaactgaaa  1620

    acagtgacgg gaacgaatcc tgtttttgca ggcgcaaact atgcggcttg ggccgtgaat  1680

    gttgcccaag taattgatag tgagaccgca gacaacctgg aaaagacgac cgcagcgtta  1740

    agcattttac cggggattgg ttccgtgatg ggtatagcgg atggagcggt ccaccataac  1800

    actgaggaaa ttgtcgccca gtcaatcgct ctgagttccc tgatggttgc acaggctatc  1860

    ccactcgtgg gggaactggt tgacataggt ttcgccgcct acaacttcgt agaaagcatt  1920

    attaatcttt ttcaggtggt gcataacagc tacaaccgcc ctctagaatg a           1971

     

    <210>82

    <211>656

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>82

     

    Gly Ser Met Glu Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val

    1               5                   10                  15

    Asn Gly Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met

                20                  25                  30

    Gln Pro Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro

            35                  40                  45

    Glu Arg Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro

        50                  55                  60

    Pro Glu Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu

    65                  70                  75                  80

    Ser Thr Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu

                    85                  90                  95

    Phe Glu Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser

                100                 105                 110

    Ile Val Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu

            115                 120                 125

    Leu Lys Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly

        130                 135                 140

    Ser Tyr Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala

    145                 150                 155                 160

    Asp Ile Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn

                    165                 170                 175

    Leu Thr Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro

                180                 185                 190

    Asp Phe Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro

            195                 200                 205

    Leu Leu Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala

        210                 215                 220

    His Glu Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn

    225                 230                 235                 240

    Pro Asn Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser

                    245                 250                 255

    Gly Leu Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp

                260                 265                 270

    Ala Lys Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr

            275                 280                 285

    Tyr Asn Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser

        290                 295                 300

    Ile Val Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys

    305                 310                 315                 320

    Glu Lys Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp

                    325                 330                 335

    Lys Leu Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr

                340                 345                 350

    Glu Asp Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr

            355                 360                 365

    Leu Asn Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val

        370                 375                 380

    Asn Tyr Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala

    385                 390                 395                 400

    Ala Asn Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr

                    405                 410                 415

    Lys Leu Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys

                420                 425                 430

    Val Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg

            435                 440                 445

    Tyr Gly Gly Phe Leu Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly

        450                 455                 460

    Gly Ser Gly Gly Gly Gly Ser Ala Leu Val Leu Gln Cys Ile Asn Leu

    465                 470                 475                 480

    Asp Trp Asp Val Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu

                    485                 490                 495

    Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn Lys

                500                 505                 510

    Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His Gln

            515                 520                 525

    Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr Gly

        530                 535                 540

    Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val Asn

    545                 550                 555                 560

    Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys Thr

                    565                 570                 575

    Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly Ile

                580                 585                 590

    Ala Asp Gly Ala Val His His Asn Thr Glu Glu Ile Val Ala Gln Ser

            595                 600                 605

    Ile Ala Leu Ser Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val Gly

        610                 615                 620

    Glu Leu Val Asp Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser Ile

    625                 630                 635                 640

    Ile Asn Leu Phe Gln Val Val His Asn Ser Tyr Asn Arg Pro Leu Glu

                    645                 650                 655

     

    <210>83

    <211>1329

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>83

    ggatccatgc ctattactat taacaatttt cgttatagcg atcccgtcaa caatgacacc     60

    attatcatga tggaaccgcc atattgcaaa ggactggaca tttactataa agccttcaag    120

    attactgacc gcatttggat tgttccagag cgttacgagt tcgggacgaa accagaagat    180

    tttaacccgc cttcatcgct gatcgaagga gcatcagagt attacgatcc gaactatctg    240

    cgtacggaca gcgataaaga ccgcttctta cagaccatgg tcaaactttt taaccgtatt    300

    aagaacaatg tggccggaga agcactcttg gataagatta tcaacgcgat tccatacctg    360

    ggcaattctt acagcctgct ggataaattt gacacaaata gtaattcagt cagctttaac    420

    ctgttagaac aagatccgag tggcgcaacc acgaagtctg ccatgctgac aaatctgatc    480

    atttttggtc caggtcctgt actgaataaa aatgaagtac gcggcatcgt tctccgcgtg    540

    gacaataaga actacttccc atgccgtgac ggcttcggtt cgatcatgca gatggctttc  600

    tgtccggagt acgttccgac gtttgataat gttattgaga atatcacgag tttaacaatc  660

    ggtaagtcaa aatattttca agatccggcc cttctcctta tgcatgaact gattcacgtg  720

    ctgcacggct tatatggtat gcaagtgtcc tcgcatgaaa tcattccgtc caaacaggaa  780

    atttatatgc agcataccta cccgatttca gctgaagagt tgtttacgtt tggtggccag  840

    gacgcgaatt tgatctccat cgacatcaaa aacgatctgt atgagaaaac attaaatgac  900

    tataaagcga ttgcgaacaa actgtctcag gtgactagct gcaacgatcc taacattgat  960

    attgattcct acaaacaaat ttatcaacag aaataccagt tcgataaaga cagcaatggt 1020

    cagtatatcg taaacgaaga taaatttcag atcctgtata acagcattat gtatggcttt 1080

    accgaaattg agttggggaa gaaatttaac attaaaaccc gtctgtctta ttttagtatg 1140

    aaccatgatc cggtgaaaat ccccaatctg cttgatgata ccatttataa tgataccgaa 1200

    gggttcaaca ttgaatctaa ggatctgaaa tccgaataca aaggccaaaa tatgcgtgtt 1260

    aatactaacg ctttccgtaa tgttgatggt agtggactcg tctcgaaact gattgggttg 1320

    tgtgtcgac                                                         1329

     

    <210>84

    <211>2736

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>84

    ggatccatgc ctattactat taacaatttt cgttatagcg atcccgtcaa caatgacacc   60

    attatcatga tggaaccgcc atattgcaaa ggactggaca tttactataa agccttcaag  120

    attactgacc gcatttggat tgttccagag cgttacgagt tcgggacgaa accagaagat  180

    tttaacccgc cttcatcgct gatcgaagga gcatcagagt attacgatcc gaactatctg  240

    cgtacggaca gcgataaaga ccgcttctta cagaccatgg tcaaactttt taaccgtatt  300

    aagaacaatg tggccggaga agcactcttg gataagatta tcaacgcgat tccatacctg  360

    ggcaattctt acagcctgct ggataaattt gacacaaata gtaattcagt cagctttaac  420

    ctgttagaac aagatccgag tggcgcaacc acgaagtctg ccatgctgac aaatctgatc  480

    atttttggtc caggtcctgt actgaataaa aatgaagtac gcggcatcgt tctccgcgtg  540

    gacaataaga actacttccc atgccgtgac ggcttcggtt cgatcatgca gatggctttc  600

    tgtccggagt acgttccgac gtttgataat gttattgaga atatcacgag tttaacaatc  660

    ggtaagtcaa aatattttca agatccggcc cttctcctta tgcatgaact gattcacgtg  720

    ctgcacggct tatatggtat gcaagtgtcc tcgcatgaaa tcattccgtc caaacaggaa  780

    atttatatgc agcataccta cccgatttca gctgaagagt tgtttacgtt tggtggccag  840

    gacgcgaatt tgatctccat cgacatcaaa aacgatctgt atgagaaaac attaaatgac  900

    tataaagcga ttgcgaacaa actgtctcag gtgactagct gcaacgatcc taacattgat  960

    attgattcct acaaacaaat ttatcaacag aaataccagt tcgataaaga cagcaatggt 1020

    cagtatatcg taaacgaaga taaatttcag atcctgtata acagcattat gtatggcttt 1080

    accgaaattg agttggggaa gaaatttaac attaaaaccc gtctgtctta ttttagtatg 1140

    aaccatgatc cggtgaaaat ccccaatctg cttgatgata ccatttataa tgataccgaa  1200

    gggttcaaca ttgaatctaa ggatctgaaa tccgaataca aaggccaaaa tatgcgtgtt  1260

    aatactaacg ctttccgtaa tgttgatggt agtggactcg tctcgaaact gattgggttg  1320

    tgtgtcgacg gcatcattac ctccaaaact aaatctctga tagaaggtag atttggcggt  1380

    ttcacgggcg cacgcaaatc agcgcgtaaa cgtaagaacc aggcgctagc gggcggtggc  1440

    ggtagcggcg gtggcggtag cggcggtggc ggtagcgcac tagtgctgca gtgtatcaag  1500

    gttaacaact gggatttatt cttcagcccg agtgaagaca acttcaccaa cgacctgaac  1560

    aaaggtgaag aaatcacctc agatactaac atcgaagcag ccgaagaaaa catctcgctg  1620

    gacctgatcc agcagtacta cctgaccttt aatttcgaca acgagccgga aaacatttct  1680

    atcgaaaacc tgagctctga tatcatcggc cagctggaac tgatgccgaa catcgaacgt  1740

    ttcccaaacg gtaaaaagta cgagctggac aaatatacca tgttccacta cctgcgcgcg  1800

    caggaatttg aacacggcaa atcccgtatc gcactgacta actccgttaa cgaagctctg  1860

    ctcaacccgt cccgtgtata caccttcttc tctagcgact acgtgaaaaa ggtcaacaaa  1920

    gcgactgaag ctgcaatgtt cttgggttgg gttgaacagc ttgtttatga ttttaccgac  1980

    gagacgtccg aagtatctac taccgacaaa attgcggata tcactatcat catcccgtac  2040

    atcggtccgg ctctgaacat tggcaacatg ctgtacaaag acgacttcgt tggcgcactg  2100

    atcttctccg gtgcggtgat cctgctggag ttcatcccgg aaatcgccat cccggtactg  2160

    ggcacctttg ctctggtttc ttacattgca aacaaggttc tgactgtaca aaccatcgac  2220

    aacgcgctga gcaaacgtaa cgaaaaatgg gatgaagttt acaaatatat cgtgaccaac  2280

    tggctggcta aggttaatac tcagatcgac ctcatccgca aaaaaatgaa agaagcactg  2340

    gaaaaccagg cggaagctac caaggcaatc attaactacc agtacaacca gtacaccgag  2400

    gaagaaaaaa acaacatcaa cttcaacatc gacgatctgt cctctaaact gaacgaatcc  2460

    atcaacaaag ctatgatcaa catcaacaag ttcctgaacc agtgctctgt aagctatctg  2520

    atgaactcca tgatcccgta cggtgttaaa cgtctggagg acttcgatgc gtctctgaaa  2580

    gacgccctgc tgaaatacat ttacgacaac cgtggcactc tgatcggtca ggttgatcgt  2640

    ctgaaggaca aagtgaacaa taccttatcg accgacatcc cttttcagct cagtaaatat  2700

    gtcgataacc aacgcctttt gtccactcta gactag                            2736

     

    <210>85

    <211>911

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>85

     

    Gly Ser Met Pro Ile Thr Ile Asn Asn Phe Arg Tyr Ser Asp Pro Val

    1               5                   10                  15

    Asn Asn Asp Thr Ile Ile Met Met Glu Pro Pro Tyr Cys Lys Gly Leu

                20                  25                  30

    Asp Ile Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Val

            35                  40                  45

    Pro Glu Arg Tyr Glu Phe Gly Thr Lys Pro Glu Asp Phe Asn Pro Pro

        50                  55                  60

    Ser Ser Leu Ile Glu Gly Ala Ser Glu Tyr Tyr Asp Pro Asn Tyr Leu

    65                  70                  75                  80

    Arg Thr Asp Ser Asp Lys Asp Arg Phe Leu Gln Thr Met Val Lys Leu

                    85                  90                  95

    Phe Asn Arg Ile Lys Asn Asn Val Ala Gly Glu Ala Leu Leu Asp Lys

                100                 105                 110

    Ile Ile Asn Ala Ile Pro Tyr Leu Gly Asn Ser Tyr Ser Leu Leu Asp

            115                 120                 125

    Lys Phe Asp Thr Asn Ser Asn Ser Val Ser Phe Asn Leu Leu Glu Gln

        130                 135                 140

    Asp Pro Ser Gly Ala Thr Thr Lys Ser Ala Met Leu Thr Asn Leu Ile

    145                 150                 155                 160

    Ile Phe Gly Pro Gly Pro Val Leu Asn Lys Asn Glu Val Arg Gly Ile

                    165                 170                 175

    Val Leu Arg Val Asp Asn Lys Asn Tyr Phe Pro Cys Arg Asp Gly Phe

                180                 185                 190

    Gly Ser Ile Met Gln Met Ala Phe Cys Pro Glu Tyr Val Pro Thr Phe

            195                 200                 205

    Asp Asn Val Ile Glu Asn Ile Thr Ser Leu Thr Ile Gly Lys Ser Lys

        210                 215                 220

    Tyr Phe Gln Asp Pro Ala Leu Leu Leu Met His Glu Leu Ile His Val

    225                 230                 235                 240

    Leu His Gly Leu Tyr Gly Met Gln Val Ser Ser His Glu Ile Ile Pro

                    245                 250                 255

    Ser Lys Gln Glu Ile Tyr Met Gln His Thr Tyr Pro Ile Ser Ala Glu

                260                 265                 270

    Glu Leu Phe Thr Phe Gly Gly Gln Asp Ala Asn Leu Ile Ser Ile Asp

            275                 280                 285

    Ile Lys Asn Asp Leu Tyr Glu Lys Thr Leu Asn Asp Tyr Lys Ala Ile

        290                 295                 300

    Ala Asn Lys Leu Ser Gln Val Thr Ser Cys Asn Asp Pro Asn Ile Asp

    305                 310                 315                 320

    Ile Asp Ser Tyr Lys Gln Ile Tyr Gln Gln Lys Tyr Gln Phe Asp Lys

                    325                 330                 335

    Asp Ser Asn Gly Gln Tyr Ile Val Asn Glu Asp Lys Phe Gln Ile Leu

                340                 345                 350

    Tyr Asn Ser Ile Met Tyr Gly Phe Thr Glu Ile Glu Leu Gly Lys Lys

            355                 360                 365

    Phe Asn Ile Lys Thr Arg Leu Ser Tyr Phe Ser Met Asn His Asp Pro

        370                 375                 380

    Val Lys Ile Pro Asn Leu Leu Asp Asp Thr Ile Tyr Asn Asp Thr Glu

    385                 390                 395                 400

    Gly Phe Asn Ile Glu Ser Lys Asp Leu Lys Ser Glu Tyr Lys Gly Gln

                    405                 410                 415

    Asn Met Arg Val Asn Thr Asn Ala Phe Arg Asn Val Asp Gly Ser Gly

                420                 425                 430

    Leu Val Ser Lys Leu Ile Gly Leu Cys Val Asp Gly Ile Ile Thr Ser

            435                 440                 445

    Lys Thr Lys Ser Leu Ile Glu Gly Arg Phe Gly Gly Phe Thr Gly Ala

        450                 455                 460

    Arg Lys Ser Ala Arg Lys Arg Lys Asn Gln Ala Leu Ala Gly Gly Gly

    465                 470                 475                 480

    Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Leu Val Leu

                    485                 490                 495

    Gln Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu

                500                 505                 510

    Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp

            515                 520                 525

    Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln

        530                 535                 540

    Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser

    545                 550                 555                 560

    Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro

                    565                 570                 575

    Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr

                580                 585                 590

    Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser

            595                 600                 605

    Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser

        610                 615                 620

    Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys

    625                 630                 635                 640

    Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr

                    645                 650                 655

    Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala

                660                 665                 670

    Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly

            675                 680                 685

    Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly

        690                 695                 700

    Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu

    705                 710                 715                 720

    Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val

                    725                 730                 735

    Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu

                740                 745                 750

    Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln

            755                 760                 765

    Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala

        770                 775                 780

    Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu

    785                 790                 795                 800

    Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys

                    805                 810                 815

    Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu

                820                 825                 830

    Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly

            835                 840                 845

    Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu

        850                 855                 860

    Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg

    865                 870                 875                 880

    Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln

                    885                 890                 895

    Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Leu Asp

                900                 905                 910

     

    <210>86

    <211>180

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>86

    ggatccacgc acgtcgacgc gattgatggt cgttttggcg gtttcacggg cgcacgcaaa    60

    tcagcgcgta aacgtaagaa ccaggcgcta gcgggcggtg gcggtagcgg cggtggcggt  120

    agcggcggtg gcggtagcgc actagtgctg cagacgcacg gtctagaatg ataaaagctt  180

     

    <210>87

    <211>2715

    <212>DNA

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>87

    ggatccgaat tcatgccgat caccatcaac aacttcaact acagcgatcc ggtggataac   60

    aaaaacatcc tgtacctgga tacccatctg aataccctgg cgaacgaacc ggaaaaagcg  120

    tttcgtatca ccggcaacat ttgggttatt ccggatcgtt ttagccgtaa cagcaacccg  180

    aatctgaata aaccgccgcg tgttaccagc ccgaaaagcg gttattacga tccgaactat  240

    ctgagcaccg atagcgataa agataccttc ctgaaagaaa tcatcaaact gttcaaacgc  300

    atcaacagcc gtgaaattgg cgaagaactg atctatcgcc tgagcaccga tattccgttt  360

    ccgggcaaca acaacacccc gatcaacacc tttgatttcg atgtggattt caacagcgtt  420

    gatgttaaaa cccgccaggg taacaattgg gtgaaaaccg gcagcattaa cccgagcgtg  480

    attattaccg gtccgcgcga aaacattatt gatccggaaa ccagcacctt taaactgacc  540

    aacaacacct ttgcggcgca ggaaggtttt ggcgcgctga gcattattag cattagcccg  600

    cgctttatgc tgacctatag caacgcgacc aacgatgttg gtgaaggccg tttcagcaaa  660

    agcgaatttt gcatggaccc gatcctgatc ctgatgcatg aactgaacca tgcgatgcat  720

    aacctgtatg gcatcgcgat tccgaacgat cagaccatta gcagcgtgac cagcaacatc  780

    ttttacagcc agtacaacgt gaaactggaa tatgcggaaa tctatgcgtt tggcggtccg  840

    accattgatc tgattccgaa aagcgcgcgc aaatacttcg aagaaaaagc gctggattac  900

    tatcgcagca ttgcgaaacg tctgaacagc attaccaccg cgaatccgag cagcttcaac  960

    aaatatatcg gcgaatataa acagaaactg atccgcaaat atcgctttgt ggtggaaagc 1020

    agcggcgaag ttaccgttaa ccgcaataaa ttcgtggaac tgtacaacga actgacccag 1080

    atcttcaccg aatttaacta tgcgaaaatc tataacgtgc agaaccgtaa aatctacctg 1140

    agcaacgtgt ataccccggt gaccgcgaat attctggatg ataacgtgta cgatatccag 1200

    aacggcttta acatcccgaa aagcaacctg aacgttctgt ttatgggcca gaacctgagc 1260

    cgtaatccgg cgctgcgtaa agtgaacccg gaaaacatgc tgtacctgtt caccaaattt 1320

    tgcgtcgacg cgattgatgg tcgttttggc ggtttcacgg gcgcacgcaa atcagcgcgt 1380

    aaacgtaaga accaggcgct agcgggcggt ggcggtagcg gcggtggcgg tagcggcggt 1440

    ggcggtagcg cactagtgct gcagtgtcgt gaactgctgg tgaaaaacac cgatctgccg 1500

    tttattggcg atatcagcga tgtgaaaacc gatatcttcc tgcgcaaaga tatcaacgaa 1560

    gaaaccgaag tgatctacta cccggataac gtgagcgttg atcaggtgat cctgagcaaa 1620

    aacaccagcg aacatggtca gctggatctg ctgtatccga gcattgatag cgaaagcgaa 1680

    attctgccgg gcgaaaacca ggtgttttac gataaccgta cccagaacgt ggattacctg 1740

    aacagctatt actacctgga aagccagaaa ctgagcgata acgtggaaga ttttaccttt 1800

    acccgcagca ttgaagaagc gctggataac agcgcgaaag tttacaccta ttttccgacc 1860

    ctggcgaaca aagttaatgc gggtgttcag ggcggtctgt ttctgatgtg ggcgaacgat  1920

    gtggtggaag atttcaccac caacatcctg cgtaaagata ccctggataa aatcagcgat  1980

    gttagcgcga ttattccgta tattggtccg gcgctgaaca ttagcaatag cgtgcgtcgt  2040

    ggcaatttta ccgaagcgtt tgcggttacc ggtgtgacca ttctgctgga agcgtttccg  2100

    gaatttacca ttccggcgct gggtgcgttt gtgatctata gcaaagtgca ggaacgcaac  2160

    gaaatcatca aaaccatcga taactgcctg gaacagcgta ttaaacgctg gaaagatagc  2220

    tatgaatgga tgatgggcac ctggctgagc cgtattatca cccagttcaa caacatcagc  2280

    taccagatgt acgatagcct gaactatcag gcgggtgcga ttaaagcgaa aatcgatctg  2340

    gaatacaaaa aatacagcgg cagcgataaa gaaaacatca aaagccaggt tgaaaacctg  2400

    aaaaacagcc tggatgtgaa aattagcgaa gcgatgaata acatcaacaa attcatccgc  2460

    gaatgcagcg tgacctacct gttcaaaaac atgctgccga aagtgatcga tgaactgaac  2520

    gaatttgatc gcaacaccaa agcgaaactg atcaacctga tcgatagcca caacattatt  2580

    ctggtgggcg aagtggataa actgaaagcg aaagttaaca acagcttcca gaacaccatc  2640

    ccgtttaaca tcttcagcta taccaacaac agcctgctga aagatatcat caacgaatac  2700

    ttcaatctag actag                                                   2715

     

    <210>88

    <211>904

    <212>PRT

    <213>人工序列

     

    <220>

    <223>合成的

     

    <400>88

     

    Gly Ser Glu Phe Met Pro Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp

    1               5                   10                  15

    Pro Val Asp Asn Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr

                20                  25                  30

    Leu Ala Asn Glu Pro Glu Lys Ala Phe Arg Ile Thr Gly Asn Ile Trp

            35                  40                  45

    Val Ile Pro Asp Arg Phe Ser Arg Asn Ser Asn Pro Asn Leu Asn Lys

        50                   55                   60

    Pro Pro Arg Val Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr

    65                  70                  75                  80

    Leu Ser Thr Asp Ser Asp Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys

                    85                  90                  95

    Leu Phe Lys Arg Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr

                100                 105                 110

    Arg Leu Ser Thr Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile

            115                 120                 125

    Asn Thr Phe Asp Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr

        130                 135                 140

    Arg Gln Gly Asn Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val

    145                 150                 155                 160

    Ile Ile Thr Gly Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr

                    165                 170                 175

    Phe Lys Leu Thr Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala

                180                 185                 190

    Leu Ser Ile Ile Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn

            195                 200                 205

    Ala Thr Asn Asp Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys

        210                 215                 220

    Met Asp Pro Ile Leu Ile Leu Met His Glu Leu Asn His Ala Met His

    225                 230                 235                 240

    Asn Leu Tyr Gly Ile Ala Ile Pro Asn Asp Gln Thr Ile Ser Ser Val

                    245                 250                 255

    Thr Ser Asn Ile Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala

                260                 265                 270

    Glu Ile Tyr Ala Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser

            275                 280                 285

    Ala Arg Lys Tyr Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile

        290                 295                 300

    Ala Lys Arg Leu Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn

    305                 310                 315                 320

    Lys Tyr Ile Gly Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe

                    325                 330                 335

    Val Val Glu Ser Ser Gly Glu Val Thr Val Asn Arg Asn Lys Phe Val

                340                 345                 350

    Glu Leu Tyr Asn Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala

            355                 360                 365

    Lys Ile Tyr Asn Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr

        370                 375                 380

    Thr Pro Val Thr Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln

    385                 390                 395                 400

    Asn Gly Phe Asn Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly

                    405                 410                 415

    Gln Asn Leu Ser Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn

                420                 425                 430

    Met Leu Tyr Leu Phe Thr Lys Phe Cys Val Asp Ala Ile Asp Gly Arg

            435                 440                 445

    Phe Gly Gly Phe Thr Gly Ala Arg Lys Ser Ala Arg Lys Arg Lys Asn

        450                 455                 460

    Gln Ala Leu Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

    465                 470                 475                 480

    Gly Gly Ser Ala Leu Val Leu Gln Cys Arg Glu Leu Leu Val Lys Asn

                    485                 490                 495

    Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Val Lys Thr Asp Ile

                500                 505                 510

    Phe Leu Arg Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Tyr Tyr Pro

            515                 520                 525

    Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr Ser Glu

        530                 535                 540

    His Gly Gln Leu Asp Leu Leu Tyr Pro Ser Ile Asp Ser Glu Ser Glu

    545                 550                 555                 560

    Ile Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr Gln Asn

                    565                 570                 575

    Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser

                580                 585                 590

    Asp Asn Val Glu Asp Phe Thr Phe Thr Arg Ser Ile Glu Glu Ala Leu

            595                 600                 605

    Asp Asn Ser Ala Lys Val Tyr Thr Tyr Phe Pro Thr Leu Ala Asn Lys

        610                 615                 620

    Val Asn Ala Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala Asn Asp

    625                 630                 635                 640

    Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr Leu Asp

                    645                 650                 655

    Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro Ala Leu

                660                 665                 670

    Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala Phe Ala

            675                 680                 685

    Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Pro Glu Phe Thr Ile

        690                 695                 700

    Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu Arg Asn

    705                 710                 715                 720

    Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile Lys Arg

                    725                 730                 735

    Trp Lys Asp Ser Tyr Glu Trp Met Met Gly Thr Trp Leu Ser Arg Ile

                740                 745                 750

    Ile Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser Leu Asn

            755                 760                 765

    Tyr Gln Ala Gly Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys

        770                 775                 780

    Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu

    785                 790                 795                 800

    Lys Asn Ser Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn

                    805                 810                 815

    Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu

                820                 825                 830

    Pro Lys Val Ile Asp Glu Leu Asn Glu Phe Asp Arg Asn Thr Lys Ala

            835                 840                 845

    Lys Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu

        850                 855                 860

    Val Asp Lys Leu Lys Ala Lys Val Asn Asn Ser Phe Gln Asn Thr Ile

    865                 870                 875                 880

    Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile

                    885                 890                 895

    Ile Asn Glu Tyr Phe Asn Leu Asp

                900

    关 键  词:
    通过 使用 多肽 融合 蛋白 进行 疼痛 治疗
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:通过使用单链多肽融合蛋白进行疼痛的治疗.pdf
    链接地址:https://www.zhuanlichaxun.net/p-8437365.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1