书签 分享 收藏 举报 版权申诉 / 65

新的Β肌动蛋白和RPS21启动子及其应用.pdf

  • 上传人:xia****o6
  • 文档编号:865130
  • 上传时间:2018-03-15
  • 格式:PDF
  • 页数:65
  • 大小:1.21MB
  • 摘要
    申请专利号:

    CN201010145615.5

    申请日:

    2004.06.24

    公开号:

    CN101942442A

    公开日:

    2011.01.12

    当前法律状态:

    授权

    有效性:

    有权

    法律详情:

    授权|||实质审查的生效IPC(主分类):C12N 15/113申请日:20040624|||公开

    IPC分类号:

    C12N15/113(2010.01)I; C12N15/63

    主分类号:

    C12N15/113

    申请人:

    建新公司

    发明人:

    S·D·埃斯蒂斯; W·张

    地址:

    美国马萨诸塞州

    优先权:

    2003.06.24 US 60/480,768

    专利代理机构:

    北京市柳沈律师事务所 11105

    代理人:

    张红春

    PDF完整版下载: PDF下载
    内容摘要

    本发明涉及新的β-肌动蛋白和核糖体蛋白S21(rpS21)启动子的分离及应用。特别地,本发明的特征为包括仓鼠、大鼠和小鼠的啮齿动物β-肌动蛋白启动子和仓鼠rpS21启动子的序列。

    权利要求书

    1: 一种选自 SEQ ID NOs : 1、 2、 3 的核苷酸序列的分离的啮齿动物 β- 肌动蛋白启动子 或其具有启动子活性的变种。
    2: 一种 SEQ ID NO : 1 中列出的分离的仓鼠 β- 肌动蛋白启动子核苷酸序列, 或其具有 启动子活性的变种。
    3: 一种 SEQ ID NO : 2 中列出的分离的大鼠 β- 肌动蛋白启动子核苷酸序列, 或其具有 启动子活性的变种。
    4: 一种 SEQ ID NO : 3 中列出的分离的小鼠 β- 肌动蛋白启动子核苷酸序列, 或其具有 启动子活性的变种。
    5: 一个包括 SEQ ID NO : 1 中列出的核苷酸序列的分离的核酸, 或其具有启动子活性的 变种。
    6: 一个包括 SEQ ID NO : 2 中列出的核苷酸序列的分离的核酸, 或其具有启动子活性的 变种。
    7: 一个载体, 其包括 SEQ ID NO : 1 中的启动子, 或其具有启动子活性的变种。
    8: 一个载体, 其包括 SEQ ID NO : 2 中的启动子, 或其具有启动子活性的变种。
    9: 一个载体, 其包括 SEQ ID NO : 3 中的启动子, 或其具有启动子活性的变种。
    10: 根据权利要求 7-9 的任何一项所述的载体, 其中启动子被可操作地连接到异源核 酸上。

    说明书


    新的 β- 肌动蛋白和 RPS21 启动子及其应用

        本申请是申请日为 2004 年 06 月 24 日、 申请号为 200480017948.2( 国际申请号为 PCT/US2004/017422)、 发明名称为 “新的 β- 肌动蛋白和 RPS21 启动子及其应用” 的发明申 请的分案申请。
         本发明要求 2003 年 6 月 24 日提交的美国临时申请 No.60/480,768 的优先权, 该 申请引作参考而并入此文。
         技术领域
         本发明涉及调节基因元件, 如启动子及其应用, 例如, 在表达蛋白中的应用。更特 别地, 本发明涉及 β- 肌动蛋白和核糖体蛋白 S21 基因的启动子。 技术背景
         每种真核基因含有驱动该基因转录的调节元件。 该调节元件包括典型地直接位于 该基因编码区上游的启动子。作为转录机制的一部分, 启动子通过提供转录因子的结合位 点来调节转录。启动子通常被用于在细胞培养中和体内表达蛋白质。很多启动子是已知的 并被用于各种表达系统中表达蛋白质。启动子的例子包括巨细胞病毒 (CMV) 立即早期启动 子、 劳氏肉瘤病毒基因组大基因组长末端重复 (RSV)、 猿病毒 40(SV40) 启动子、 干扰素基因 启动子、 金属硫因启动子、 和胸腺嘧啶激酶启动子及其它, 如 Fernandez 等人 (1999) 在 Gene ExpressionSystem, Academic Press 中所描述的。然而, 在本领仍需要提供一种可以产生 高表达水平和 / 或在长时间内维持表达的启动子。
         β- 肌动蛋白是一种结构蛋白, 其通常在从原核到真核, 包括人的所有物种中表 达。先前描述了人和鸡的 β- 肌动蛋白启动子。一般而言, β- 肌动蛋白启动子表现出比 广泛被应用的 CMV 启动子更普遍的活性 (Xu 等 (2001)Gene 272 : 149-156)。仅仅当其被连 接到 CMV 增强子 序列时, 鸡的 β- 肌动蛋白启动子比病毒 CMV 和 SV40 启动子具有更高的 活性 (Xu 等, supra)。
         核糖体蛋白 S21(rpS21) 与核糖体 40S 亚单位有关。人的 rpS21 基因的启动子已 被鉴别 ( 接收号 No.AJ250907)。与大多数核糖体启动子基因相似, 其缺少传统 的转录元件, 如 TATA 盒和 CAAT 序列 (Smirnova 等 (2000)Bioorg.Khim.26(5) : 392-396)。 发明内容
         本发明提供了一种新的 β- 肌动蛋白启动子, 其与前述公知的 β- 肌动蛋白启动 子相比具有低水平的序列同源性 ( 如, 人或鸡 )。本发明还提供了新的 rpS21 启动子, 其与 前述公知的 rpS21 启动子相比具有低水平的序列同源性 ( 如, 人或小鼠 )。
         本发明部分基于对中国仓鼠卵巢细胞 (CHO) 系来源的 β- 肌动蛋白和 rpS21 启动 子的发现和分离。本发明进一步部分基于仓鼠 β- 肌动蛋白启动子比 CMV 启动子具有显著 的高活性的观察。本发明进一步部分基于当被用于表达一定基因时, rpS21 启动子至少具 有与仓鼠 β- 肌动蛋白启动子相同的活性的观察。本发明提供了这些启动子的核酸序列,并包括具有启动子活性的各种核酸序列的变种。在一些实施例中, 本发明的 β- 肌动蛋白 启动子来源于啮齿类, 如仓鼠、 大鼠和小鼠。典型地 rpS21 启动子来源于仓鼠。
         本发明进一步提供了含有可操作地连接到异源核酸上的本发明的 β- 肌动蛋白 或 rpS21 启动子的载体。在某些实施例中, 本发明的载体包括可操作地连接到异源核酸上 的启动子, 该异源核酸编码异源表达产物, 如治疗蛋白质或其片段。在示例性实施例中, 表 达产物是酸性鞘磷脂酶 (ASM)、 α- 葡萄糖苷酶 (GAA)、 或组织血浆酶原激活剂 (tPA)。
         本发明还提供了用本发明的载体转染的宿主细胞。在描述性实施例中, 宿主细胞 是哺乳动物细胞, 如 CHO、 HEK 和 BHK。
         本发明还提供了用于产生蛋白质的方法。 产生蛋白质的方法包括, 例如, 培养转染 细胞, 该细胞用含有可操作地连接到编码蛋白质的异源核酸上的本发明的 β- 肌动蛋白启 动子和 / 或 rpS21 启动子的载体转染的细胞, 以及回收蛋白质。在一些实施例中, 异源表达 产物是分泌 蛋白, 其从培养基中被回收。在描述性实施例中, 蛋白质是 ASM、 GAA、 或 tPA。
         本发明还涉及 :
         1. 一种选自 SEQ ID NOs : 1、 2、 3 的核苷酸序列的分离的啮齿动物 β- 肌动蛋白启 动子或其具有启动子活性的变种。 2. 一种 SEQ ID NO : 1 中列出的分离的仓鼠 β- 肌动蛋白启动子核苷酸序列, 或其 具有启动子活性的变种。
         3. 一种 SEQ ID NO : 2 中列出的分离的大鼠 β- 肌动蛋白启动子核苷酸序列, 或其 具有启动子活性的变种。
         4. 一种 SEQ ID NO : 3 中列出的分离的小鼠 β- 肌动蛋白启动子核苷酸序列, 或其 具有启动子活性的变种。
         5. 一个包括 SEQ ID NO : 1 中列出的核苷酸序列的分离的核酸, 或其具有启动子活 性的变种。
         6. 一个包括 SEQ ID NO : 2 中列出的核苷酸序列的分离的核酸, 或其具有启动子活 性的变种。
         7. 一个载体, 其包括 SEQ ID NO : 1 中的启动子, 或其具有启动子活性的变种。
         8. 一个载体, 其包括 SEQ ID NO : 2 中的启动子, 或其具有启动子活性的变种。
         9. 一个载体, 其包括 SEQ ID NO : 3 中的启动子, 或其具有启动子活性的变种。
         10. 根据权利要求 7-9 的任何一项所述的载体, 其中启动子被可操作地连接到异 源核酸上。
         11. 根据权利要求 10 所述的载体, 其中异源核酸编码治疗性蛋白。
         12. 根据权利要求 11 所述的载体, 其中治疗性蛋白选自酸性鞘磷脂酶、 α- 葡萄糖 苷酶或组织血浆酶原激活剂。
         13. 用权利要求 7-12 的任何一项的所述的载体转染的宿主细胞。
         14. 根据权利要求 13 的宿主细胞, 其中细胞是 CHO 细胞。
         15. 一种生产蛋白质的方法, 其包括 :
         (a) 培养用含有仓鼠 β- 肌动蛋白启动子或其变种的载体转染的细胞, 该启动子 或其变种被可操作地连接到编码该蛋白质的核酸上, 和;
         (b) 回收蛋白质。
         16. 根据权利要求 15 所述的方法, 其中蛋白质是抗体。
         17. 根据权利要求 16 所述的方法, 其中抗体结合 TGF-β 族成员。
         18. 根据权利要求 15 所述的方法, 其中蛋白质是治疗性蛋白。
         19. 根据权利要求 18 所述的方法, 其中治疗性蛋白选自酸性鞘磷脂酶、 α- 葡萄糖 苷酶或组织血浆酶原激活剂。
         20. 含有权利要求 1-6 的任何一项所述的启动子的转基因动物。
         21. 根据权利要求 20 所述的转基因动物, 其中动物是哺乳动物。
         22. 具有 SEQ ID NO : 39 的核苷酸序列的分离的 rpS21 启动子, 或其具有启动子活 性的变种。
         23. 含有 SEQID NO : 39 的核苷酸序列或其具有启动子活性的变种的载体。
         24. 根据权利要求 23 所述的载体, 其中核苷酸序列被可操作地连接到异源核酸 上。
         25. 根据权利要求 24 所述的载体, 其中异源核酸编码治疗性蛋白。
         26. 根据权利要求 25 所述的载体, 其中治疗性蛋白是 α- 葡萄糖苷酶或酸性鞘磷 脂酶。
         27. 用权利要求 23-26 的任何一项所述的载体转染的宿主细胞。
         28. 根据权利要求 27 所述的宿主细胞, 其中细胞是 CHO 细胞。
         29. 一种生产蛋白的方法, 其包括 :
         (a) 培养用含有仓鼠 rpS21 启动子或其变种的载体转染的细胞, 该启动子或其变 种被可操作地连接到该编码蛋白质的核酸上, 和;
         (b) 回收蛋白质。
         30. 根据权利要求 29 所述的方法, 其中蛋白是抗体。
         31. 根据权利要求 29 所述的方法, 其中蛋白是治疗性蛋白。
         32. 根据权利要求 31 所述的方法, 其中治疗性蛋白是 α- 葡萄糖苷酶或酸性鞘磷 脂酶。
         33. 一种含有权利要求 22 所述的启动子的转基因动物。
         34. 根据权利要求 33 所述的转基因动物, 其中动物是哺乳动物。
         35. 一种分离的 β- 肌动蛋白启动子, 其核苷酸序列作为 ATCC 参考号 PTA-5309 被保藏, 其分类命名为 : 含有克隆到噬菌粒载体 pBluescript II KS+ 的 β- 肌动蛋白启 动子的仓鼠基因组克隆 : pBlueβ- 肌动蛋白 /Avr(Hamster genomic clone containing β-actinpromoter cloned in phagemid vector pBlueScript II KS+ : pBlueβ-actin/ Avr), 保藏单位为美国典型培养物保藏中心 (American TypeCulture Collection, ATCC), 保藏日为 2003 年 7 月 3 日。
         36. 一种分离的 rpS21 启动子, 其核苷酸序列作为 ATCC 参考号 _____ 被保藏。 附图说明 图 1A 显示了仓鼠 β- 肌动蛋白启动子部分核苷酸序列 (SEQ ID NO : 1) 与大鼠 β- 肌动蛋白启动子 (SEQ ID NO : 2) 的比对, 显示出 SEQ IDNO : 1 中的核苷酸 487-893 与 SEQ ID NO : 2 中的核苷酸 1-417 具有 79%的同一性。大鼠 β- 肌动蛋白启动子 (SEQ ID NO : 2)
         与仓鼠 β- 肌动蛋白启动子 (SEQ ID NO : 1) 的全长相比具有 67%的同一性。
         图 1B 显示了仓鼠 β- 肌动蛋白启动子部分核苷酸序列 (SEQ ID NO : 1) 与大鼠 β- 肌动蛋白启动子 (SEQ ID NO : 2) 的比对, 显示出 SEQ IDNO : 1 中的核苷酸 1047-3006 与 SEQ ID NO : 2 中的核苷酸 546-2493 具有 83%的同一性。
         图 2A 显示了仓鼠 β- 肌动蛋白启动子部分核苷酸序列 (SEQ ID NO : 1) 与小鼠 β- 肌动蛋白启动子 (SEQ ID NO : 3) 的比对, 显示出 SEQ IDNO : 1 中的核苷酸 33-487 与 SEQ ID NO : 3 中的核苷酸 1-449 具有 84%的同一性。小鼠 β- 肌动蛋白启动子 (SEQ ID NO : 3) 与仓鼠 β- 肌动蛋白启动子 (SEQ ID NO : 1) 的全长相比具有 80%的同一性。
         图 2B 显示了仓鼠 β- 肌动蛋白启动子部分核苷酸序列 (SEQ ID NO : 1) 与小鼠 β- 肌动蛋白启动子 (SEQ ID NO : 3) 的比对, 显示出 SEQ IDNO : 1 中的核苷酸 996-3006 与 SEQ ID NO : 1 中的核苷酸 921-2953 具有 83%的同一性。
         图 3 显示了仓鼠 β- 肌动蛋白启动子部分核苷酸序列 (SEQ ID NO : 1) 与仓鼠 β- 肌动蛋白基因 ( 接收号 No.U20114 ; SEQ ID NO : 4) 的比对, 显示出 SEQ ID NO : 1 中的核苷酸 1775-3006 与 SEQ ID NO : 4 中的核苷酸 1-1232 具有 98%的同一性。仓 鼠 β- 肌动蛋白基因序列与 仓鼠 β- 肌动蛋白启动子序列 (SEQ ID NO : 1) 的全长相比具 有 40%的同一性。 图 4 显示了仓鼠 β- 肌动蛋白启动子部分核苷酸序列 (SEQ ID NO : 1) 与在先已知 的人 β- 肌动蛋白启动子 ( 接收号 No.gi28337 ; SEQ ID NO : 5) 的比对, 显示出 SEQ ID NO : 1 中的核苷酸 113-148 与 SEQ ID NO : 5 中的核苷酸 38-73 具有 94%的同一性, SEQ ID NO : 1 中的核苷酸 362-433 与 SEQ ID NO : 5 中的核苷酸 303-374 具有 83%的同一 性, SEQ ID NO : 1 中的核苷酸 1728-1764 与 SEQ ID NO : 5 中的核苷酸 1791-1830 具有 90% 的同一性, SEQ ID NO : 1 中的核苷酸 1797-1966 与 SEQ ID NO : 5 中的核苷酸 1840-2007 具 有 91%的同一性。仓鼠 β- 肌动蛋白启动子序列 (SEQ ID NO : 5) 与人 β- 肌动蛋白启动 子 (SEQ IDNO : 1) 的全长相比具有 10%的同一性。
         图 5 显示了仓鼠 β- 肌动蛋白启动子核苷酸序列 (SEQ ID NO : 1) 与先前已知的鸡 β- 肌动蛋白启动子 ( 接收号 No.gi217043 ; SEQ ID NO : 6) 的比对, 显示出 SEQ ID NO : 1 中的核苷酸 1878-1919 与 SEQ ID NO : 6 中的核苷酸 186-227 具有 83%的同一性。 鸡的 β- 肌动蛋白启动子序列 (SEQ ID NO : 6) 与仓鼠 β- 肌动蛋白启动子 (SEQIDNO : 1) 的 全长相比具有 1%的同一性。
         图 6A 描述了 CHO-K1 细胞中的半乳糖结合蛋白、 铁蛋白和 β- 肌动蛋白的 RNA 斑 点印迹。mRNAs 分别分离自放射菌素 D 处理后 0、 4、 8、 10 和 15 小时后的细胞。
         图 6B 描述了半乳糖结合蛋白、 铁蛋白和 β- 肌动蛋白的相对 mRNA 表达水平。 mRNAs 分别分离自放射菌素 D 处理后的 CHO-K1 细胞 10、 4、 8、 10 和 15 小时后的细胞。
         图 7A 描述了在 CHO-K1 细胞中的瞬时转染分析检测下列启动子的相对启动子强 度: CMV、 人 EF-1、 仓鼠 GAPDH、 仓鼠 rpS21 和仓鼠 β- 肌动蛋白。在 pDsRED-1 质粒中启动子 分别被克隆到红色荧光蛋白 (RFP) 基因的上游。用 FACS 检测荧光。
         图 7B 描述了在 CHO-K1 细胞中的稳定转染分析检测中下列启动子的相对启动子强 度: CMV、 人 EF-1、 仓鼠 GAPDH、 仓鼠 rpS21_ 和仓鼠 β- 肌动蛋白。在 pDsRED-1 质粒中分别 将启动子被克隆到红色荧光蛋 白 (RFP) 基因的上游。用 FACS 检测平均荧光。
         图 8A 描述了在来源于三个被含有可操作地连接到 CMV 启动子或仓鼠 β- 肌动蛋 白启动子上的 ASM cDNA 的载体转染的 CHO-DXB11 细胞池的培养基中酸性鞘磷脂酶 (ASM) 蛋白的表达。用分析 ASM 酶活性的分析方法分析 ASM 的表达。
         图 8B 描述了在来源于三个被含有可操作地连接到 CMV 启动子或仓鼠 β- 肌动蛋 白启动子上的 GAA cDNA 的载体转染的 CHO-DXB11 细胞池的培养基中 α- 葡萄糖苷酶 (GAA) 蛋白的表达。用分析 α- 葡萄糖苷酶 (GAA) 蛋白酶活性的分析方法分析 GAA 的表达。
         图 9 描述了在来源于被含有可操作地连接到仓鼠 β- 肌动蛋白启动子上的 tPA cDNA 的载体转染的 CHO-DXB11 细胞池的培养基中 tPA 蛋白的表达。用 ELISA 方法分析 tPA 的表达。 具体实施方式
         为了更容易地理解本发明, 首先对术语进行定义。另外的定义在贯穿说明书的详 细说明中列出。
         术语 “启动子” 指调节元件, 其指导与其可操作地连接的核酸的转录。启动子可以 调节可操作地连接到其上的核酸的转录速率和效率。 启动子还可以被可操作地连接到其它 的调节元件上, 其可增强 (“增强子” ) 或抑制 (“抑制子” ) 启动子依赖的的核酸转录。术 语 “可操作地连接” 指处于与其它核酸有功能关系的位置的核酸。启动子通常位于核酸转 录起始点的 5’ 端 ( 即, 上游 )。然而, 启动子可以包括转录起始点的 3’ 端 ( 即, 下游 )。启 动子还可以包括可操作地连接的核酸的转录起始点的 5’ 和 3’ 端。 术语 “启动子活性” 指启动子启动与其可操作连接的核酸转录的能力。可以应用 本领域公知的或实施例中描述的方法检测启动子活性。例如, 可以通过测量被转录的 mRNA 的量测量启动子的活性, 例如, RNA 印迹或聚合酶链反应 (PCR)。可供选择地, 可以通过测 量被翻译的蛋白产物的量测量启动子的活性, 例如, 蛋白印迹、 ELISA、 如 Bradford 分析 (Bradford(1976)Anal.Biochem., 72 : 248) 的色比色分析和各种活性分析, 包括报告基因 分析和其他本领域公知的或实施例中描述 的方法。
         术语 “载体” 指可以携带其他核酸的病毒或非病毒、 原核或真核、 脱氧核糖核酸、 核 糖核酸或核酸类似物。载体可携带核酸进入被称为 “宿主细胞” 的细胞, 从而使核酸的全部 或部分被转录或表达。 可供选择地, 载体可被用于体外转录分析中。 载体通常来源于不同病 毒、 细菌或哺乳动物基因元件的组合物装配而成。载体含有各种包括编码选择性标记 ( 如, 抗生素抗性基因 )、 有助于其在细菌中增殖的序列、 或仅在某些细胞类型中表达的一个或多 个转录单位的编码和非编码序列。例如, 哺乳动物表达载体通常即含有有助于载体在细菌 中增殖的原核序列, 又含有仅在真核细胞中表达的一个或多个真核转录单位。本领域技术 人员应该理解载体的设计取决于如所选择的被转染的宿主细胞、 所需的蛋白质表达水平等 因素。
         载体包括例如, 质粒、 噬菌粒和病毒载体。对于已具有启动子的载体, 可以使用本 领域熟知的标准重组 DNA 技术对载体进行修饰, 从而用任何 SEQ ID NOs : 1、 2、 3 或 39 或其变 种列出的启动子序列取代已存在的启动子序列, 。 一般而言, 合适的载体或者可以选自商售 的那些, 也可以应用本领域熟知的标准重组 DNA 技术构建。( 见, 如 Molecular Cloning : A nd Laboratory Manual : 2 edition, Sambrook etal., 1989, Cold Spring Harbor Laboratory
         Press.) 术语 “转化” 和 “转染” 指向细胞内导入核酸。可以使用本领域熟知的方法或此处 描述的方法将核酸导入植物或动物细胞, 或原核或真核细胞。
         术语 “分离的” 指使用不是自然发生的方式, 从其他核酸序列中分离的脱氧核糖核 酸、 核糖核酸、 或多聚核苷酸的核酸类似物。 分离的核酸包括使用本领域的标准技术部分或 全部化学地或重组地合成和 / 或纯化的核酸。
         涉及启动子的术语 “变种” 指如果变种具有启动子活性, 则与启动子序列全长或其 互补链全长基本上具有同一性的核苷酸序列。
         只要其长度至少有 1250 个核苷酸 β- 肌动蛋白启动子的变种可以与 SEQ ID NOs : 1、 2 或 3 的核苷酸序列同样长、 或短。只要其具启动子活性 rpS21 启动子的变种可以与 SEQ ID NOs : 39 的核苷酸序列同样长、 或短。β- 肌动蛋白启动子的变种可以是自然发生的, 如从除人和鸡以外的物种分离的自然发生的 β- 肌动蛋白, 或人工生成的 β- 肌动蛋白启 动子。当被最优比对时, 在 SEQ ID NO : 1 序列的核苷酸 1-3007 的全长上, SEQ ID NO : 1列 出的仓鼠 β- 肌动蛋白启动子与其变种之间的同一性至少为 45%、 50%、 55%、 60%、 65%、 70 %、 75 %、 80 %、 85 %、 90 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %、 或 99 %。相似地, 在 SEQID NO : 2 列出的序列的核苷酸 1-2493 的全长上, SEQ ID NO : 2 的大鼠 β- 肌动蛋白 启动子与其变种之间的同一性至少为 60%、 65%、 70%、 75%、 80%、 85%、 90%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 或 99%。SEQ ID NO : 3 序列的核苷酸 1-2953 的全长上, SEQ ID NO : 3 的小鼠 β- 肌动蛋白启动子与其变种之间的同一性至少为 55%、 60%、 65%、 70%、
         75%、 80%、 85%、 90%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 或 99%。 相似地, 在 SEQ ID NO : 39 列出的序列的核苷酸 1-1958 的全长上, SEQ ID NO : 39 的仓鼠 rpS21 启动子与其变种 之间在最优比对时的同一性, 至少为 40%、 50%、 55%、 60%、 65%、 70%、 80%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 或 99%。
         β- 肌动蛋白启动子的变种可以, 例如, 包括其他物种中的 β- 肌动蛋白启动子的 同源物 (orthologs), 其他物种包括啮齿动物和其他哺乳动物, 但除外人和鸡 β- 肌动蛋白 启动子及其已知的变种。 本发明的启动子的变种还可以在其他啮齿动物中被发现, 如豚鼠、 花白旱獭、 麝鼠、 沙鼠、 松鼠、 花栗鼠、 土拨鼠、 海狸、 豪猪和野鼠。
         术语 “变种” 进一步包括具有启动子活性的任何一个或多个本发明启动子的片段。 β- 肌动蛋白启动子的变种具有至少 1250 核苷酸的长度。例如, 可通过 5’ 端切断 SEQ ID NO : 1 中列出的的仓鼠 β- 肌动蛋白启动子的而衍生出本发明的 β- 肌动蛋白启动子。 在一 些实施方案中, β- 肌动蛋白启动子的变种包括 SEQ ID NO : 1 的核苷酸 50-3000、 100-3000、 150-3000、 200-3000、 250-3000、 500-3000、 1000-3000、 或 1500-3000 的序列。在另一些实施 例中, 可通过 5’ 端切断 SEQ ID NO : 2 中序列而衍生出 β- 肌动蛋白启动子, 例如包括 SEQ ID NO : 2 的核苷酸 50-2490、 100-2490、 150-2490、 200-2490、 250-2490、 500-2490、 或 1000-2490 的序列。还可通过 5’ 端切断 SEQ ID NO : 3 中序列而衍生 出 β- 肌动蛋白启动子, 其包括 例如, SEQ ID NO : 3 的核苷酸 50-2950、 100-2950、 150-2950、 200-2950、 250-2950、 500-2950、 1000-2950 或 1500-2950 的序列。例如, 可以通过切断 SEQ ID NO : 7 中较长的仓鼠启动子 核苷酸序列的 5’ 端而衍生出仓鼠 β- 肌动蛋白启动子的长片段。此种变种包括, 如, 核苷 酸 50-3668、 100-3668、 150-3668、 200-3668、 250-3668、 500-3668 或 600-3668 的序列。可以通过 5’ 和 / 或 3’ 端的切断 SEQ ID NO : 39 的序列来衍生 rpS21 启动子的变种。 此 变 种 包 括, 例 如, 核 苷 酸 50-1958、 100-1958、 150-1958、 200-1958、 250-1958、 500-1958、 1000-1958、 1-1900、 1-1850、 1-1800、 1-1750、 1-1700、 1-1600 或 1-1500 的序列。
         在某些实施方案中, 本发明的 β- 肌动蛋白启动子包括来自于 SEQID NOs : 1、 2或3 的至少 1250、 1500、 1550、 1600、 1650、 1700、 1750、 1800、 1850、 1900、 1950、 2000、 2500 或 3000 个核苷酸的相邻的分支。此 SEQ ID NOs : 1、 2 和 3 的相邻分支还可以包括一个突变 ( 插入 或缺失 ), 前提是突变序列保留了至少原始序列的一些功能以及在低、 中等或高度严格的条 件下可以分别与 SEQ ID NOs : 1、 2 或 3 杂交的能力。可以通过 5’ 切断 SEQ ID NOs : 1、 2、 3 或 7 或上述其变种的任何序列的而衍生出 β- 肌动蛋白启动子的相邻分支。
         在其他实施方案中, 本发明的 rpS21 启动子包括来自 SEQ ID NO : 39 的至少 500、 600、 700、 800、 900、 1000、 1100、 1200、 1300、 1400、 1500、 1600、 1700、 1800、 1850 或 1900 个 核 苷酸的相邻分支。
         本发明的 β- 肌动蛋白启动子的变种进一步包括可以和 SEQ IDNOs : 1、 2 或 3 中所 示的 β- 肌动蛋白启动子或其互补序列全长杂交的核苷酸序列, 两者具有最多 0、 1、 2、 3、 4、 5、 10、 15、 20、 25、 30、 35、 40、 45%的碱基对错配。 本发明的 rpS21 启动子序列包括可与 SEQID NOs : 39 中所示的全长 rpS21 启动子序列或其互补序列杂交的核苷酸序列, 两者具有最多 0、 1、 2、 3、 4、 5、 10、 15、 20、 30、 40、 45、 50、 55、 60%的碱基对错配。 可使用本领域公知的或此处描 述的技术测定碱基对的错配率。在此处用于修饰核酸的术语 “异源的” 是指除可操作地连 接到自然发生的基因组的启动子核酸以外的核酸。例如, 术语 “异源的” 指当此核酸被可操 作地连接到仓鼠 β- 肌动蛋白启动子时,除仓鼠 β- 肌动蛋白基因以外的任何核酸。同样 地, 当此核酸被可操作地连接到大鼠 β- 肌动蛋白启动子时, 术语 “异源的” 指除大鼠 β- 肌 动蛋白基因以外的任何核酸。相似地, 当此核酸被可操作地连接到小鼠 β- 肌动蛋白启动 子时, 术语 “异源的” 指任何核酸。类似地, 当此核酸被可操作地连接到仓鼠 rpS21 启动子 时, 此术语可以指除仓鼠 rpS21 基因以外的任何核酸。
         术语 “转基因” 指含有基因操作细胞的任何动物, 其中本发明的启动子不再被可操 作地连接如天然发生的基因组中的相同的核酸上。术语 “转基因” 包括, 例如, 含有具有整 合到动物染色体中的本发明的启动子或其变种的细胞的动物。术语 “转基因” 还包括含有 在染色体外具有由本发明的启动子或其变种组成的复制的 DNA 序列的细胞的动物。转基因 动物可以是如啮齿动物或人的哺乳动物。
         本发明部分基于新的 β- 肌动蛋白和 rpS21 基因的启动子的发现和分离。特别 地, 本发明的特征为包括但不局限于仓鼠、 大鼠和小鼠的啮齿动物 β- 肌动蛋白启动子, 以 及仓鼠 rpS21 启动子。如实施例中所描述的, 本发明是基于发现和证实本发明的 β- 肌动 蛋白启动子具有高于 CMV 的启动子活性的基础上。本发明进一步基于当用于表达某些基因 时, 仓鼠 rpS21 启动子的活性至少与仓鼠 β- 肌动蛋白启动子的活性相同的发现的基础上。
         本发明提供了包括仓鼠、 大鼠和小鼠的啮齿动物 β- 肌动蛋白启动子的核苷酸序 列, 以及其应用方法。 本发明进一步提供了鉴别和分离本发明的启动子变种的方法, 包括具 有启动子活性的启动子的同源物或片段。另外, 本发明提供了用于仓鼠 rpS21 启动子的核 苷酸序列及其使用方法。
         在导致本发明的实验中, 仓鼠 β- 肌动蛋白启动子的基因克隆被称为基因表达的系列分析技术或 “SAGE” (Valculesco et al.(1995)Science, 270 : 484-487 和 Valculesco et al.(1987)Cell, 88 : 243-251) 鉴定为活性启动子在识别后从 CHO 细胞中分离出来。 SAGE 技术可被用于整个基因组的转录图谱中。使用 SAGE 技术, β- 肌动蛋白启动子被鉴定为是 CHO 细胞中最具活性的启动子之一。因此从 CHO 细胞中克隆 β- 肌动蛋白启动子。可应用 相似的方法从 CHO 细胞中克隆仓鼠 rpS21 启动子。该方 法可被用于其他基因组的转录图 谱以确认在其他基因组中相应的 β- 肌动蛋白启动子或 rpS21 启动子的活性。可使用本领 域公知的标准技术或此处描述的技术克隆这些启动子。可以通过将其与一个或多个 SEQID NOs : 1、 2、 3 或 39 列出的启动子序列杂交的方法鉴别本发明的启动子的变种。 同源性每降低 1%, 双链核酸的熔点 (Tm) 就降低 1-1.5℃是公知的 ( 见, 如 Bonner et al.(1973)J.Mol. Biol., 81 : 123)。 因此, 例如可以将公认的核苷酸序列与 SEQ ID NOs : 1、 2、 3 或 39 或其变种 序列杂交, 并将此杂化物的熔点和 SEQ ID NOs : 1、 2、 3 或 39 或其变种序列与其互补序列的 杂化物的熔点相比较, 从而鉴定物种间的同源性。然后可以计算待测杂化物的碱基对错配 数。因此, 待测杂化物的熔点与含有任何 SEQ ID NOs : 1、 2、 3 或 39 的公认同源物的杂化物 的熔点的差别越小, 表明公认的核苷酸序列与本发明的启动子序列之间的同源性越大。例 如, 在其他啮齿动物如, 豚鼠、 花白旱獭、 麝鼠、 沙鼠、 松鼠、 花栗鼠、 土拨鼠、 海狸、 豪猪和野 鼠中的变种可以表现为与本发明的启动子及其变种具有更高的同源性。 已知多种因子影响核酸双链的杂交效率。其包括, 例如, 核酸序列的长度, 盐浓度 和序列的 G/C 含量。例如, 为了杂交 DNA 的长片段, Howley et al.(1997)J.Biol.Chem., 254 : 4876, 确定了使 50% DNA 与互补链杂交的熔点为 :
         Tm = 81.5+16.6logM+41(% G+% C)-500/L-0.62F,
         其中, M 是单价阳离子的摩尔浓度 ;
         (% G+% C) 是序列中 G 和 C 核苷酸各自的份额,
         L 是杂合 DNA 的长度 ;
         F 是甲酰胺的摩尔浓度。
         本领域技术人员可以如 Ausubel et al.(1995)Current Protocols inMolecular Biology, John Wiley & Sons, 的第 2、 4 和 6 部分列举的通过最少的实验来选择恰当的杂交 条件。另外, 严格的杂交条件在 Sambrooket al.(1989)Molecular Cloning : A Laboratory nd Manual, 2 ed., Cold SpringHarbor Press, 第 7、 9 和 11 章中描述。
         低严格的杂交条件的非限制性的例子如下。含有 DNA 的滤纸在 40 ℃下, 在含有 TM 35%甲酰胺、 5XSSC、 50mMTris-HCl(pH7.5)、 5mM EDTA、0.1% PVP、 0.1% Ficoli 、 1% BSA、 和 500ug/ml 变性的鲑鱼精子 DNA 的溶液中预处理 6 小时。杂交在具有以下变动的相同的 溶液中进行 : 0.02% PVP、 0.02% FicoliTM、 0.2% BSA、 100ug/ml 变性的鲑鱼精子 DNA、 10% (wt/vol) 硫酸葡聚糖以及使用 5-20X 10632P- 标记的探针。滤纸在 40℃下, 在杂交混合液 中孵育 18-20 小时, 然后在 55℃的含 2XSSC、 25mM Tris-HCl(pH7.4)、 5mM EDTA 和 0.1% SDS 的溶液中洗脱 1.5 小时。用新鲜溶液替换洗脱液并在 60℃下继续赋育 1.5 小时。吸干滤 纸, 使其暴露于射线自显仪。也可以使用本领域公知的其他的低严格条件 ( 如, 种间杂交所 用的 )。
         一个高度严格的杂交条件的非限制性的示例如下所述。含有 DNA 的滤纸的预杂交 在含有 6X SSC、 50mM Tris-HCl(pH7.5)、 1mM EDTA、 0.02% PVP、 0.02% FicollTM、 0.02% BSA
         和 500ug/ml 变性的鲑鱼精子 DNA 的缓冲液中, 在 65℃处理 8 小时至过夜。滤纸在 65℃下, 含有 100ug/ml 变性的鲑鱼精子 DNA 和 5-20X 106cpm 的 32P- 标记的探针的杂交液中杂交 48 小时。在 37℃下, 含有 2X SSC、 0.01% PVP、 0.01% FicollTM 和 0.01% BSA 的溶液中洗脱滤 纸 1 小时, 之后在 50℃, 0.1×SSC 溶液中洗脱 45 分钟。
         一个中度严格的杂交条件的非限制性的例子包括在 5X SSC、 0.5 % SDS、 1.0mM EDTA, pH8.0 的溶液中预洗脱 ; 在 50%甲酰胺、 6XSSC 的溶液中 42℃进行杂交 ; 在 0.5X SSC、 0.1% SDS 的条件下, 60℃进行洗脱。
         还可以通过公认变种的核苷酸序列和 SEQ ID NOs : 1、 2、 3 或 39 中的序列或其互补 链间同一性的百分比鉴定本发明启动子的变种。 同一性百分比可以通过, 例如, 可见观测或 本领域公知的或实施例中描述的各种计算机程序来确定。例如, 可以通过使用 Devereux 等 (1984)Nucl.Acids.Res., 12 : 387 中描述的并从威斯康星州大学的基因计算机组 (UWGCG) 中可获得的 GAP 计算机程序比较序列信息来确定两核苷酸序列的同一性百分比。还可以 通过使用如 Tatusove et al.(1999)FEMS Microbiol.Lett., 174 : 247 中描述的 程序 (www.ncbi.nl m.nih.gov/BLAST) 比对两核苷酸序列以确定同一性百分比。例如, 使 用 程序进行核苷酸序列比对时, 默认参数设定如 下 : 匹配回报为 2, 不匹配惩罚 为 -2, 开口间隙和延伸间隙惩罚分别为 5 和 2, 间隙 Xdropoff 为 50, 预期值为 10, 字大小为 11, 过滤器关闭。 通过序列同一性鉴别的本发明的启动子包括, 例如, SEQ ID NOs : 2 和 3 序列分别 列出的大鼠和小鼠 β- 肌动蛋白启动子的序列, 显示出与 SEQ ID NO1 列出的仓鼠 β- 肌动 蛋白启动子序列的 1-3007 核苷酸相比具有 67%和 80%的同一性。应用此处描述的和本领 域熟知的多种技术可以很容易地鉴别其他变种。
         可以通过所描述的方法确定仓鼠 β- 肌动蛋白启动子 (SEQ ID NO1) 与已知的 β- 肌动蛋白启动子间的同一性百分比。例如, 当用默认参数的 序列比对对 SEQ ID NO1 与人 β- 肌动蛋白启动子 (SEQ ID NO5) 进行对比时, 显示出在 SEQ ID NO1 的全长 上仅有大约 10%的同一性。 相似地, 当 SEQ ID NO1 与鸡 β- 肌动蛋白启动子 (SEQ ID NO6) 对比时, 显示出在 SEQ ID NO1 的全长上仅有大约 1%的同一性。由于同源性的水平如此 低, 因此不认为人和鸡的 β- 肌动蛋白启动子是 SEQ ID NO1 列出的仓鼠 β- 肌动蛋白启动 子的变种。而且, SEQ ID NO1 的 3’ 部分显示出与仓鼠 β- 肌动蛋白基因序列的 5’ 部分 ( 接收号 No。 U20114 ; SEQ ID NO 4) 具有显著的同源性。 特别地, 如图 3 所示, SEQ ID NO 4 的前 1232 个核苷酸显示出与 SEQ ID NO1 的 3’ 部分具有 98%的同一性。此同一 性位于仓鼠 β- 肌动蛋白基因的第一内含子区内。整体上看, 在 SEQ ID NO1 的全长上, SEQ ID NO 4 仅显示出 40%的同源性。而且, SEQ ID NO 4 或其片段并不具有启动子活性。
         应用具有默认参数的 序列比对发现在先前知道的人 rpS21 启动子 ( 接收号 No AJ250907 的核苷酸 1-2344) 与 SEQ ID NO39 的仓鼠 rpS21 启动子的 核苷酸 1-1958 之间没有同一性。 在 SEQ ID NO39 的仓鼠 rpS21 启动子和跨越小鼠 rpS21 基 因的小鼠基因组 DNA( 接收号 No NT_039212) 之间有很低的同一性。在小鼠的 序列中有两个具同源性的区域。第一个是 SEQ ID NO 39 的核苷酸 1775-1945(172 个核苷 酸中有 137 个相匹配 )。第二个是 SEQ ID NO 39 的核苷酸 580-851(274 个核苷酸中有 208 个相匹配 )。这两个具同一性的区域在仓鼠序列 (SEQ ID NO 39) 中被 923 个核苷酸分开,
         在小 鼠基因组序列 (NT_039212) 中被 1745 个核苷酸分开。
         在一些实施方案中, 具有启动子活性的分离的启动子或其变种包括 SEQ ID NO 39 中的核苷酸 1775-1945 和 / 或 SEQ ID NO 39 中的核苷酸 580-851 的核苷酸序列。可选择 的, 此启动子或变种进一步包括从 SEQ ID NO 39 的全部或如核苷酸 852-1774 所示的部分 序列。
         SEQ ID NOs : 1、 2、 3 或 39 所示的核苷酸序列或其变种可用作探针以用于筛选基因 组库的, 以便分离与一个或多个 SEQ ID NOs : 1、 2、 3 或 39 所示序列或其变种的基因组序列。
         根据本发明的启动子或其变种被可操作地连接到被其所表达的异源核酸上。 启动 子既可单独使用, 也可以与其他调节元件, 如增强子和抑制子联合使用。可供选择地, 此启 动子可被整合到宿主细胞或动物的基因组上, 从而在宿主细胞中表达内源性基因。根据本 发明的启动子可被用在表达异源核酸的载体中。在某些实施方案中, 异源核酸编码治疗性 蛋白。治疗性蛋白的例子包括, 但不局限于 α- 葡萄糖苷酶、 酸性鞘磷脂酶、 胰岛素、 组织血 浆酶原激活剂、 促甲状腺素 α 注射液刺激的激素 (thyrogen stimulating hormon)、 红细 胞生成素、 葡糖脑苷脂酶、 α- 半乳糖苷酶和各种抗体。抗体的例子包括但不局限于结合如 TGF-β-1、 2 和 3TGF-β 族成员的抗体。 本发明进一步提供了含有具有启动子活性的本发明的启动子或其变种的载体。 在 一些实施方案中, 本发明的载体包括位于启动子下游的合适的限制性酶切位点, 其可用于 插入异源的核酸。 该限制性酶切位点可以包括用于一种限制性酶的一个限制性位点或其可 包括用于多种限制性酶的多个限制性位点, 从而有助于插入多个不同异源的核酸。本发明 的载体还可以包括异源核酸插入点下游的一个多腺苷序列。 含有本发明启动子的载体还可 以含有用于细菌复制的原核 DNA 元件和用于载体在细菌细胞中生长和选择的抗生素选择 标记, 以及一个控制转录过程的另外的 DNA 元件, 如终止信号。载体可以进一步包含指导蛋 白质向细胞外分泌的 DNA 序列。
         在某些实施方案中, 含有本发明的启动子序列的载体是双顺反子载体。设计成双 顺反子载体可以使两个核酸被转录而生成一个转录产物。 此转录产物通常含有翻译成一个 蛋白的第一部分和翻译成另一个 蛋白的第二部分。一个蛋白可以是兴趣蛋白, 如治疗蛋 白, 另一个蛋白可以被用作可供选择的标记。双顺反子载体通常含有一个启动子和一个内 部的核糖体进入位点或位于两个核酸间的 IRES。这使得两个核酸转录为一个双顺反 mRNA。 在这种方式下, 可将载体构建成含有本发明的 β- 肌动蛋白启动子或其变种和在两个异源 核酸间的 IRES。 含有本发明的 β- 肌动蛋白启动子或其变种的双顺反子载体可被用于表达 连接报告基因的治疗蛋白, 例如, 酸性鞘磷脂酶或 α- 葡萄糖苷酶。
         本发明进一步提供了鉴定具有启动子活性的本发明的 β- 肌动蛋白和 rpS21 启动 子的变种的方法。 例如, 将本发明的启动子或其变种插入合适载体的报告基因的上游, 并且 报告基因的表达, 择确定启动子活性的鉴定。例如, 为鉴定本发明的具有启动子活性的启 动子变种, 则将此变种克隆到报告基因的上游。报告基因可以编码能催化产生视觉可辨别 信号的反应的酶。此种信号基因的例子包括 β- 半乳糖苷酶和荧光素酶。其他信号基因 的例子包括碱性磷酸酶、 胭脂碱合成酶、 章鱼碱合成酶、 β- 葡萄糖醛酸苷酶、 氯霉素乙酰基 转移酶 (chloremphenicol acetyltransferase)。在下列实施例中, 编码海葵 (Discosoma striata) 红色荧光蛋白 (RFP) 的报告基因被用于检测启动子活性。然而, 本领域技术人员
         可以使用任何适当的报告基因和分析技术检测启动子活性。 可以在体外表达系统或细胞内 ( 如体内 ) 分析启动子启动的报告基因的表达。
         本发明进一步提供了被含有可操作地连接到异源基因的启动子的本发明的载体 转染的宿主细胞。 此宿主细胞可以是原核细胞或真核细胞。 宿主细胞可以是培养的, 也可以 是动物中的细胞。培养的宿主细胞的例子包括, 但不局限于 Hela 细胞、 CHO 细胞、 NSO、 HEK 细胞、 BHK 细胞、 NIH-3T3、 MDCK 细胞和 COS 细胞。如实施例中所述的, 培养中的宿主细胞可 以悬浮或在微载体中生长。
         可以使用许多恰当的方法将本发明的核酸导入宿主细胞。 含有本发明启动子序列 的载体可以被导入原核或真核细胞。 可以将核酸导入真核细胞的技术的例子包括, 例如, 磷 酸钙沉淀、 DEAE- 右旋糖苷转染、 电穿孔、 脂质体介导的转染、 应用病毒载体的转导等。
         可以用许多恰当的表达系统来生成使用本发明的启动子的蛋白 质。一个此种表 达系统应用了二氢叶酸还原酶 (DHFR) 基因, 该基因被导入含有可操作地连接到异源核酸 的本发明启动子或其变种的载体。可供选择地, 如果使用 DFHR 缺陷细胞作表达, 可将表达 DHFR 的表达载体共同转染到宿主细胞。当增加甲氨蝶呤 (MTX), 一种主要的酶 DHFR 的竞争 性抑制剂的浓度被施加到转染细胞时, 仅仅具 DHFR 较高表达水平的细胞存活。进一步增加 MTX 水平时, 仅仅那些 DHFR 基因的拷贝数增幅的细胞存活。在这种方式下, 通过增加含启 动子的载体的拷贝数, 可以增加异源核酸的表达, 从而提高蛋白质产量。 第二个表达系统使 用了谷氨酸合成酶 (GS) 基因, 该基因被导入含有被可操作地连接到异源核酸的本发明的 启动子或其变种的载体中。使用另外 GS 的竞争性抑制剂, 如, 硫代甲硫氨酸 (methionine sulphoximine)(MSX), 以增加载体的拷贝数, 实现增加的蛋白质产量。
         任何恰当的原核或真核表达系统可被用来表达应用本发明的启动子蛋白质。 表达 系统的例子包括, 但不局限于, 植物、 杆状病毒、 酵母、 细菌、 果蝇、 哺乳动物或无细胞 (cell free) 表达系统。 例如, 在 Ausubel(1995), supra 中提供了将表达载体导入哺乳动物、 细菌、 酵母、 昆虫和植物细胞的标准方法。
         在某些实施方案中, 本发明的启动子及其变种被用于基因治疗的方法中。 例如, 本 发明的启动子及其变种被克隆到病毒或非病毒基因治疗载体中, 使其被可操纵的连接到兴 趣基因上。 当载体被运送到目的物, 如人类病人时, 启动子启动编码治疗蛋白的基因表达。
         以下实施例提供了本发明的说明性实施方案。 本领域的普通技术人员将意识到在 不改变本发明的主旨和范围时, 可进行多种修饰和改动。这些修饰和改动仍包括在本发明 的范围内。这些实施例不以任何方式限制本发明。
         实施例
         以下描述了实施例中所用的物质和方法
         A.CHO-K1 细胞的培养
         CHO-K 1 细 胞 从 American Type Culture Collection(Manassas, VA)(ATCC No.CRL-9618) 获得。在 250ml 含有 15g/L DE-52 微载体 (Whatman, Kent, UK)、 和 10%供 体小牛血清 (DCS)(Invitrogen) 的 925 细胞培养基中旋转培养细胞。细胞在 37℃下, 使用 20-40% O2 和 5% CO2、 并在大约 60rpm 下晃动 6 天。细胞在血清存在下生长后, 每天用不含 血清的 925 培养基更换 80% (v/v) 培养基。细胞在不含血清的培养基中生长 11 天后从细 胞中提取 RNA。为了确定 mRNA 的半衰期, 将 7mg/L 的放射菌素 D 加入不含血清相中。B.RNA 的提取和分析 使 用 Promega(Madison, WI) 的 RNAgents 试 剂 盒 从 CHO-K1 细 胞 中 分 离 RNA。 试剂盒用 RNA 印记法分析基因表达。为进行 RNA 印记分析, 应用(Ambion, Ausein, TX) 在变性的 glycoxal/ 二甲基亚砜凝胶上电泳分离 5ug RNA。而后将 RNA 转到尼龙膜上 (Schleiche & Schuell, Dassel, 德国 )。用通过 PCR 扩增的下述基因 探针杂交斑点 : 半乳糖结合蛋白 ( 动蛋白 ( 接收号 No.M96676, 核苷酸 14-383) ; β- 肌 接 收 号 No.U20114, 核 苷 酸 238-381) ; EF-1( 接收号 No.D00522, 核苷酸 7-192) ; rpS21( 接收号 No.X79059, 核苷酸 68-340) ; 铁蛋白 ( 接收号 No.M99692, 核苷酸 182-303) 或商业上可购得的甘油醛 -3- 磷酸脱氢 酶 (GAPDH) 片段 (Ambion, Austin, TX)。使用随机引物将每种 PCR 产物放射标记。用于扩 增每种基因的 PCR 引物在表一中列出。
         表1
         基因 引物 序列 SEQ ID NO : β- 肌动蛋白 正向 GCTCTTTCTTCGCCGCTCC 8 β- 肌动蛋白 反向 ACCACCCTCCAGCCTTCCC 9 EF-1 正向 GAACGCAGGTGTTGTGAAAA 10 EF-1 反向 CTCGGCAGCCTCCTTCT 11 rpS21 正向 GTGGACCTGTACGTGC 12 rpS21 反向 TTCTCACTTTTATTTATGAC 13 铁蛋白 正向 CGCCAGAACTACCACCAGGAC 14 铁蛋白 反向 TTCAGAGCCACATCATCCCG 15 半乳糖结合蛋白 正向 TGGTCGCAAGCAACCTGAATC 16
         半乳糖结合蛋白 反向 TTGAAGTCACCGTCTGCCGC 17
         C.CHO-K1 细胞的转染
         为了瞬时转染, CHO-K1 细胞被铺在含 10%胎牛血清 (FBS)(Invitrogen) 的 925 培 养基的 6 孔培养平板中。在用 LipofectamineTM(Invitrogen) 进行转染之前, 细胞生长至 50-75%融合度。pDsRED-1 质粒 (Clontech, Palo Alto, CA) 与编码用于鉴别转染细胞的 细胞表面 CD20 标记的 pSV40-CD20 质粒共同转染。pDsRED-1 质粒编码海葵红色荧光蛋白 (RFP), 可通过 FASC 检测其表达。根据厂家的说明书进行转染。简言之, 细胞与脂质体 -DNA 复合物在不含血清的 Opti-MEMTM 培养基 (Invitrogen) 中孵育 16 小时。用含 10% FBS 的 925 培养基替换该培养基, 转染 48 小时后收集细胞。
         D. 荧光活化细胞挑选分析
         为进行 FACS 分析, 用胰蛋白酶处理 1X106 个细胞, 并用含 2 % FBS 的冷 PBS 冲 洗。 随 后 用 FITC 标 记 的 抗 CD20 抗 体 (Pharmingen, SanDiego, CA) 在 冰 上 孵 育 细 胞 30 分钟。然后用含 2 % FBS 的冷 PBS 冲洗, 并用 1ml 冷的 PBS/2 % FBS 将细胞悬浮。使用 FACSCaliburTM(BDBiosciences, San Diego, CA) 进行 FACS 分析。评估所有的 CD20 阳性物 的红色荧光蛋白的平均荧光强度, 以分析启动子强度。
         E.ASM 分析
         将由编码酸性鞘磷脂酶 (ASM) 的载体转染的细胞的培养物在 37℃下, 与在 250mM的醋酸钠中, 浓度为 12.5mM 的合成底物 2-(N- 六癸酰基氨基 )-4- 硝基苯基磷酰基氯 (Calbiochem, San Diego, CA)、 pH5.5、 0, 含有 1M 醋酸锌、 0.25mg/m1 的牛血清白蛋白 (BSA) 和 0.15%的吐温 20 中孵育。通过加入含 50%乙醇的 0.2M 的甘氨酸 - 氢氧化钠终止反应。 通过使用比色仪测量 415nm 下的光密度, 测量所产生的 2-(N- 六癸酰基氨基 )-4- 硝基酚盐 的量来测定 ASM 的活性。
         F.GAA 分析
         将被编码 α- 葡萄糖苷酶 (GAA) 的载体转染的细胞培养基在 37 ℃下, 与在 50mM 的醋酸钠中浓度为 40mM 的合成底物 p- 硝基苯基 -D-a- 吡喃葡萄糖酯 (Sigma, St Louis, MO)、 pH4.3, 并含有 0.1%的胎牛血清 (BSA) 中孵育。通过加入 0.3M 的甘氨酸, pH10.6 终止 反应。通过使用比色仪测量 400nm 的光密度, 测量所产生的 p- 硝基苯基的量来测定 GAA 的 活性或量。
         实验例 1 : CHO-K1 细胞中 β- 肌动蛋白启动子的鉴别
         应 用 基 因 表 达 的 系 列 分 析 (SAGE) 分 析 在 不 含 血 清 的 完 全 覆 盖 旋 转 培 养 (perfused spinner culture) 上生长的 CHO-K1 细胞的完整的转录图谱。
         SAGE 的第一步包括使用标准技术从分离的 CHO-K1 细胞 mRNA 中合成双链 DNA。随 后用限制性内切酶 Nlalll, 又称锚定酶切断该 cDNA, 预期至少一次可切出最多的转录产 物。通过结合到链霉亲和素的磁珠而将每一个被切断的 cDNA 的 3’ 部分分离。然后将 cDNA 分成两部分, 通过将其限制性位点锚定连接到含有 II 型限制性内切酶位点 ( 例如, FokI) 的 连接物上。 II 型限制性内切酶在离其不对称的识别位点最多 20 个碱基对的指定位置切断。 II 型酶典型地被称为标记酶。用标记酶切段连接物产物可以使连接物与短的 cDNA 片段被 释放出来。锚定和标记酶的联合使用可产生对于一个基因是唯一的 10 个碱基对的标记。
         应用这种方法, 每个基因的标记序列可以用 3’ 最多的 Nlalll 位点及其后的独特 的 10bp 的序列代表。在标记不能别指定到已知基因的例子中, 可以使用 SAGE 标记和常用 是 M13 正向引物 (GTTTTCCCAGTCACGAC, SEQ ID NO : 18) 对 SAGE 库的 cDNA 进行 PCR 扩增。 随后将 PCR 产物克隆到 pCR2.1 载体 (Invitrogen), 并用标准的技术测序。 基因的鉴定是以 PCR 产物的序列与 (www.ncbi.nlm.nih.gov/genbank) 中已知序列的同源性为 基础的。
         使核酸序列与小鼠和 / 或大鼠的相对物进行 比对 (www.ncbi.nlm. nih.gov/blast) 以确定标记来源的序列。在分析鉴定出来的 16 个最丰富标记中, ( 表 2), 除一个标记外, 其余的标记基因都被鉴定出来。 在这 15 个被鉴定出来的基因中, 5 个是线粒 体来源, 3 个是核重复元件。在每个细胞中, 这些基因有多重拷贝发生, 可能是其在 SAGE 的 输出中丰富的原因。这些序列不能进行下一步的评估。
         表2
         丰富度 38 33 27 27 20标记 CATGGAACAGAAT CATGCAGGAGCTTC CATGGGGGAGCGTT CATGGTACTGACAC CATGGCCTCCAAGG基因 Alu 重复 Mito COXI 核糖体蛋白 S21 Mito COXIII GAPDH15SEQ ID NO : 19 20 21 22 23鉴别 J00052 PCR PCR PCR X52123101942442 A CN 101942447说明书24 25 26 27 28 29 30 31 32 33 3414/20 页20 19 18 18 18 16 15 14 13 13 12
         CATGATAATACGTA CATGCCTTTAATCC CATGAATCGGAGGC CATGAGGCAGACAG CATGGCGGCAGACG CATGGTGGCTCACA CATGTTGGCTGCCG CATGCCCTGTGCCG CATGAGAGCGAAGT CATGAGGAGGCCTA CATGCCCTGAGTCCMito ATPase6 B-1 重复 Mito 细胞色素 B EF-1 半乳糖结合蛋 白 (L-14) Alu 重复 铁蛋白重链 不匹配 核糖体蛋白 L41 线粒体 NADH 脱氢酶 β- 肌动蛋白M14311 PCR J01436 D00522 M96676 J00056 M99692 X82550 PCR AF014363应用此种方法, 作为 CHO-K1 细胞中最活跃的四个基因的启动子被鉴别出来。这些 启动子是 : β- 肌动蛋白、 核糖体蛋白 S21(rpS21)、 延伸因子 1(EF-1) 和甘油醛 -3- 磷酸脱 氢酶 (GAPDH)。 在 CHO-K1 细胞中这些 mRNA 高水平的表达即归功于其各自启动子的活性, 又 归功于 mRNAs 的内在稳定性。尽管 SAGE 分析提供了基因 mRNA 的总体稳定状态的定量, 其 并不能区分基因的启动子活性和 mRNA 的稳定性哪一个是高表达水平基础的。因此, 为了区 分这两种可能性, 测定了 mRNAs 的半衰期。简言之, 通过对放射菌素 D 处理后的不同点的旋 转培养中的 CHO-K1 细胞的 RNA 印记分析评估了候补基因的表达。 最初, 分析了 rpS21、 GAPDH 和 EF-1 基因, 发现这所有的基因都具有相对稳定的 mRNAs, 其半衰期大于 8 个小时。这表明这些 mRNAs 的丰富来自于 mRNAs 稳定, 而不是各自 启动子较高的活性。
         同样如上所述的在放射菌素 D 处理后的 0、 4、 8、 10 和 15 小时后使用 RNA 印记方法 测量半乳糖结合蛋白、 铁蛋白、 和 β- 肌动蛋白 mRNA 的半衰期。各自的 RNA 印记的结果在 图 6A 中表示。相对 mRNA 水平在图 6B 中以曲线说明。这些数据表明虽然半乳糖结合蛋白 和铁蛋白的半衰期大于 8 小时, β- 肌动蛋白 mRNA 变化的更快, 其半衰期为大约 6 小时。因 此, 对于 β- 肌动蛋白, 启动子强度在总的稳定状态的 mRNA 水平中的贡献大于 CHO-K1 细胞 中的其他候选。因此, 在这些条件下, β- 肌动蛋白启动子具有强启动子特点。
         实施例 2 : 仓鼠 β- 肌动蛋白和 rpS21 启动子的分离和其特征
         根据实施例 1 中描述的结果, 选择具有最高丰富度的候选 (rpS21) 和具有最 快 mRNA 变 化 (β- 肌 动 蛋 白 ) 进 行 进 一 步 的 研 究。 筛 选 λFIXII CHO-K1 基 因 组 文 库 (Stratagene, LaJolla, CA) 以分离仓鼠的 β- 肌动蛋白和 rpS21 启动子的基因组 DNA。
         为了分离 β- 肌动蛋白和 rpS21 基因克隆, 将大肠杆菌株, XL1-BlueMRA(P2) 培养 在含 10mM 硫酸镁和 0.2%麦芽糖的 LB 培养基中。使 600nm 处的吸光度为 0.5 时收集细菌, 而后再重新悬浮在 10mM 硫酸镁中, 。从库中取大约 100 万噬菌体, 将其与细菌细胞在 37℃ 中孵育 15 分钟。将熔化的琼脂糖凝胶加入噬菌体 / 细菌混合物, 将细菌平铺在含琼脂的 BioAssay 平板 (Nunc, Rochester, NY)。琼脂糖表面变硬后, 将平板倒置, 在 30℃中过夜生 TM 长。而后将平板冷却, 用 GenescreenPlus (Perk Elmer Life Science, Wellesley, MA) 尼 龙滤纸覆盖两次。在具有 1.5M 的氯化钠的 0.1M 的氢氧化钠中将滤纸变性 2 分钟, 随后中 和。用 UV 交联滤纸, 并标记。
         用 于 分 离 仓 鼠 β- 肌 动 蛋 白 启 动 子 的 探 针 通 过 β- 肌 动 蛋 白 5’末 端 ( 接收号 NoU20114 的核苷酸 238-381) 的随机 PCR 产生。用于分离仓鼠 rpS21 启
         动子的探针通过使用 SEQ ID NOs : 12 和 13 中的引物的 PCR 产生。使用标准的技术纯化杂 交 β- 肌动蛋白和 rpS21 启动子的噬菌体。通过氯仿, 酚, 酚 / 氯仿 (1 ∶ 1) 以及最后氯仿 一系列抽提从噬菌体裂解液中分离噬菌体 DNA。
         为了分离仓鼠 β- 肌动蛋白基因启动子, 在乙醇沉淀后, 用在仓鼠 β- 肌动蛋白 基因的 5’ 部分有切点的内切酶消化 DNA, 并用与筛选基因组库相同的探针进行 DNA 印记杂 交。
         应用此方法, 产生了大约 7kb 的 Avrll 片段和大约 5.5kb 的 Sall 片段, 两者均可 与探针杂交。随后将其克隆到 pBluescriptII KS 质粒 (Stratagene)。7kb 的 Avrll 片段 的 ATCC 参考号 No----, 保藏 ----, 200----, 美国组织培养中心, 邮政信箱 1549, Manassas, VA20108, 美国。
         含有 Avrll 和 Sall 片段的质粒被 Sfol 消化, 除去片断包含 β- 肌动蛋白开放 阅读框的片段的 3’端。然后将这些片断克隆到 pDsRED-1 质粒 (Clontech) 以产生称为 pDsRED-Avr(6.5kb) 和 pDsRED-Avr(5.1kb) 的构建体。为了生成含有 β- 肌动蛋白基因内 含子 1 全部的构建, 使用以下引物作 PCR :
         正向 : AGGCCCAGCTTGGGACCAAGACAGAA(SEQ ID NO : 35)
         反向 : CGCGGATCCGGCGAACTATATCAGGGC(SEQ ID NO : 36)
         PCR 片段产生两种产物 : 一个预期的大约 7kb 的产物和一个小点的 3kb 的非预期 产物。两种 PCR 产物均被克隆到 pDsRED-1 质粒 (Clontech) 以产生 pDsRED-Avr(1)-7 和 pDsRED-Avr(1)-3 构建体。
         将克隆到 pDsRED-1 质粒 (Clontech) 的仓鼠 β- 肌动蛋白启动子每一个片段都被 转染到 CHO-K1 细胞。使用上述的 FACS 测定每一个仓鼠 β- 肌动蛋白启动子片段的相对启 动子强度。活性分析的结果将在下面总结。
         跨越核苷酸 -1970 至 +1037 的 β- 肌动蛋白启动子的 Avr(1)-3 片段表现出最高 的启动子活性。跨越核苷酸 -6000 至 +1037 的 Avr(1)-7 片段表现出 Avr(1)-3 活性的 47% 的活性。Avr(6.5kb)、 Sal(5.1kb)、 肌动蛋白 (3kb) 和肌动蛋白 -P(2.8kb) 片段分别仅表现 出 Avr(1)-3 活性的 2%、 2%、 2%和 0%的启动子活性。
         随即对 Avr(1)-3 片段测序, 序列为 SEQ ID NO : 1 中的序列。另外, 也对 Avr(1)-3 的 5’ 上游区域的 660 核苷酸进行测序。这个从 -2622 到 +1037 的相对长的序列在 SEQ ID NO : 7 中列出。
         从杂交的噬菌体中分离出 DNA 后, 为了分离 rpS21 启动子, 使用 下列引物通过 PCR 对 DNA 扩增 :
         正向 : AGCTCTAATACGACTCACTATAGGGC(SEQ ID NO : 40)
         反向 : CTCTAGGCCAGCGGAGCGCAG(SEQ ID NO : 41)。
         将 PCR 产物克隆到 PCR2.1 载体 (Invitrogen) 中, 随后测序。仓鼠 rpS21 启动 子的核苷酸序列为 SEQ ID NO : 39 中的序列。使用在克隆点侧面的 EcoRI 位点切下启动 子, 将其克隆到 pDsRED1-1 载体 (Clontech)。2kb 的仓鼠 rpS21 启动子序列的 ATCC 参考 号 NoPTA-6194, 保藏于 2005 年 8 月 5 日, 美国组织培养中心, 邮政信箱 1549, Manassas, VA20108, 美国。
         实施例 3 : 仓鼠 β- 肌动蛋白启动子与 CMV 启动子的功能对比将 Avr(1)-3 的启动子活性与 CMV 立即早期启动子 (Invitrogen) 和人 EF-1 启动 子 (Invitrogen) 的活性进行比较。
         用含有 Avr(1)-3、 CMV 立即早期启动子上游、 或人 EF-1 启动子的 pDsRED-1 质粒 转染 CHO-K1 细胞, 每一个启动子都可操作地连接有 RFP 基因。转染 48 小时后用 FACS 检测 RFP 的表达。
         如图 7A 所示, 在 Avr(1)-3 转染的细胞中, β- 肌动蛋白启动子序列 (SEQ ID NO : 1) 与 CMV 或 EF-1 启动子相比, 表现出较高水平的 RFP 表达。特别地, Avr(1)-3 转染的表达 大约比 CMV 启动子的高 2 倍。
         为了确定观察到的表达情况在稳定的转染中是否保留, 用 G418TM 筛选转染的 CHO-K1 细胞, 共两周。然后分析存活的细胞中的 RFP 的表达。如图 7B 中所示, 与瞬时转染 的细胞相似, β- 肌动蛋白启动子序列在 SEQ ID NO : 1 中列出的 Avr(1)-3 转染的细胞中观 察到最高的 RFP 表达, 。实施例 4 : BHK-21 和 HEK293 细胞中仓鼠 β- 肌动蛋白启动子的活 性
         在应用实施例 3 所述的稳定转染的 BHK-21(ATCC No.CCL 10) 和 HEK293(ATCC No.CRL-1573) 细胞中比较仓鼠 β- 肌动蛋白启动子和 CMV 启动子的活性。如在 CHO-K1 细 胞中所见到的, 当用 β- 肌动蛋白启动子而不是 CMV 启动子时, 在 BHK-21 细胞中的 RFP 的 表达显著较高 ( 表 3)。在 HEK293 细胞中, β- 肌动蛋白启动子启动的 RFP 的表达大体上与 CMV 启动子所引起的表达相同。
         表3
         细胞系 CMV 启动子 β- 肌动蛋白启动子 BHK-21 8.3±0.4 121±99.8 HEK293 139±9.9 102±8.3
         实施例 5 : 大鼠和小鼠的 β- 肌动蛋白启动子
         使用默认参数检索了公开的核苷酸序列数据库, 以查找 SEQ IDNO : 1 的仓鼠 β- 肌 动蛋白启动子序列的同源序列。
         仓鼠 β- 肌动蛋白基因的 5’ 部分 ( 接收号 No.U21104 ; SEQ ID NO : 4) 显示出与仓鼠 β- 肌动蛋白启动子 3’ 部分的 98%的同一性。可是, 在 SEQ ID NO : 1的 仓鼠 β- 肌动蛋白启动子序列的全长上, 此同一性仅为 40%。这部分没有启动子活性。
         应用默认的参数和 程序对先前已知的人 ( 接收号 No gi28337A) 和鸡 ( 接收号 No gi2170437)β- 肌动蛋白启动子 : 与仓鼠 β- 肌 动蛋白启动子进行比对, 以确定同源性。与仓鼠 β- 肌动蛋白启动子 (SEQ ID NO : 1) 相比, 人和鸡 β- 肌动蛋白启动子仅分别具有 10%和 1%的同一性。
         大鼠 (Rattus norvegcus) 基因组超重叠群 ( 接收号 No.NW_042778) 被鉴定为在大鼠 12 号染色体上, 其含有与 SEQ ID NO : 1 序列全长有 67%同一性的核苷酸 序列。
         相似地, 在小鼠 (Mus musculus) 基因组第 5 号染色体上鉴别出一个重叠群 ( 接收号 No.NT_039324), 其与 SEQ ID NO : 1 序列全长有 80%同一性。
         仓鼠 β- 肌动蛋白启动子 (SEQ ID NO : 1) 与仓鼠基因序列、 人、 鸡、 大鼠、 和小鼠 β- 肌动蛋白启动子的比对分别在图 3、 4、 5、 1 和 2 中说明。实施例 6 : 大鼠和小鼠 β- 肌动蛋白启动子的活性
         分别在 SEQ ID NOs : 1 和 2 中列出的大鼠和小鼠 β- 肌动蛋白启动子序列, 并被 克隆到 pDsRED-1 质粒 (Clontech)。CMV 启动子也被克隆到 pDsRED-1 质粒中 RFP 基因的上 游。将这些质粒转染到 CHO-K1 细胞, 或其他细胞系。转染 48 小时后, 用 FACS 分析 RFP 的 表达。
         用大鼠或小鼠 β- 肌动蛋白启动子转染的细胞预期比相似的条件下 CMV 启动子转 染的 RFP 的表达高。
         实施例 7 : 使用仓鼠 β- 肌动蛋白启动子的表达蛋白质
         为了进一步评估仓鼠 β- 肌动蛋白启动子的活性, 使用二氢叶酸还原酶 (DHFR) 选 择和甲氨蝶呤 (MTX) 扩增的表达系统。载体 pGZ6 衍生自 pCLHAXSV2DHFR 质粒, 因而除含有 SV40 早期启动子控制的 DHFR 基因外, 还含有 3kb 的仓鼠 β- 肌动蛋白启动子 (SEQ ID NO : 1)。 pCLHAXSV2DHFR 质粒先前曾被 Cole et al.(1993)Biotechnology, 11 : 1014-1024 描述。 简言之, pCLHAXSV2DHFR 载体中的金属硫因启动子 (MT) 被 β- 肌动蛋白启动子替换而生成 pGZ6 载体。治疗目的的两种蛋白的 cDNA, 酸性鞘磷脂酶 (ASM) 和 α- 葡萄糖苷酶 (GAA) 被 可操作地连接到仓鼠 β- 肌动蛋白启动子。ASM cDNA 从 IMAGETM 协会 ( 接收 号 No.A1587087) 获得。GAA 的 cDNA 从纽约医科大学的 Dr Martinuik 处获得。ASM 和 GAA cDNA 的核苷酸序列分别在 SEQ ID NOs : 37 和 38 中列出。相似地, 两个 cDNA 也被克隆到含 有 DHFR 表达卡盒的载体中的 CMV 启动子的下游。DHFR 缺陷 CHO-K1 细胞系 DXB11 被两套表 达载体一式三份的转染。在两周后, 含有 20nM MTX 的核酸缺陷培养基中, 用 PBS 冲洗异源 未被克隆的细胞池, 并将其转入不含血清的介质。24 小时后, 测量介质中的 ASM 或 GAA 的 量。
         此试验的结果在图 8A 和 8B 中表示。在稳定的细胞池中, 仓鼠 β- 肌动蛋白启动 子产生的 ASM 的水平比 CMV 启动子多 2 到 15 倍, 而在 GAA 的细胞中, 多 2 到 5 倍。
         进一步应用稳定的细胞池来评估 β- 肌动蛋白启动子维持长期蛋白表达的能 力。典型地, 为了产业上生产蛋白, 通过增加选择步骤的次数和 / 或 MTX 浓度的方法选择 具有较高基因拷贝的细胞, 从而实现高表达。为了确定能否通过 β- 肌动蛋白启动子 (SEQ ID NO : 1) 实现较高表达, 将早期在 20nM MTX 下选择的 ASM 细胞池放大, 使用高于 10 倍的 MTX(200nM) 选择两周。如表 4 中所总结的, 3 个被测 β- 肌动蛋白池中的两个在放大后显 示出相对起始 20nM 细胞池的 ASM 水平高 2-3 倍。相反地, 仅有一个被检测的 CMV 池显示比 其来源的 20nM 池高的水平。在两个启动子产生的六个细胞池中, β- 肌动蛋白产生的最高 表达是 CMV 启动子产生的最高表达的 6 倍。这表明, 至少在检测条件下, 仓鼠 β- 肌动蛋白 启动子优于 CMV 启动子。
         表4
         池 CMV-ASM 池 A CMV-ASM 池 B CMV-ASM 池 C β- 肌动蛋白 -ASM 池 A β- 肌动蛋白 -ASM 池 B20nM MTX 下 ASM 4.3 16.9 3.6 33.5 59.319的表达200nM MTX 下 8.2 9.5 3.7 100.0 27.9ASM 的表达101942442 A CN 101942447说45.6明书90.518/20 页β- 肌动蛋白 -ASM 池 C
         在另一个试验中, 仓鼠 β- 肌动蛋白启动子被用来表达组织血浆酶原激活剂 (tPA) 蛋白, 该蛋白是一种溶解血栓剂, 可解决病人的凝血问题。用在该载体中仓鼠 β- 肌 动蛋白启动子被可操作地连接到 tPA 基因的 pGZ6-tPA 表达载体转染 CHO-DXB11 细胞, 。通 过在含有 200nM MTX 的核酸缺陷培养基中生长来选择稳定转染的细胞。然后将得到的未克 隆细胞池中加入 500nM MTX 以放大转染基因的拷贝数。从细胞中除去 MTX, 在 1L 的旋转培 TM 养中放大细胞池并种植到 Cytopore 2 微载体上。细胞在含血清的培养基中生长 7 天, 以 后的 4 天, 每天用不含血清的培养基替换 80%的血清。然后用 15 天收集培养基并用可买 到的 ELISA 试剂盒 ( tPA 试剂盒, Biopool International, Inc., Ventura, CA) 分析 tPA 表达。如本的图 9 所示, 使用仓鼠 β- 肌动蛋白启动子导致 tPA 的表达浓度为 每天 30mg/L。此结果可以与最近发表的报道相比, 用其他启动子 4-8 天后可产生 30-40mg/ L tPA(Senger et al.(2003)Biotechnology Progress 19 : 1199-1209 ; Dowd 等人 (2000) Biotechnology Progress 16 : 786-794)。
         实施例 8 : 应用仓鼠 β- 肌动蛋白启动子制备抗体产量
         为了生成抗 TGF-β 族抗体, 在两个分别的 pGZ6 表达载体中, 编 码抗 TGF-β 抗体 轻链或抗 TGF-β 抗体重链的核酸被克隆到 β- 肌动蛋白启动子的下游。 用两种表达载体转染 DHFR 缺陷 CHO-K1 细胞系 DXB11。在含有 MTX 的核酸缺陷培 养基中选择两个星期后, 测定培养基中轻链和重链的抗 TGF-β 抗体水平。
         实施例 9 : 使用仓鼠 rpS21 启动子的蛋白表达
         在 CHO-DXB11 细胞中比较了仓鼠 rpS21 启动子与仓鼠 β- 肌动蛋白启动子的表达 活性。用含有可操作地连接到仓鼠 rpS21 启动子 SEQID NO : 39(pGZ31C-GAA) 或仓鼠 β- 肌 动蛋白启动子 SEQ ID NO : 1(pGZ61C-GAA) 的人 α- 葡萄糖苷酶 (rhGAA) 的表达载体转染到 CHO-DXB11 细胞。在两种情况下, rhGAA 通过内部核糖体进入点 (IRES) 序列被连接到编码 细胞表面标记 (CD20) 的基因。在核酸缺陷培养基中, 用 0.2uM 的 MTX 选择细胞后, 用 FITC 连接的抗 CD20 抗体标记细胞, 并用过 FACS 分离高表达的克隆。将被选出的细胞铺到 96 孔 平板上, 放大以分析 rhGAA 的表达。分析了仓鼠 rpS21 启动子的 38 个克隆和仓鼠 β- 肌动 蛋白启动子的 29 个克隆。表 5 显示了所得两种启动子克隆的表达范围分布。
         表5
         载体 pGZ31C- GAA pGZ61C- GAA GAA 表达 16% 52% < 2pg/ 细胞 / 小时 GAA 表达 50% 34% 2-5pg/ 细 胞 / 小时 GAA 表达 26% 14% 5-8pg/ 细 胞 / 小时 GAA 表达 8% 0% 8-10pg/ 细 胞 / 小时在另一个试验中, 仓鼠 rpS21 启动子被用于在 CHO-DXB11 细胞中表达 ASM。对 rpS21 启动子与 β- 肌动蛋白和 CMV 启动子的活性进行了比较。CHO-DXB11 细胞分三分转 染, 直接在 200nM MTX 中选择, 或先在 20nM MTX 而后在 200nM MTX 中放大两周, 如实施例 7 中所述的。如所述测量培养基中的 ASM 水平。在未转染的细胞中测不到 ASM 表达。
         如表 6 所总结的, 三份 rpS21 细胞池在放大后均显示出相对其来源的初始 20nM 细 胞池大 2-3 倍的 ASM 表达水平。另外, 所产生的 ASM 水平比 CMV 启动子所产生的 ASM 水平 高 ( 实施例 7)。
         表6
         20
         101942442 A CN 101942447表7 /24 小时 (20nM MTX) /24 小时 (200nM池 ASM 表达 nU/ 细胞 12 13 16 ASM 表达 nU/ 细胞 34 30 41说MTX)明在直接用 200nM MTX 选择的细胞所产生的 ASM 表达水平在表 7 中总结。21池 rpS21-ASM 池 A rpS21-ASM 池 B rpS21-ASM 池 C书ASM 表达19/20 页101942442 A CN 101942447说明书20/20 页CMV-ASM 池 A 38 CMV-ASM 池 B 193 CMV-ASM 池 B 44 β- 肌动蛋白 -ASM 池 A 381 β- 肌动蛋白 -ASM 池 B 125 β- 肌动蛋白 -ASM 池 C 515 rpS21-ASM 池 A 342 rpS21-ASM 池 B 60 rpS21-ASM 池 C 51
         仓鼠 rpS21 启动子在 200nM MTX 中产生的 ASM 水平比 CMV 所产生的平均高大约 1-2 倍。在另一方面, β- 肌动蛋白启动子产生的 ASM 水平比 CMV 所产生的平均高大约 3-4 倍。因此, 当用于表达 GAA 时, rpS21 启动子至少具有与 β- 肌动蛋白启动子一样的活性, 然而, 当用于 ASM 表达时, 其表现出低于 β- 肌动蛋白启动子的活性。然而, 两种启动子的 活性均大于 CMV 启动子。
         根据在此引作参考的说明书中的对比文献, 可以充分理解书明书。 说明书中的实 施分案为本发明的实施方案提供了解释, 但并不限制本发明的范围。本领域技术人员应该 意识到许多其他的实施方案也包括在本发明的范围内。 在此引用的所有的出版物和专利和 在此公开通过接收号和数据库参考而鉴别的序列被作为整体通过参考而并入此文。 在一定 程度上被引入作参考的内容与本说明书相矛盾或不一致的程度, 本说明将取代这些内容。 在此引用的任何参考文献并非是本发明的现有技术。
         除非特别指出, 应该认为所有在本说明书, 包括权利要求中的用于表示成分、 细胞 培养、 处理条件等的数字都用术语 “大约” 限定。从而, 除非特别指出是相反的, 数字参数是 大概的, 可以依据本发明所要获得的特性的不同而不同。 除非特别指出, 在一系列成分前的 术语 “至少” 应当被理解成指系列中的每一个成分。本领域技术人员可以使用不超出常规 的实验认识到或者可以确定此处描述的发明的特定实施方案的许多等同方案。 这些等同方 案包括在权利要求中。22101942442 A CN 101942447序列 序列表表1/23 页<110>S·埃斯蒂斯 W·Q·张 建新公司 <120> 新的 β- 肌动蛋白和 RPS21 启动子及其应用 <130>7680.27-304 <140> <141> <150>60/480,768 <151>200306-24 <160>41 <170>PatentIn version 3.2 <210>1 <211>3007 <212>DNA <213> 人造序列 <220> <223> 分离自 CHO 细胞的 β- 激动蛋白启动子 <400>1 gggaccaaga gggccagagt aggtcctgcc aggcccccac aggctcccct cccccacctg actgagagat tgctgggaaa ctcttttgtg gggtcaccctcagaaccata gcctgcccct tgggaatctg ttattcctgc gagaacactg tgaattgcag acagggccag gttctctctc ggaaccacag ttccatactgagccagtggg tgaaccgtcc gtctgctcct acccctggtg ccggcagtcc ggctggcagg ggccagggca tcaggcccag agtagccctg gaggcctctgatagatcaga cagggaccag acttagtaaa gtaggtggcg tcattgacag tcctcaggca gtcccgtccc gttggtgact aacgtggggg caacttcaaa23aatgttccag aggtgacaaa gctgcctggt tcttctcccc gcagtattcg gctggcaaac ccggaggcag gcagaaggct tgtgcttcca atgctctgctaggtgggatg 60 gtggcaacac 120 gtcacacaag 180 tgcagccacc 240 ctctgcccca 300 cgcctgaaca 360 ggaggggacg 420 tctgtcaaat 480 gtatactctg 540 accaacctag 600101942442 A CN 101942447序ttggtccagc tggtttcaac cgagcatctc ggaggtgtgt ctagtgtagg gataaatagg attgagggct ccagatggac gggtcccagc agttttttgc tttgcttgtt atcttcctgc ccctgagtct aaattgtacc tttccggcta gttcctcaaa cgaggtactc ccccagaatg gcccagtcat cttcctcaat aaaaggaggg ggcgcggagc ctgtggcgtc ccgcgagcac cagggacaac cgcgggggac cggacacttt cggtgtagac gggtcgcagt ccaccttggg catgggtctt gcccggctcg attggggcgc ttgcgcgtgc tgtccggaag gtggtcgcct ccgtttgggg ttgcctctta cgcgccccct ctccccacgc acctacactc atctgaagca gtccctctaa tatcagctga cccatgttta ccaagaacta tagaacacag ccaacagtgc ctgggtgtga ctatagagca aacagctcca cctaagtggc ccaacacacc ttgctggcaa caagaagcca aatgttcacg caggcttgat gcatgttcgg ctcggctttc gagagggggt caatcagcgc ctataaaacc aggcctttcg aggcccagcc actcggcgcg cagatccaac accggtggac gtgggcgcta gggaggacac tgtctaaacc gccgggtggg gtgcacgctg gtattgagac gggcggggtc cccgcgcgcg agggggcgga tggtaataac ggcggcccga列表ctgcagtcca tactatgtgt ctaaattcag gggtccctca gagcagaaca ggtccggggg acgctgcccc gctgcacata cccagagcca ctccaaaact ctaggtctgg caccaggctc gaagacccct aaaccccacc ctcccggccc aaccgagcct acccagaggg ctgaatcggg ccagcaccca tctttttttt tgcactgtgc gaaagttgcc acgcgcagcc ttcgccgctc ctcccgtggg aaggctggag gggtgtagac tcagagcacg tgcagctttc gccaaacgcc tttggcttgc ccactgcgct ccttcctctt gccaccgggg cggggcgcct ccgccggcgg cctgccgtgg tgggcttcct tgccggaagt tatatggact atgcagagcc ttttctgtca cccctgcccc ctcttgggtg cgggagatct tcccagagtc actaacagag ccagctaacg gcccggactc ggcaagggac gccctgtctt ccaaccacag agaagtcccc attcaatcca ccatgctgac tcctggggtg cagtgtccac acgccaaaac tttttatttt ggctaggccg ttttatggct actgtcgagt cacacccgcc cagtgaccgc ggtggtgccg cctttacagc cggcttgggg gggtgttgaa acgatcatgc cgggcgggcg tgcgcgctct ccccctctcc ttgggcgagg gctcgcgctt ggcgaaggcg ggccgcctcc ttgtcccctg gggcagggcg2/23 页cacaaggaag aagccttcct gagacaggcc ctttctccca actcccatcc ctgacatttt tctctggtgg cccacagcct gatagatggt gccttggctt catgacaagt atcgggagac tggtgtgtgg ttttgcttct cagatctggc ggccccgcgt ccttgcccat ggtgcatgag aagggcggag tctccatcct ttttttttgc gtgagtgagc cgagtggccg ccgcgtccac accaggtaag gctgcagggt ggccgcggag cgcattgcca gaacccatta ccgtatctgc cttggtggcc ggcgcggcgg atggctgggt caagttaaac gcggggccgt cctgctgggt gggcttgcgc ggaccagcgt agtttgggcgagggccactg actgagcccc cccttcttgc gctaagccag agagcttcct ggagagcagg ctctttgagc ttcggctgtg ctggcaatca tcaggcagcc cagttccttt gtcactggac ccaaacctgt tagcaaattg gggggagtga cgtaaacata tgatatccac aaccgagacc gcctatgggg tctctctctc aaaaaaatgc tcgccgttcc cggcggcgca cagctctttc ggccacagcc gacaccgggg tttcagtcca ccgctctggc tgagagccga aaggtcggga ggtttgccca ggctgggttg gggagggagc ttggagcgcg gcagcggctt cactagccgc ggcctggctt gcggccggcc ggccgcggct24660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940101942442 A CN 101942447序列表3/23 页gcagcggctg cgcctagtgg cccgctagtg accgcgaccc tcttttgtgc cctgatatag ttcgccg <210>2 <211>2493 <212>DNA <213> 大鼠 <400>2 tgtgggaaag gtcacccttt caaggaagct ttccttggtt gccatggcag gtcactctct ctctgatccc cttaggtgag agcacttccc agtgtacagt caacgatgcc ggtgtgatca tgagcacagt aacacctcca ggtcaagatc acctagcaaa gcaaggggga gccactcaaa cccgtgacat tagtaaccga tgggcctacg ctctctcgct gggagagggg gccaatcagc tcctataaaa acaaccttct tcgggcccag cactcagaag gcaaagctta acactcgtgg3000 3007ataaagtcgc ccagactgga ggtctggcct tcaacaccta gtccagagca cccaggagtt ctgctgtagc gagagcaggg tgagtagttt tcagctgtgg tggcagtcac ggcagccctc tcctttctag gtcactggac cctgaagacc ttagaactgc gtgactctct tagggtccgg ccacacccag gtcactgaat gaaccagcac cgcttttttt gtaaaaaaat gcccgccgtt cccggcggcg tgcagctcct cgggccccaa ggacaccgta actttccgcc gcacgctccttctgaacctg ggcctctgca cctcatgcac cactttgtga tcccacctga gtgcgtcctt tatcagccaa ggttcttctc gtcactccca ctgcacataa ccagagccac caaaagtgcc gtccggggca caccggggct ttcccaacca agcagaaggc gcccattcaa gccttcaagc agggtcctgg gggatagtgt ccatcgccaa tcttcttttt gctgcactgt ccgaaagttg caacgcgcag ccgtcgccgg ctttaccttg gaggggtgga tagggtgtag gcttggtgcgggggtgtgtt acttcaaaat agccactgta gccagtgcac agcattctcc ctaagctaag atggctagct tctggaggat gagtccccgt tacatagagg tagctaacgg ggactccatg gaggatatct tgccctatcc cagctctgct ccccagatct tccagacccc tgaccctcgc ggtgggtggg ccacaagggc actcttcatc tttttttttt gcggcgaggc ccttttatgg ccactgtcga tccacacccg gccactacct gcgtggtacc agtgtttgca cggggcttgg25tccagtatgc gccctgccac gcccatatat acctactatg ttgcctaaat ctgagggacc tcctgagcag ttggggctct ggccagcaga ctagatggtg cccaggctta agaagttttg ggaggcatct ttgggactct tccaagttgt ggctttcctg gtgtgtccct ccacttaggt tgacccccag gggggctatt ctcttcctca tttttttttt cggtgagtga ctcgagtggc gtccgcgtcc ccaccaggta cgctgcagga gggccgcgga gtcgtattcc ggacacactatggagtggtg aagcctagaa ggatgaagcc catgtgtaaa atagctttct cgaccctcaa aactctccta ggtgaccacc tgaacagttc ggctccagcc gtcttgcctg cttgttcgat tcctgcaaca ggccttgagt accccaacac actattgcta caaacaaaag gatcattatt aatacaggcc cttgtccatc atctcgcttt gcaaaaggag gcgacgcgga cgctgtggcg acccgcgagt agcagggacg tcgtgaggaa gcggacactg cgcggtgtag gagtcgcggt60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800101942442 A CN 101942447序ggagagccgg attgggagtc tttgcccatt ccattgcgcg tcttcctctc gccgccccgg agggcgcctg cgtcgcctca ctgccgtggg gcgcttcctt gccggaagtg cttttgtgcc tgcggcttgc aggcgttaca cggcttggcg tgcgcgctct cccctcttcc gttgggcgag ctcgcgcttc gtgtaggcgg tccgcctccg tgtcccctga ggcagggcgg ttgatagttc列表ccgcatctgt gatggcctat ggccggctcg attggggcgc ttgcgcgtgc ttgcccggaa tggtcgcctc cgtttgggga tgccttttat gcgccccctg tcttggcggc ccaccttgag gggtctttgt gccgggtggg gtgcgcgctg gtattgagac ggggcggggt ccgcgcgcgc gggggcggag ggtaataatg gcggctcgag tccgcggtga4/23 页gtgggcattt gggacacagt ccaaaccggt ggctgggatg gggagggaac taggagcgcg cgtagcggct actagccgcc gcctggcttc cggctgtcct gccgcggctt ccatagccct <210>3 <211>2953 <212>DNA <213> 小鼠 <400>3 agaccagaat ggactgagag ctagtaaagc tgatggcatc cttattgaca gtccttgggc agtcctgtcc ctgcagaaga tgtttccagt aacttcaaaa tggatgaagc tgcatgcact atccagcttt tccggccctc gaacactggt cggtgaccac atggactagt cccagcccag ttgcctgggt gttctattgagggtgttaag atcacgcttt ggcgcggcgg atcactgggc gagttaagag ggcggggccg ctgctgggtg ggcctgtgcc ggccagcgtt gcttgggcgc cagcggctgc gcc1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2493tgtttcagag gtgacaaagt tgtctggtgt tttctccctt ggcagcattt agctggcaaa cccggaggca cttttgtcaa tcacagcata tgccctgcca cttctttggt gaggcacggc ctgtcacact aaccctgacc acttaggtga caacttttcc gcacaactca cgatgtctgg gtgatcaggc gcacagttccgtcgggtggg ggcaacacag cacccaagag gcaccccacc gccctgcccc ctgcctgagc gggaggagac attttttttt tgctggggtg ccagccaaga ttcaacacct aggcccagag ctcccagaag ccgtgtgtag gggggacagg ctgagcagct gctgtggctg cagtcaccca agttctccaa tttctagatcgctgaggtgc gtcctgcctg gctccctcca agggttctcc acccccacct aactgagaaa tgcctgggaa tttttttggt atggtcacct acaaggaagc acactttgtg catctcacct gtgcgtgtcc ctctcagcca ggctgcttct tgtcactccc cacataataa gagacactag aagtgcctga cggggcaggg26ctgccccttg ggaatctggt catcctgcac tgggaatact gtgacttgca tacaaggcca agttctctca gggaaagata cttccagaca tggccactgt agccagtgaa gaagcaccct ttctaagcta aatagctggc ctctggagga agaatcccca atagaggata ctaacggccc ctccatgaga gatatctggaaccagtccca ctgctctaac ccctgatggc ctgggctctc ggactggcag gggccagggc gggttggtga actaggggtg aggcctcagc agtccatata cacctaccta tcttgcctaa agctgaggga ttgctaagta tttggggctc cggctggcag gatggtgggc aggcttagtc agttttgttt ggcatcttct60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200101942442 A CN 101942447序ccagttattg agaggtcaag cacacctagc ttgctagcaa gtccctcaaa ttaagtgctc ccccagaatg gctattcctg ttcctcaatc tttcaaaagg gagcgacgcg gccgctgtgg cacccgcgag aagcagggac gtcctgagga agcggacact cgcggtgtag gggtcgcggt ggtccatctt tctgggtctt cgggcgcggc ctatcactgg cctagttagc gcggggccgt ctgctgggtg agcttgcgcc ggccagcgtt gcttgggcgc cagcggctgc gcc gaccactggg atccatgaaa aaattagaac ttgctagcaa caagaggcca gatatccacg caggcctagt tacatctggg tcgctttctc aggggagagg gagccaatca cgtcctataa cacagcttct gccgggccca tcactcagaa ggcacagcca acactcgtgg gtgggcattt gagagtacac tgtccaaacc agggccggct gcatcgaggc tgcgcgtgcg tgtccggaag tggtcgcctc cgtttgggga tgccttttat gcgccccctg tcttggcggc列表tgcttgggat ccagagttct ggggcccccc ctctctgtcc gtccgggcct acccagaggg ttgaatgggg cagcacccat tttttttttc atgctgcact ttccgaaagt cgcaacgcgc ttcgttgccg gctctctcgt gggcgggtgg tagcgtgtag gctcggtgcg tgcggcttgc accagacgct ttcggcttgc ggggctggga tagggaggga gggagcgcgg acagtggcac acaagccgcc gtctggcttc cggccggtct cccgcggctt ctatagcctt aggatggcct gcttccaagt cggatctggc attcaatcca cgatgctgac tcctggggtg cagtgtccac cgccaaaact ttcttctttt gtgcggcgag tgccttttat agccactgtc gtccacaccc ggctagtacc agggtggtgc actctttgca tggggcttgg gggtgttaaa acgatcacgc cgggcgggcg tgccactgcg gctcttcctc ctgcccgggg gggcgccttg cgtcggcgca ctgccctagg gcgcttcctt gccggaagtg cttttgtgtc5/23 页tgcaacacct tgagtctcta tgaaccccaa tttccggcta ggccccgcgt cctcatccac gttgggtgac aagggcggag cttcatcctc tttttttttt gccggtgagt ggctcgagtg gagtcgcgtc gccaccaggt tcactgcagg cgggccgcgg gccacattcc ggacacacta agccgtatta ctcaatggcc ggcgggcggg cgtgcgctct tccccctctt ttgggcgagg tttgcgcttc gtgtaggcgg tccgcctccg tgtcccctga ggcagggcgg ttgatagttc <210>4 <211>4164 <212>DNA <213> 仓鼠gctcgcccta acctctccaa cacagcagaa gggggagtga cacaaatagg tgacatccac aaccgagaca cctacggagc tctcgctttt gggtaaaaaa gcgcccgccg aacccggcgg ttgcagctcc gcgggccttc cggacaccat actttacgcc gcccgctccc gatgagccgg agtattggga ggtttgccta cggccgggtg gcgtgtgcgc tattgaggct gggcggggtc ccgcgcgcgc gggggcggag ggtaataatg gcggctcgag cccgaggtga1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 2953<400>4 aatgctgcac tgtgcggcta ggccggtgag tgagcggcgc ggagccaatc agcgctcgcc gttccgaaag ttgcctttta tggctcgagt ggccgctgtg gcgtcctata aaacccggcg2760 120101942442 A CN 101942447序cagccactgt cgctccacac gtgggcagtg tggagggtgg tagacccttt gcacgcggct ctttcgggtg acgccacgat cttgccgggc gcgcttgcgc ctcttccccc cggggttggg cgcctgctcg cgggggggcg ccgtggggcc cttcatttgt ggaagtgggc ttgtgccctg ctccggcatg catcgtgggc gggttttcct atggtgggca attctgaccc aagatctggc ctgctcaccg agccagggtg ttcttctgcc cagtttctgc tgttttaaac aatgaggctg aatggagccc ctgcatgtcc gtttgacaat tgtacgtagc tgatggactc ctcatgccat tcctgaccga tcaaagagaa cctcttcctc cgagtccgcg ccgccaccag accgcgctgc tgccgggccg acagccgcat tgggggaacc ttgaaccgta catgccttgg gggcgggcgc gctctatggc tctcccaagt cgagggcggg cgcttcctgc aaggcgggtc gcctccggac cccctgagtt agggcggcaa atatagttcg tgcaaagccg cgccctaggc ggggggagag tgggccagaa tgaagtaccc accacacctt aggcccccct gccacctcca gttctcccat tttttccccg cctacggtgc gtgataagtg ctgtcctgag catatctgtc gcctcatttt cattcaggct cggagacggg cctgcgtctg gcgtggctac gctgtgctat cctggagaag列表agcacaggcc acaacaggcc gggacactcg actttcagat tagacaccgg gcagtgtggg ttggggggag gtctttgtct gctcggccgg ggcgcgtgca cgtgcgtatt ggaaggggcg cgcctcccgc ttggggaggg ctcttatggt ccccctggcg tagtggcccg cgatatcgct cgacgatgct tgacccttcc tgagaacatc gtgggtgacg ggcattgtca ctgcgtgtgg gccaaccgtg cttctcggcc tctatgagct ttttttctct ggtactaaca gtgtattcag gcacacttac tacctgcctt tcatgtttga tgtatgcctc ctgtgcccat gccgggacct ccacagctga acttcgagca tgcctgatgg tttcgcagct cagccggcca gcgcggacac ccaactttca tggacccgct cgctatgaga gacacaaggt aaaccggttt gtgggggctg cgctggggag gagacttgga gggtcgcaga gcgcgcacta ggcggagacc aataacgcgg gcccgagacc ccagtgaccg gcgctcgttg ccccgggccg ctttgcgggt gttcccctcc aggcccagag ccaactggga cccccgagga aaaagatgac acgccctttc gagtctccct tgattgcctt atgactcgtg tagatgcaca cttagctgtg gactacttgt gaccttcaac tggtcgtacc ctatgagggc gacagactac gagggaaatt ggagatggcc ccaggtcatc6/23 页gcgcaacgcg ctttcttcgc cagccctccc cggggaaggc gtccagggtg ctggctcaga gccgatgcag cgggagccaa gcccatttgg ggttgccact ggagcccttc gcgcggccac ggattcgggg gaccgcccgg tggcttcctg ccggcctggg gcggcttgcc cgaccctctt tcgacaacgg tcttcccatc agcgatgctg gcagggcgtg caagagaggt cgatatggag gcaccctgtg ccaggtcagc tcaattgtct tggaactttg tctgactagg tgacaaacct gtaggtttaa ttcttgcact ggcttttgga accccagcca actggcattg tacgctctcc ctcatgaaga gtgcgtgaca actgctgcattccacccgcg gtaagcaggg agggtcgcgg cggagcggac tgccacggtg cattagggtc tctgcccacc tggcccatgg ggcgggcccg tgggtattgg taaacttgcg gccgttgtcc tgggtgtggt ttgcgcccgt cagcgtttgc tgggcgcgcg cggctgcgcc ccatggatga gcttcgcggg accaggtagg gtgaccatat ggactcctac cattgaacac ctacaacgag gaaccccaag tctttgccaa aggactctct atgaggtcct tgtgggtgta gccttggagt atttctccca ctgacagtcc tctttataga gtgctgtccc gtcacccaca gacctggctg agctttacca gttgccctgg agctatgagc28180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460101942442 A CN 101942447序atgagcggtt gacctagttt atctttctct caattccatc gtctggtggt tctggctccc atgggccctt atcactgtgt tcggtggctc agtacgatga gagctgtgtt caacattggc gttttttttt gtgaaggcga gactttgatt caggaagtcc cattccctga caaaattttt ccatcgtggc tttggtctcc cttgagacca ctagattctg gggtggtctg accagttatc aagggtgtcc aaccctgtaa agctttactg gctttaccag ctttccccgg ccgttgccct cttcatctaa ttcccttttc atgaagtgtg accaccatgt agcaccatga ccaggtcaac cttggcttct catcctggcc gtccggcccc ttacaccctt atggctttgt ttttttgtgt cagcagtcgg gcacattttt ctcaccctcc gtccacaccg ttaaatcttc cccttttttt ctgggagtgg gtttaataaa ggtagcagcg ggccttgcct acaaataccc atcctgaatt tctcaacctt cctttgagtt atacatgatc tacc列表tccagccttc ctcttgatct ggaatcctgt ccgcaaagac tgctgaccgg gagctaagca tgggtaagac ctcctcctga ccttccagga accgcaaatg aacctaactt tgttttttta cttttgactc catcccccaa aagtcattcc ccccattccc agcattgctt cttcttttgt tttgtccccc tgaggcagcc tacaaacagt tcactattac agtgggagga gttctgaagt cctgggccaa tgtgggaagc gtgggaagta agggtgttaa cttcctgggt tgagaccatg ggcatccacg ctctatgcca atgcagaagg tccttagcct aggagtccag gcgcaagtac gatgtggatc cttctaggcg gcgcagaaaa atttttttaa aggatttaaa agttctacaa aagtacccat tagaagagga ctgtgtaaat ttttaatttt caacttgatg agggcttgcc gctgcttgtt ctttgctcca cacaagcatc cttaattgtg gttgggttcc aggaatcctg aaagcagtct ggctccccag7/23 页accattggca gagttgaagt ctataagtct aaactacatt acacagtgct agatcactgc tggacccatg agcactcact tctgtgtgga agcaagcagg gactgttact aaaaatgaga aaaaggtttt aactggaacg tgtggctgag gagatggcta tggctgagtc tatggactcc ggatggtcaa tatgaaggct tgtacactga tgtggctttg agaggttcta atgaccttta tcttggttgg tgcagcaaac ttgggagggt cggttctctt gcatgggtat <210>5 <211>2011 <212>DNA <213> 人gaggctcttt tggtgaccaa cctcaggtat acgtcgacat acccaggcat agatcaaggt cccttgactg cagatcattg tcactgtcca tccatcgtcc tctttgacaa ttttttgttt tgttttggcg ttggagcaaa tttctttttt caaaagccat gggaggtgac cgccttaaaa tttttttttt gttgaggtgt gtgcacacct ggggaggggg agtagttttt tgtccattga gggaataccc cctctacctt ctgcaagaca acaaagttta2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4164<400>5 gagctctgtc tcttggccag ctgaatggag gcccagcggc aacacaggtc ctgcctgggg atcaggtctg ctctgcaccc caccttgctg cctggagccg cccacctgac aacctctcat ccctgctctg tagatccggt cccatcccca ctgcccaccc caccccccca gcactccacc2960 120 180101942442 A CN 101942447序ttccacgaac cgccccacaa tacaaggcca agtttgccct ctgtgtctgc aaccttcaag agcagcctcc cgacacacac ccccacctca aggaggggga cccacgccac gcagaacgga aaagggtgac cccaatcctc gtctgggagg agacccaggc ccccaggcct aaaaggtgcc tagccttcat agtgtggtcc cctctcaagc acagccagag gtgactgcct agggccctgg atgtccacac gcaggcctgg gcgcgcgccc cctcctcttc ggtaaaaaaa tgcgccgttc ccagcggcgc ccccagaacc cgccagccgg gggacaggac tgcgtggggt cactgtgtgc ggaggagcag ttcctggcca tcaatgaaca ccactcttcc ggaggaggaa tgatcgctgc ccctgcccac aaggacaggg tgtggcacat gcagttcagc tgtgtagacc ggtcttggct ctgccctgta cacgggccac tgcgactcta ccaggtctct gtcctcaggc ggccactcca cacccgtgca ctaggatgtc ccatgcgggg ccagcccccg ctcaatctcg tgctgcactg cgaaagttgc gacgcgccac列表aacaggcagc gcgttggcag ccaggaggca gaggctcagc tcatctttcc ctgagcacag gtccttatat gctgcaaaga taaaaatcca tctaggctga cctgggtaca gtgctactca ctggctttga tccccagagt catagcagac gccccgcagt gttaccctca ccttcccagg tggaccgctg gccacctgac ccacccagca gggcagttgc gagctccttc caccccacct tggggggccc cactgcccag cccaaggcgg tttttttttt cggtgagtga tcgagcggcc aagaagggcc gtcctgaggc gggagtatac aagtcttctg caccaggctg ccttgtacgt ggactcatct gccccgcagg gcttcttgtc gccgaatgcc cacagtctgt gtggacagac gttcctagca cccccagcgg atacaacgga gcctaggtca aaagcaggca gctgcggctg gcccctgccc tcccccaaca catttagcta tctgaagtcg tgcaggagcg gggcgctcag gagagacggg cgtggggcgc ccaacgccaa cgcaaaagga gcggcgcggg gcggcggcgc8/23 页cagttcaacg ccccgcccat agctgaaaga aggctgggga gactgtgaac tggcctctgc gaactgaaca ttgcctattg cctgaggtgc accacctcca cctctgtggt gattcccgga ccaaggcaag ccgccccgcc cctccagatg cggtgggccc cccactaacg gctccagggt ggtaggtttg tgtcctgggg ccacactcta gctgagcccc gcaaggggga tacagaaccc tgcccaagag caggccgggg gggggccacg aactctccct ggggagaggg gccaatcgcg cctataaaac <210>6 <211>1278 <212>DNA <213> 鸡agccctcatc gtgaactgta agtcccatcc ggtgatggag tgggtggtgg gtcccattgg caggttccat cctactacgc tatttttgtg ggcaggttcc atgcccacca ccggtcttgt tcttcccagg ggagtcttgg tgtggctgcg cagccccccc gggcgtgact gagcccactt ctccagccac atggccgcaa ccctagtgac cctgctttca tgccctccaa gaccctggcc ccgcggtggg ccgaaccggg ggcccagcac ctctcgctct tcggcgaagc cttttatggc c240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2011<400>6 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa3060101942442 A CN 101942447序atttattttt gcggggcggg atcagagcgg ataaaaagcg tccgcgccgc gcgggcggga tttcttttct gggagcggct cgctgcccgg gcgcgagggg aaaggctgcg gggctgtaac tgcggggctc ggtgggggtg cggcggcccc tggtaatcgt ctgggaggcg gaaggaaatg ccagcctcgg ttcggcttct cagccatg taattatttt gcggggcgag cgcgctccga aagcgcgcgg ctcgcgccgc cggcccttct gtggctgcgt cggggggtgc cggctgtgag agcgcggccg tgcggggtgt ccccccctgc cgtgcggggc ccgggcgggg ggagcgccgg gcgagagggc ccgccgcacc ggcggggagg ggctgccgca ggcgtgtgac列表gggggcgggg gggcgaggcg ttatggcgag tcgctgcgtt tctgactgac gtaattagcg aagggctccg gtgtgcgtgg gcggcgcggg cccgcggtgc gggtgagcag ccgagttgct gctcgccgtg tcgggccggg ggcgcggcga cctttgtccc ggcgcgggcg gtcgccgcgc tgccttcggg tatatcttcc gggggggggg gagaggtgcg gcggcggcgg gccttcgccc cgcgttactc cttggtttaa ggagggccct ggagcgccgc gctttgtgcg gggggggctg ggggtgtggg gagcacggcc ccgggcgggg gagggctcgg gccgcagcca aaatctggcg aagcggtgcg cgccgtcccc ggggacgggg cttctctgtt9/23 页ttttgtattt cgcgcgccag gcggcagcca cggcggccct cgtgccccgc ccacaggtga tgacggctcg ttgtgcgggg gtgcggcccg ctccgcgtgt cgaggggaac cgcggcggtc cggcttcggg ggtggcggca gggaggggcg ttgcctttta gagccgaaat gcgccggcag ttctccatct cagggcgggg cctccgcagcgtgcagcgat gggcggggcg aagtttcctt cgggcgggag ccgccccggc cctccgggct gaaagcctta gtgcgtgtgt cgctgcgggc ggggcggtgc gtgcgtgggg acccccctcc gtggcgcggg cggggccgcc cggctgtcga gcagggactt ccctctagcg gccttcgtgc gggggacggc cggcggggtt120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1278<210>7 <211>3668 <212>DNA <213> 人造序列 <220> <223> 来自 CHO 细胞的较长 β- 肌动蛋白启动子序列 <400>7 cttcctccac catcaaactc cttcttcatg cccctcagtg ttgtttgatg tgactgtctg ctgggctata tgcctttaatttcctcttcc aacaactcag gctgaggaca tgtgtgtagt ttgtgggggt catagctact tagggagaca cataacactccccaccccca gcatccccct cccaggccag gggaggaagt tgggggcagt caggaagctg ctatttcaaa aggaagtacaccctgttttc ctggccctgc gcagcctcgt gggggtgttg gctgagttaa aggcaggaag caaacaggag ggcaggagga31tgtgctctct catcttctca attcatccaa gagcccctca gactagcctg atgaggagtt gagctgggca ttaggagttccctgtctgca gggtcctctc cagaacagag aagggctgtc aatagcacca ggaggccagc tggtggcata aaggttactt60 120 180 240 300 360 420 480101942442 A CN 101942447序gagaatttga ccccacacac cttgctttct acagaaccat tgcctgcccc ctgggaatct cttattcctg tgagaacact gtgaattgca tacagggcca agttctctct gggaaccaca tttccatact gttggtccag ttggtttcaa ccgagcatct aggaggtgtg cctagtgtag tgataaatag gattgagggc tccagatgga tgggtcccag tagttttttg ttttgcttgt catcttcctg gccctgagtc taaattgtac ctttccggct tgttcctcaa tcgaggtact gccccagaat ggcccagtca tcttcctcaa caaaaggagg cggcgcggag gctgtggcgt cccgcgagca gcagggacaa tcgcggggga ggccagtcta aaaaaaaact ctcatgccta aagccagtgg ttgaaccgtc ggtctgctcc cacccctggt gccggcagtc gggctggcag gggccagggc ctcaggccca gagtagccct ggaggcctct cctccccacg cacctacact catctgaagc tgtccctcta gtatcagctg gcccatgttt tccaagaact ctagaacaca cccaacagtg cctgggtgtg tctatagagc caacagctcc tcctaagtgg cccaacacac attgctggca acaagaagcc caatgttcac gcaggcttga tgcatgttcg tctcggcttt ggagaggggg ccaatcagcg cctataaaac caggcctttc caggcccagc cactcggcgc列表gacactgtca ccaagaaaat ggaaaatggc aaatgttcca gaggtgacaa agctgcctgg gtcttctccc ggcagtattc agctggcaaa cccggaggca tgcagaaggc gtgtgcttcc aatgctctgc gctgcagtcc ctactatgtg cctaaattca ggggtccctc tgagcagaac gggtccgggg cacgctgccc ggctgcacat acccagagcc cctccaaaac tctaggtctg ccaccaggct tgaagacccc gaaaccccac actcccggcc aaaccgagcc cacccagagg cctgaatcgg gccagcaccc ctcttttttt ctgcactgtg cgaaagttgc aacgcgcagc cttcgccgct cctcccgtgg gaaggctgga aaaaaacaaa caatctctct cattgcagac gaggtgggat agtggcaaca tgtcacacaa ctgcagccac gctctgcccc ccgcctgaac gggaggggac ttctgtcaaa agtatactct taccaaccta atatatggac tatgcagagc gttttctgtc acccctgccc actcttgggt gcgggagatc ctcccagagt aactaacaga accagctaac tgcccggact gggcaaggga cgccctgtct tccaaccaca cagaagtccc cattcaatcc tccatgctga gtcctggggt gcagtgtcca aacgccaaaa ttttttattt cggctaggcc cttttatggc cactgtcgag ccacacccgc gcagtgaccg gggtggtgcc10/23 页gggctacata agaacaaaac ctcgttatct cgggaccaag ggggccagag caggtcctgc gaggccccca caggctcccc acccccacct aactgagaga gtgctgggaa tctcttttgt ggggtcaccc gcacaaggaa taagccttcc cgagacaggc actttctccc cactcccatc gctgacattt ttctctggtg ccccacagcc ggatagatgg ggccttggct ccatgacaag catcgggaga ttggtgtgtg gttttgcttc ccagatctgg aggccccgcg cccttgccca gggtgcatga caagggcgga ctctccatcc tttttttttg ggtgagtgag tcgagtggcc tccgcgtcca caccaggtaa cgctgcagggggctgcgtga tcccaacaaa agagaacact gatagatcag ccagggacca tacttagtaa ggtaggtggc ctcattgaca gtcctcaggc agtcccgtcc ggttggtgac gaacgtgggg gcaacttcaa cagggccact cactgagccc acccttcttg agctaagcca aagagcttcc aggagagcag actctttgag gttcggctgt cctggcaatc atcaggcagc acagttcctt agtcactgga cccaaacctg ctagcaaatt agggggagtg acgtaaacat gtgatatcca taaccgagac ggcctatggg ctctctctct taaaaaaatg ctcgccgttc ccggcggcgc gcagctcttt cggccacagc ggacaccggg32540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820101942442 A CN 101942447序gcggacactt acggtgtaga agggtcgcag cccaccttgg ccatgggtct ggcccggctc tattggggcg cttgcgcgtg ttgtccggaa tgtggtcgcc cccgtttggg tttgcctctt gcgcgccccc gcgcctagtg tcagatccaa caccggtgga tgtgggcgct ggggaggaca ttgtctaaac ggccgggtgg cgtgcacgct cgtattgaga ggggcggggt tcccgcgcgc gagggggcgg atggtaataa tggcggcccg gcccgctagt列表agggtgtaga ctcagagcac atgcagcttt agccaaacgc atttggcttg gccactgcgc cccttcctct ggccaccggg tcggggcgcc cccgccggcg tcctgccgtg ctgggcttcc ttgccggaag ctcttttgtg11/23 页gggccgcgga ccgcattgcc ggaacccatt accgtatctg ccttggtggc gggcgcggcg tatggctggg ccaagttaaa ggcggggccg tcctgctggg ggggcttgcg cggaccagcg gagtttgggc ggcagcggct gttcgccgctttcagtcc cccgctctgg atgagagccg caaggtcggg cggtttgccc gggctgggtt ggggagggag cttggagcgc cgcagcggct gcactagccg aggcctggct cgcggccggc aggccgcggc gaccgcgaccccctttacag 2880 gcggcttggg 2940 cgggtgttga 3000 cacgatcatg 3060 ccgggcgggc 3120 ttgcgcgctc 3180 tccccctctc 3240 gttgggcgag 3300 tgctcgcgct 3360 gggcgaaggc 3420 gggccgcctc 3480 tttgtcccct 3540 tgggcagggc 3600 ccctgatata 3660 3668<210>8 <211>19 <212>DNA <213> 人造序列 <220> <223>β- 肌动蛋白的正向引物 <400>8 gctctttctt cgccgctcc <210>9 <211>19 <212>DNA <213> 人造序列 <220> <223>β- 肌动蛋白的反向引物 <400>9 accaccctcc agccttccc <210>10331919101942442 A CN 101942447序列表12/23 页<211>20 <212>DNA <213> 人造序列 <220> <223>EF-1 的正向引物 <400>10 gaacgcaggt gttgtgaaaa <210>11 <211>17 <212>DNA <213> 人造序列 <220> <223>EF-1 的反向引物 <400>11 ctcggcagcc tccttct <210>12 <211>16 <212>DNA <213> 人造序列 <220> <223>rpS21 的正向引物 <400>12 gtggacctgt acgtgc <210>13 <211>20 <212>DNA <213> 人造序列 <220> <223>rpS21 的反向引物34201716101942442 A CN 101942447序列表13/23 页<400>13 ttctcacttt tatttatgac <210>14 <211>21 <212>DNA <213> 人造序列 <220> <223> 铁蛋白的正向引物 <400>14 cgccagaact accaccagga c <210>15 <211>20 <212>DNA <213> 人造序列 <220> <223> 铁蛋白的反向引物 <400>15 ttcagagcca catcatcccg <210>16 <211>21 <212>DNA <213> 人造序列 <220> <223> 半乳糖结合蛋白的正向引物 <400>16 tggtcgcaag caacctgaat c <210>17 <211>20 <212>DNA3520212021101942442 A CN 101942447序列表14/23 页<213> 人造序列 <220> <223> 半乳糖结合蛋白的反向引物 <400>17 ttgaagtcac cgtctgccgc <210>18 <211>17 <212>DNA <213> 人造序列 <220> <223> 正向 M13 引物 <400>18 gttttcccag tcacgac <210>19 <211>14 <212>DNA <213> 人造序列 <220> <223>alu 重复 SAGE 标签 <400>19 catggaagca gaat <210>20 <211>14 <212>DNA <213> 人造序列 <220> <223> 线粒体 COX I SAGE 标签 <400>2036201714101942442 A CN 101942447序列表1415/23 页catgcaggag cttc <210>21 <211>14 <212>DNA <213> 人造序列 <220> <223> 核糖体蛋白 S21 SAGE 标签 <400>21 catgggggag cgtt <210>22 <211>14 <212>DNA <213> 人造序列 <220> <223> 线粒体 COX II SAGE 标签 <400>22 catggtactg acac <210>23 <211>14 <212>DNA <213> 人造序列 <220> <223>GAPDH SAGE 标签 <400>23 catggcctcc aagg <210>24 <211>14 <212>DNA <213> 人造序列14141437101942442 A CN 101942447序列表16/23 页<220> <223> 线粒体 ATPase SAGE 标签 <400>24 catgataata cgta <210>25 <211>14 <212>DNA <213> 人造序列 <220> <223>B-1 重复 SAGE 标签 <400>25 catgccttta atcc <210>26 <211>14 <212>DNA <213> 人造序列 <220> <223> 线粒体细胞色素 B SAGE 标签 <400>26 catgaatcgg aggc <210>27 <211>14 <212>DNA <213> 人造序列 <220> <223>EF-1SAGE 标签 <400>27 catgaggcag acag1414141438101942442 A CN 101942447序列表17/23 页<210>28 <211>14 <212>DNA <213> 人造序列 <220> <223> 半乳糖结合蛋白 SAGE 标签 <400>28 catggcggca gacg <210>29 <211>14 <212>DNA <213> 人造序列 <220> <223>Alu 重复 SAGE 标签 <400>29 catggtggct caca <210>30 <211>14 <212>DNA <213> 人造序列 <220> <223> 铁蛋白重链 SAGE 标签 <400>30 catgttggct gccg <210>31 <211>14 <212>DNA <213> 人造序列 <220>39141414101942442 A CN 101942447序列表18/23 页<223> 未知 SAGE 标签 <400>31 catgccctgt gccg <210>32 <211>14 <212>DNA <213> 人造序列 <220> <223> 核糖体蛋白 L41 SAGE 标签 <400>32 catgagagcg aagt <210>33 <211>14 <212>DNA <213> 人造序列 <220> <223> 线粒体脱氢酶 SAGE 标签 <400>33 catgaggagg ccta <210>34 <211>14 <212>DNA <213> 人造序列 <220> <223>β- 肌动蛋白 SAGE 标签 <400>34 catgccctga gtcc <210>354014141414101942442 A CN 101942447序列表19/23 页<211>26 <212>DNA <213> 人造序列 <220> <223> 扩增含有内含子 1 的 β- 肌动蛋白启动子的正向引物 <400>35 aggcccagct tgggaccaag acagaa <210>36 <211>27 <212>DNA <213> 人造序列 <220> <223> 扩增含有内含子 1 的 β- 肌动蛋白启动子的反向引物 <400>36 cgcggatccg gcgaactata tcagggc <210>37 <211>1884 <212>DNA <213> 人造序列 <220> <223> 编码酸性鞘磷脂酶的 cDNA <400>37 atggcccgct caagacggga ctggcgctgg tctccccaag gggtggggga ctgaagaagg ctgaagatag gtggaggtgt tccacctgtg2627acggagcgtc ccgccggagc ctctgtctga gccatcctgc acctcacctg aacccaatgt caccacctgc ggagacgctc ggcactgggaactccgccag ccccggactc ctctcgggtt caggttacat cccaatctgc ggctcgcgtg cgtgtgccaa agtgctgagc cattttctcaagctgcccca ctttggatgg ctctgggctc cgcatagtgc aaaggtctat ggctccgtgg tccattgtcc ccatctgagg tcttggaaca41ggtccggccg gcctggcgct cggcagaggc cccggctccg tcaccgccat ccatcaagct acctctttga cctgtggcct tctctttgccggagcaggga ggcgctggcg tcaccctctt agatgtcttt caacctcggg gtgcaatctg ggatgacatg gctcctgggc tactgtgccg60 120 180 240 300 360 420 480 540101942442 A CN 101942447序ccaaaccccc acctgcactg gctgccgccg aatacagcaa cagccggccc accagactcg tcctggggcc gcttccctcc ccaaggcttg tctatgctct cccgtgagaa tggtggggga ttcccccagg atgagaacac tctatgatga ctacctacat ggagctctca taccgggagc ccaacacact ttttccagac cgccctgccg tgtgccgcca cactgttttg tagcccccca ggatcatgac gggttctggc gtgtgacctg ttttgatatg tcaggaccaa agtgccagtg ccccttcatt ggagccctgg ttccccatac cttctggctc gcttcaggct gcactgtctg cctggctgct agagactctg cggccttaat cgtggtcctg cataccgcac gcctaccgcc cttctggttt tctggctact cctgatgcca ctga列表cccctgtcag gcacggaccc catcccggcc ccctggagag caggagacat tgaccaccgt tgggtaacca actcctcccg aagccctgcg gcctcatctc ccacggatcc gaggagacaa gctggaatta gccacactca tggctgtagc gtgtgtacca cctacatcct tctacagggc tggtatatcg agggccaccc agctctctgc tcccagaggc ccgcatcctc tgactgtgca aggtgccgga cctgttgagt ccccgcacat cacagcactt tgaaagcaca ctggctctat caccctcaga tctcaatatg cgcaggacag agtgcatata ttaccgaatt tgtggatgaa cttcctggca aatagatgga gaatctgacc tcgagaaacc catgcggggc accctcggag ccgtgctgac ccagagcctg20/23 页aagccgcccc ttcctcactg gacccactgt tactggggcg gggctgggcc gatgtctggc gtgaggaagt cctgtcaata gaagcgatgg attggggggt aatttttgtt ctccagtggc attggccaca gtagccaggt tttgaggtct cccagtgcaa aactactccg caggcaaaca tatgggctgc gacatgcaac ccctgtggca agccctgctc tggccaaggcgccccaggtg tacctggagg ctgccgcccg cccctgagga gtgtactgga ctgcgggccc taccctgctg gagggcaacc ctgcctgccg cccggtctcc ttgatcaact gctgaggatc aagagctgga cagttctttg agccggccgc cctggttacc gaccatgaga tggcagcttc tggcacaacc ctctaccata ctttgtgccc gatgggagcc600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1884<210>38 <211>2859 <212>DNA <213> 人造序列 <220> <223> 编码 a- 匍萄糖结合蛋白的 cDNA <400>38 atgggagtga ttggcaaccg gagctgagtg agcagaccag cagtgcgacg gaacagtgcgggcacccgcc ctgcactcct gctcctcccc ggccccggga tcccccccaa aggcccgcggctgctcccac ggggcacatc agtcctggag tgcccaggca cagccgcttc ctgctgctaccggctcctgg ctactccatg gagactcacc caccccggcc gattgcgccc atccctgcaa42ccgtctgcgc atttcctgct cagctcacca gtcccagagc ctgacaaggc agcaggggctcctcgtgtcc 60 ggttccccga 120 gcagggagcc 180 agtgcccaca 240 catcacccag 300 gcagggagcc 360101942442 A CN 101942447序agccctggtg ctgaaatggg tcctgaccct aagatccagc caccgtcccc ggcagctgga agttccttca tcagtcccct cgcccacgcc gcgggtcggc cgagccctgc gcccagagcc cgccatactg cccgccaggt acctggacta tcccggccat ctgccatcag ggggggtttt ccactgcctt ctgagttcca acttcatcag tgcctggggt ttctctccac acagggcgct ctggccacgg tcgcctcctc ccgacgtctg tgggggcctt cgtacagctt cactcctccc cccggcccct tcctgtgggg ctggctactt gcagcctccc gggtgacgct tccccctgca ctgtggccct gcctggaagt cgatcgtgaa cttcttccca ctacacggcc gcggctggac taacaggcgc actctacagc cggccgcgtg gctgtccacc gatgctcagc cggtgcgaac acacggggtg ccttagctgg caagagcgtg gggcctgggc ggtggagaac catggactcc ggtgcaggag cagctcgggc catcaccaac ccccgacttc tgaccaggtg gggctctgag ggttgggggg acactacaac ggtgaaggct ccgatacgcc cgtgccagaa cggcttcctg ctaccccttc cagcgagccg ccacctctac cttcctggag ggaggccctg ccccttgggc acccccacct gccggccccc gggccctggc gaccaagggt gctggagcga列表ccagctacaa gtaccacccc agactgagaa ccttggagac ctgaggagcc cgacggtggc cgcagtatat ccaggatcac ctcacccttt acagcaatgc gtgggatcct acctggacgt gccgctgggg cccacttccc tcacgttcaa gcggccggcg gctacaggcc agccgctgat cagccctggc gcatgtggat ccaacaatga cggccaccat tctacggcct gcccatttgt cgggggacgt ttaacctgct cagaggagct acaacagcct ccatgaggaa accaggccca actctagcac cagtgctcca acctgcagac gtgagccagc tcaacgtcca cagagtcccg gaggggagct cacaggtcat gctggagaac caccttcttc ccgcctccac cccgcgtgtc cttcggggtg gcccctgttc cacaggcctc cctgtggaac ctacctggcg catggatgtg ggatgtctac tgtgggatac ctactcctcc cctggacgtc caaggatggc ctacatgatg ctacgacgag tgggaaggta ctggtgggag tgacatgaac gctggagaac ctgtgcctcc gaccgaagcc gatctcccgc gtggagctcc gggggtgcct gtgtgtgcgc gctcagtctg ggccctcacc cgtcgcgggg ctggactgtg ggccgggaag ggtgccaata catccacagc cctccgggct ccagcagccc gttctgggac cttcctggcc21/23 页cagatggggc ctgagctcct cccaaggaca ttcacgatca cacagccggg atcgtgcacc tttgcggacc gccgagcacc cgggaccttg ctggaggacg gtcctgcagc atcttcctgg ccgttcatgc accgctatca caatggaacg ttccgggact atcgtggatc ggtctgcgga tggcccgggt gacatggtgg gagccttcca ccaccctacg agccaccagt atcgcctccc tcgacctttg tgggagcagc ctggtcgggg tggacccagc ccccaggagc ctgcgctacg gagaccgtgg gaccaccagc gccgaagtga gaggcccttg gaggggcagt gggtacatca atggccctgg gatggagaga aggaataacacccagctacc accctgaccc gtgatgatgg tacgaggtgc gtggagttct ctgctgaaca tcgctgccct accagctgga ctctacgggt ttcctgctaa aggtcgacag gtgcagcagt ttccacctgt atgaccaggg cggagggact ctgcaccagg cctgccggga gagaccggcc accaacccca cccttcgacg gacggctgcc accctccagg ctgcacaacc cgggggacac ggccactgga atcctgcagt ggcaacacct atgcggaacc gcccagcagg acgctgttcc ttccccaagg ctcatcaccc acatggtacg gcagctcccc ctggacacca ctcacaacca ggagaggccc ggggcctaca420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700tgagctggta cgtgtgacca gtgagggagc tggcctgcag43101942442 A CN 101942447序列表22/23 页ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg ctgttgatgg gagagcagtt tctcgtcagc tggtgttaa <210>39 <211>1958 <212>DNA <213> 人造序列 <220> <223> 仓鼠 rpS21 启动子 <400>39 gatcaacatt cattggatga tgggctggtg gggtcattaa ttgagctttt agcagatgga ctgagtcagt ccttgctgtt ttgtgggctt ggagttattt taggcattgt tatgtgcact tgctgagtag actctgggtg acaggtgcag ccttccaagg ttccagacac tgacagtcct catttaactg gttctacaga acagtgtaga cctgagcgtt tgtactgcac gcaggagagg ggctggtctc ccgccgcgac2760 2820 2859tacgctggct ggacccagta tctgctggtc cactgaggag ctattagtgc acacattcta cctgggtcag ggatttggca catgctgcct ggtaatactt tcagggcagt aaactttttc agctactgca tgctccatct ctctcaaagc gcagtggcta aatgcccaca gggaaggtgt ggtgtgcaca taagcgagac ctgggagtct aggggcattt cctctgggca gcagggcctg ggcggttccc tggcggcggcgttttaatga agtgctgaga aaggtaccag gcttgtttat tacaagtatg tgaaaacccc tttcaacggg gtctctgagt ttgtgttccg tgacccttgc tactggaggc acctgtttcc aatttctggg ctggccacta taaaacacaa tggttcttgt cctgctttcc cgggtgcgcg cctgaggcac aagcggtccc tgtgtccggg tcctcctggt gactcacaac ggtggagacg actggactgc ttccggggaggagcaccggt gccgcagatg aggctgcctc tagtttactc catcatggtc tatcacaacc ctgttctttc ggataccaga tttttttttt aggccctgtt tagacctttc agtccctgcc gttttccttg aagagacctt acaaaccacc ttctgatgca caggcgtgag tggcagggag cagtctgccc tatgtgaaga ctggtttgca ttttaaagat actgggcggc ccgcagggga cgctctgctg cgatttccag44cttgggtcac tagccggtgt agcttcctca ttttctttcc tgcttctcgt ctgtctacta tctcattagt aaatacgatt tttggggggg tttatgatgt tcaacactct ctttttagga gccactttct cagggttcaa cttgtacaca cagaaagggt gagggtttca gggagagctc agagagacat atgtaacggt gcctcttcaa tttatttgtt cggatgccgt gcgcgccggc acacccgtgc gtgcaggtctctcactgtca gggtgaatgc gagggacaaa acctaaaagt gaaggttttg attctaaact ggccatattc ttttcctttg gggatgtggt tagggggccc aacccagtgc ctgctgaatt ccttactggc ctcaacacac ggcctcatgg ctagtggaaa gcagacctca tccccaagat caggtgcaca aggaaaacca cagggggctg atgtagacag gctggccaga ccggacgcct ccgcctccct ggggtgtcgg60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560101942442 A CN 101942447序ggcgagccgg cctcaacctc gctgtgggcg agagccaggc agcggaagaa gaagtattca ttcctttctg ctcccttcga aagcagggga gagctctcct tccagtgtct aagactccca ccacacgcac cgctccgctg列表atcccgcgcc gggcggggca gagctggggg gcggaagagc cggaacggtg gcccaagaga cccgccgccc cgaagagcgc cggagccgcc cggggcttct gatacgagca gctgcctggg23/23 页cgtccccgca cccgccgccc ggcggctcct ttggtagggt ttgcaccgga tcgtgacccg gacgacccaccgtccttcct gacccggccg gctatgggcg gagcctttgt agccggcctc cgcccctccc gcctagag1620 1680 1740 1800 1860 1920 1958<210>40 <211>26 <212>DNA <213> 人造序列 <220> <223> 人造序列的说明 : 合成引物 <400>40 agctctaata cgactcacta tagggc <210>41 <211>21 <212>DNA <213> 人造序列 <220> <223> 人造序列的说明 : 合成引物 <400>41 ctctaggcca gcggagcgca g2621

    关 键  词:
    肌动蛋白 RPS21 启动子 及其 应用
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:新的Β肌动蛋白和RPS21启动子及其应用.pdf
    链接地址:https://www.zhuanlichaxun.net/p-865130.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1