书签分享收藏举报版权申诉 / 29

立即下载加入VIP,免费下载

当前位置：首页 > > 一种线粒体RNA聚合酶附属转录因子、其聚合酶-转录因子复合体及应用.pdf

一种线粒体RNA聚合酶附属转录因子、其聚合酶-转录因子复合体及应用.pdf

上传人：没水****6

文档编号：9019357

上传时间：2021-01-27

格式：PDF

页数：29

大小：1.07MB

《一种线粒体RNA聚合酶附属转录因子、其聚合酶-转录因子复合体及应用.pdf》由会员分享，可在线阅读，更多相关《一种线粒体RNA聚合酶附属转录因子、其聚合酶-转录因子复合体及应用.pdf（29页完整版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 102127157 A (43)申请公布日 2011.07.20 CN 102127157 A *CN102127157A* (21)申请号 201010022770.8 (22)申请日 2010.01.13 C07K 14/39(2006.01) C12N 15/31(2006.01) C12N 9/00(2006.01) C12P 21/02(2006.01) C12Q 1/68(2006.01) C12Q 1/02(2006.01) (71)申请人复旦大学地址 200433 上海市邯郸路 220 号 (72)发明人阿拉斯太尔马歇尔王哲陈东戎孙文夏蒋。

2、恒义张静 (74)专利代理机构上海正旦专利代理有限公司 31200 代理人吴桂琴包兆宜 (54) 发明名称一种线粒体 RNA 聚合酶附属转录因子、其聚合酶 - 转录因子复合体及应用 (57) 摘要本发明属于生物技术领域，涉及一种线粒体 RNA 聚合酶转录因子 Mtf1 和聚合酶 - 转录因子组合物。本发明提供了一种线粒体 RNA 聚合酶附属转录因子 Mtf1，它的氨基酸序列包括序列表 SEQ ID NO ： 3 中的 1-366 位。RNA 聚合酶蛋白和 Mtf1 可以相互作用，形成聚合酶 - 转录因子复合体。 Mtf1 可用于转录 RNA，涉及调控细胞周期，还可。

3、用作肿瘤药物筛选的药靶。本发明为基因转录、尤其是细胞核内的基因转录提供了一套精确有效的转录工具，为基因功能的研究提供了一种新途径。同时， Mtf1 涉及调控细胞周期， Mtf1 的基因敲除菌株无法形成克隆， Mtf1 可作为抗肿瘤药物筛选的靶标。 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书 1 页说明书 19 页附图 8 页 CN 102127162 A1/1 页 2 1.一种线粒体RNA聚合酶附属转录因子，其特征在于，它的氨基酸序列包括序列表SEQ ID NO ： 3 中的 1-366 位。 2.如权利要求1所述。

4、的线粒体RNA聚合酶附属转录因子，其特征在于，它的多核苷酸编码序列如 SEQ ID NO ： 4 所示。 3. 权利要求 1 所述线粒体 RNA 聚合酶附属转录因子的制备方法，其特征在于，培养表达所述线粒体 RNA 聚合酶附属转录因子的宿主细胞，然后从培养物中分离出所述的线粒体 RNA 聚合酶附属转录因子。 4.一种转录组合物，其特征在于，该转录组合物包括RNA聚合酶蛋白和权利要求1所述的线粒体 RNA 聚合酶附属转录因子。 5.如权利要求4所述的转录组合物，其特征在于，所述RNA聚合酶蛋白的氨基酸序列包括序列表 SEQ ID NO ： 1 中的 1-1120 位。。

5、6. 权利要求 4 所述的转录组合物在转录 RNA 中的用途。 7. 权利要求 4 所述的转录组合物在调控细胞周期中的用途。 8. 权利要求 4 所述的转录组合物在筛选抗肿瘤药物的药靶中的用途。 9. 如权利要求 6 所述的用途，其特征在于，所述转录组合物中识别的启动子区域包括序列表 SEQ ID NO ： 5 中的 1361-1376 位。权利要求书 CN 102127157 A CN 102127162 A1/19 页 3 一种线粒体RNA聚合酶附属转录因子、其聚合酶-转录因子复合体及应用技术领域 0001 本发明属于生物技术领域，涉及一种新型聚合酶 - 转录因子复。

6、合体。更具体地，本发明涉及一种线粒体 RNA 聚合酶 Rpo41- 转录因子 Mtf1 复合体的基因克隆，蛋白制备，功能研究及其在生物技术领域的应用。背景技术 0002 细胞中的 DNA 转录成 RNA 是生命最重要的一个过程。其中，依赖于 DNA 的 RNA 聚合酶以及附属转录因子组成的转录复合体是完成上述过程的核心装置参考文献 1， 2， 3， 4。因此，对于转录复合体的研究一直是科学界的热点。目前普遍认为，在真核生物中编码三类负责转录细胞核基因的 RNA 聚合酶 (I， II 和 III) 参考文献 5。其中，最为重要的众多 mRNA 的转录是由 RNA 聚合。

7、酶 II 为核心的转录复合体来完成。另外，在真核生物中还编码一类线粒体 RNA 聚合酶，这类蛋白本身是由核基因组编码，在细胞质中合成，并最终转运到线粒体中发挥功能。在线粒体中，它主要负责转录线粒体基因组编码的 rRNA， tRNA 以及一些呼吸链相关的基因。因此，以线粒体 RNA 聚合酶及其附属转录因子组成的转录复合体是真核生物能够进行正常的能量代谢的关键。 0003 酵母是进行分子遗传学研究的良好模型。其较小的基因组 (5000 个基因左右 )，易于培养，方便观察的特点使其被广泛用来研究 RNA 转录的分子机制。现有的研究表明，在芽殖酵母中，线粒体基因的转录是线。

8、粒体 RNA 聚合酶 Rpo41 和线粒体转录因子 Mtf1 组成的转录复合体完成的参考文献 6， 7。其中，敲除 Mtf1 的芽殖酵母表现出更为细小的细胞形态，线粒体 DNA 的缺失，以及无法在非发酵碳源培养基上生长。从结构上推测，芽殖酵母中的 Mtf1 更类似于细菌中的 Sigma 因子，它可以结合线粒体聚合酶 Rpo41 形成功能完全的 “全酶” ，再特异性的结合线粒体基因上游启动子的核心元件，确保正确的转录开始。 0004 迄今为止，几乎所有的对芽殖酵母Rpo41和Mtf1蛋白的报道都只限于其在线粒体中的功能。为何 RNA 聚合酶 II 负责转录数千个基因，。

9、而线粒体 RNA 聚合酶只负责转录数十个基因，这样一种资源配置方式在细胞内是否经济？带着这一疑问，本发明启动了相关研究计划，本申请人以另一种在进化上更接近人类细胞的酵母 - 裂殖酵母作为研究模型，在裂殖酵母中，本发明首先通过生物信息学方法，找到与芽殖酵母中 Rpo41 和 Mtf1 同源的两个蛋白，系统编号分别为 SPAC26H5.12 和 SPAC1002.08c，在 Sanger Genedb 数据库中这两个基因均被标注为尚未具有研究性报道公开。本发明首次克隆到裂殖酵母中 Rpo41 和 Mtf1 两个基因，进行了相应的转基因和基因敲除研究，同时还在大肠杆。

10、菌中表达纯化出这两个蛋白，验证了它们作为转录因子的活性。非常有意思的是，研究表明， Rpo41 和 Mtf1 组成的转录复合体不仅可以有效的转录线粒体中的基因，而且还能够高效的转录细胞核中编码的基因。本发明不仅解决了线粒体 RNA 聚合酶在细胞核中是否同样具有功能这一重要理论问题，而且这一新型转录机制也能够被发展为一种有效的生物技术工具，应用于科学研究和重组生物工程产品的生产，与此同时，这一转录复合体还可以被用做抗肿瘤和其说明书 CN 102127157 A CN 102127162 A2/19 页 4 他疾病药物筛选的靶点。 0005 本发明的参考文献如下。

11、： 0006 1.Goodrich， J.A.， Cutler， G.， and Tjian， R.(1996).Contacts incontext ： promoter specificity and macromolecular interactions intranscription.Cell 84， 825-830. 0007 2.Tansey， W.P.， and Herr， W.(1997).TAFs ： guilt by association ？ Cell 88， 729-732. 0008 3.Roeder， R.G.(2005).Transcriptional regul。

12、ation and the role ofdiverse coactivators in animal cells.FEBS Lett 579， 909-15. 0009 4.Sekinger， E.A.， Moqtaderi， Z.， and Struhl， K.(2005).Intrinsichistone-DNA interactions and low nucleosome density are important forpreferential accessibility of promoter regions in yeast.Mol.Cell 18， 735-748. 0010。

13、 5.Roeder， R.G.， and Rutter， W.J.(1969).Multiple forms ofDNA-dependent RNA polymerase in eukaryotic organisms.Nature 224， 234-237. 0011 6.Bonawitz， N.D.， Clayton， D.A.， and Shadel， G.S.(2006).Initiation and beyond ： multiple functions of the human mitochondrialtranscription machinery. Mol Cell 24， 8。

14、13-25. 0012 7 . A s i n - C a y u e l a ，J . ，a n d G u s t a f s s o n ，C . M . ( 2 0 0 7 ) . Mitochondrialtranscription and its regulation in mammalian cells.Trends Biochem Sci32， 111-7. 发明内容 0013 本发明的目的是提供一种新型 RNA 聚合酶和其附属转录因子基因及其编码的蛋白。 0014 本发明的另一目的是提供上述基因及其编码蛋白的用途。 0015 本发明提供了一种线粒体 RNA 聚合酶附属转录因。

15、子 (Mtf1)，它的氨基酸序列包括序列表 SEQ ID NO ： 3 中的 1-366 位。 0016 在本发明的一个实施例中，所述的线粒体 RNA 聚合酶附属转录因子的氨基酸序列如 SEQ ID NO ： 3 中的 1-366 位所示。系统名为 SPAC1002.08c，在本发明中被简称为 Mtf1。 0017 在本发明中，线粒体 RNA 聚合酶附属转录因子还包括具有相同转录因子功能的、 SEQ ID NO ： 3 中的 1-366 位序列的变异形式。这些变异形式包括 ( 但并不限于 ) ：若干个 ( 通常为 1-50 个，较佳地 1-30 个，更佳地 1-20 个，最。

16、佳地 1-10 个 ) 氨基酸的缺失、插入和 / 或取代，以及在 C 末端和 / 或 N 末端添加一个或数个 ( 通常为 20 个以内，较佳地为 10 个以内，更佳地为 5 个以内 ) 氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在 C 末端和 / 或 N 末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。 0018 编码线粒体 RNA 聚合酶附属转录因子蛋白 Mtf1 的多核苷酸序列选自序列表 SEQ ID NO ： 4中的1-1101位。在本发明中，线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸编码序列。

17、也包括简并序列。简并序列是指，有一个或多个密码子被编码相同氨基酸的简说明书 CN 102127157 A CN 102127162 A3/19 页 5 并密码子所取代后而产生的序列。由于密码子的简并性，所以与 SEQ ID NO ： 4 中的 1-1101 位核苷酸序列同源性低至约 70的简并序列也能编码出 SEQ ID NO.3 所述的序列。 0019 本发明还提供了一种转录组合物，该转录组合物包括 RNA 聚合酶蛋白和上述线粒体 RNA 聚合酶附属转录因子。RNA 聚合酶蛋白和上述线粒体 RNA 聚合酶附属转录因子可以结合，形成聚合酶 - 转录因子复合体。 0020 RN。

18、A 聚合酶蛋白可以是通常使用的 RNA 聚合酶 II 或者本发明的实施例中使用 Rpo41。 0021 在本发明的一个实施例中，所述 RNA 聚合酶蛋白 Rpo41 的氨基酸序列包括序列表 SEQ ID NO ： 1 中的 1-1120 位。其系统名 SPAC26H5.12，在本发明中被简称为 Rpo41。 0022 在本发明中， RNA聚合酶蛋白Rpo41还包括具有相同RNA聚合酶功能的、 SEQID NO ： 1中的1-1120位序列的变异形式。这些变异形式包括(但并不限于) ：若干个(通常为1-50 个，较佳地 1-30 个，更佳地 1-20 个，最佳地 1-10 个 ) 。

19、氨基酸的缺失、插入和 / 或取代，以及在 C 末端和 / 或 N 末端添加一个或数个 ( 通常为 20 个以内，较佳地为 10 个以内，更佳地为 5个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在 C 末端和 / 或 N 末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。 0023 编码本发明的新型 RNA 聚合酶的多核苷酸序列选自序列表 SEQ ID NO ： 2 中的 1-3363 位。 0024 编码线粒体 RNA 聚合酶附属转录因子蛋白 Mtf1 的多核苷酸序列选自序列表 SEQ ID NO ： 2中的。

20、1-3363位。在本发明中，线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸编码序列也包括简并序列。简并序列是指，有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性，所以与 SEQ ID NO ： 2 中的 1-3363 位核苷酸序列同源性低至约 70的简并序列也能编码出 SEQ ID NO ： 1 所述的序列。 0025 本发明提供了所述转录组合物转录 RNA 的用途。也可以将该转录组合物用于调控细胞周期。或者，将该转录组合物用作肿瘤药物筛选药靶。 0026 Mtf1 的基因敲除菌株无法形成克隆，在平板上只能分裂几次。使用荧光白 Ca。

21、lcofluor 染色的结果显示缺失 Mtf1 的细胞有较高比例的细胞横隔，其中一些细胞含有多个细胞横隔。此结果暗示 Mtf1 可能有调控细胞周期和细胞形态方面的功能。过量表达 Mtf1 出现细胞长度增加的表形。考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型。因此，本发明认为可以将 Mtf1 作为抗肿瘤药物筛选的靶标。本发明认为，能够使 Mtf1 基因敲除菌株、 Mtf1 过量表达菌株恢复或部分恢复正常表形的化合物均能够被认为是潜在的抗肿瘤药物分子。 0027 本发明提供了所述转录组合物的用途，即将转录组合物用于转录蛋白。其中，所述转录组合物识别的启动子区域包括序列表 SE。

22、Q ID NO ： 5 中的 1350-1477 位。也可以是 SEQ ID NO ： 5 中的 1350-1477 位中的部分。 0028 本发明提供了数种载体，包括： 0029 (a) 含有线粒体 RNA 聚合酶附属转录因子的多核苷酸编码序列的载体。 0030 (b) 含有编码本发明的 RNA 聚合酶的多核苷酸的载体。 0031 (c) 同时含有编码本发明的新型 RNA 聚合酶和其附属转录因子的多核苷酸的载说明书 CN 102127157 A CN 102127162 A4/19 页 6 体。 0032 本发明还提供了一种遗传工程化的宿主细胞，它是选自下组的宿主细胞： 003。

23、3 (a) 用本发明上述的载体转化或转导的宿主细胞。 0034 (b) 用编码 Rpo41 和 / 或 Mtf1 的多核苷酸转化或转导的宿主细胞。 0035 本发明还提供了 Rpo41 和 / 或 Mtf1 过量表达菌株，可以通过下面的方法制备，该方法包含： 0036 (a) 向宿主感受态细胞中转化相应的过量表达载体。 0037 (b) 利用过量表达载体上的抗生素筛选标签筛选阳性菌株。 0038 本发明还提供了 Rpo41 和 / 或 Mtf1 基因敲除菌株，可以通过下面的方法制备，该方法包含： 0039 (a) 向宿主感受态细胞中转化相应的同源重组 PCR 片段。 0040 。

24、(b) 利用过量表达载体上的抗生素筛选标签筛选阳性菌株。 0041 本发明提供了所述线粒体 RNA 聚合酶附属转录因子的制备方法，可以是按照常规方法，培养表达所述线粒体 RNA 聚合酶附属转录因子的宿主细胞，然后从培养物中分离出所述线粒体 RNA 聚合酶附属转录因子。 0042 本发明提供了所述线粒体 RNA 聚合酶附属转录因子也可以按照其序列，直接人工合成。 0043 本发明中的 RNA 聚合酶也可以通过上述两种方法制备。 0044 实验表明， Mtf1 具备转录因子的活性。而且其转录因子活性不依赖于 RNA 聚合酶 II，即在缺乏通常使用的 RNA 聚合酶 II 的情况下，。

25、 Mtf1 也能够发挥转录因子的作用。Mtf1 和 Rpo41 组成蛋白复合体，能转录成功核基因。较好的，这些基因具备 F4 片段，更好的，具备F4-4片段。与商业化的T7聚合酶相比，因为Mtf1和Rpo41来自真核生物，因此能够更为精确，高效的转录真核来源的 RNA，特别是某些含有复杂二级结构的 RNA 片段，因为转录因子 Mtf1 能够 “融解” 启动子片段的碱基对，因此，在优化的转录缓冲液和反应条件下， Mtf1 和 Rpo41 组成的转录体系能够被开发成一种商业化的转录系统，此系统能够特异性地转录包含 19bp(SEQ ID NO ： 51361-13。

26、79) 核心序列的 RNA 片段。 0045 另一方面，过量表达Mtf1会干扰细胞周期进程。 Mtf1的基因敲除菌株敲除菌株无法形成克隆，在平板上只能分裂几次。过量表达 Mtf1 出现细胞长度增加的表形。裂殖酵母长期被用作筛选抗肿瘤药物的模型， Mtf1 则可以作为抗肿瘤药物筛选的靶标。能够使 Mtf1 基因敲除菌株、 Mtf1 过量表达菌株恢复或部分恢复正常表形的化合物，均能够被认为是潜在的抗肿瘤药物分子。本发明还提供了高通量寻找本发明新型 RNA 聚合酶附属转录因子在裂殖酵母体内靶点的方法。 0046 本发明提供了数种分离的多核苷酸，这些多核苷酸序列编码本发明的新型 RNA。

27、聚合酶和其附属转录因子蛋白的结合的启动子区域。其中，所述的多核苷酸序列分别选自序列表 SEQ ID NO ： 5，其中，片段 F1 为 10-337 位，片段 F2 为 316-734 位，片段 F3 为 715-1177 位，片段 F4 为 960-1534 位，片段 F5 为 1510-1964 位，片段 F4-1 为 1167-1239 位，片段 F4-2 为 1211-1314 位，片段 F4-3 为 1303-1380 位，片段 F4-4 为 1350-1477 位，片段 F4-5 为 1457-1546 位。 0047 本发明中另一些分离的多核苷酸，。

28、编码本发明的 RNA 聚合酶和其附属转录因子说明书 CN 102127157 A CN 102127162 A5/19 页 7 组成的转录复合体起始转录的启动子区域。其中，所述的多核苷酸序列分别选自序列表 SEQ ID NO ： 5，其中，片段 F4-2 为 1211-1314 位，片段 F4-4 为 1350-1477 位，片段 F4-5 为 1457-1546 位，片段 F4-479BP 为 1350-1428 位，片段 F4-489BP 为 1350-1438 位，片段 F4-499BP 为 1350-1448 位。 0048 本发明所用实验方法，如未特别指出，。

29、则可以使用本领域的常规操作。以下列举本发明部分实验方法。 0049 构建 mtf1+ 缺失菌株： mtf1+ 缺失菌株是由在二倍体细胞中转化 PCR 片段实现的， PCR 反应是用长引物进行的，引物含有 80 个碱基序列同源于 Mtf1 的 C- 末端， 20 个碱基序列同源于质粒 pFA6a-kanMX6。引物序列如下： CTCCAAACCACAAGATAAACAATTGTCTATTCCAGTG TTTGAAAGCATTGTTAGGATACTGTTGACATGTAAAGCAACATCCGCTGCAGGTCGACGGATCCCC(SEQ ID NO ： 6) 和 ATCGATGTT。

30、AATCCCACATTGGGTGAAGGAGGGTAATAGAGTTTCCGCACCTGGGCCTAAATAATAAATGGA TTTTGAAAGTGGCCGCATAGGCCACTAGTGGATCT(SEQ ID NO ： 7)。 0050 转化后选择能在 G418 板上生长的克隆。二倍体菌株生成孢子，收集孢子后在平板上发芽。mtf1+ 缺失菌株的确认是用定量 PCR 检测 Mtf1 基因的表达水平和用 PCR 检测基因组 DNA。 0051 在染色体的 mtf1 上加 TAP 的标记：在染色体的 mtf1 上加 TAP 的标记是通过用 PCR 产物转化单倍体细胞实现的， PCR 的。

31、引物包含 80bp 序列于 Mtf1C- 末端基因序列同源和 20bp 的序列于质粒 pFA6a2PA 同源。引物序列为： ACTTTCTTACCATTTCAAAAATTATACAAAAATA TCCTTTCAAACATCATTTACATTTGGGTACAATAATTGAAGATTCATACGCTGCAGGTCGACGGATCCCC(SEQ ID NO ： 8) 和 CAAAATTACTGGATGCAAAGAAATGCGTGTATGAACAAAAACAATCAATACGTTTGTTTCCCCCAATTT TCTGTAAATTTGGCCGCATAGGCCACTAGTGGATCT(SEQ ID 。

32、NO ： 9)。 0052 染色体标记的证实是通过菌落 PCR 和用 rabbit anti mouse IgG peroxidase 抗体做 Western blot 来实现的。 0053 细胞核，线粒体和细胞质的提取与 Western blot ： Mtf1TAP 标记的菌株用来提取细胞核线粒体和细胞质，细胞核的提取方法是Shimizu et a1.1991)所描述的，线粒体和细胞质提取和纯化是 Chiron et al.2007 所描述的。纯化的细胞核，线粒体和细胞质的样本在 10的 SDS PAGE 凝胶进行电泳，然后转到硝酸纤维素膜上。用 rabbit anti m。

33、ouse IgG peroxidase 抗体在 1 8000 稀释后孵育 1 小时，洗涤后进行化学发光反应，用 X 光胶片检测荧光信号。 0054 ChIP-chip 芯片分析：所使用的芯片间包含了所有裂殖酵母的非编码区，非编码区大于 2kb 的用了一个以上的 PCR 产物的探针，探针的平均长度为 1kb。总共有 5200 个从 100bp 到 2kb 大小不等的探针。该芯片不包括线粒体染色体基因。在室温下 Mtf1TAP 标记的细胞在 1甲醛固定 15 分钟，然后在 125mM glycine 中 5 分钟。经过 TBS 洗两次然后悬浮在 0.4 毫升的裂解液 (50m。

34、M HEPES-KOHpH 7.4， 140mM NaCl， 1mM EDTA， 1 Triton X-100， 0.1 sodium deoxy-cholate， 1mM phenylmethylsulfonyl fluoride， 10g/ml aprotinin， 1ug/ml leupeptin， 1g/mlpepstatin) 中，细胞用玻璃珠打浆机破碎 1 分钟，破碎的细胞超声 4 次以打断染色体 DN。离心 12,000g 10 分钟获得上清，然后和 IgG Sepharose 6 fast flow bead进行结合。 2g的DNA用Cye-3或Cye-5进行标记(Kl。

35、enow) 后和芯片杂交。数据采集，处理和正常化是 (Heichinger et al.2006) 中所描述的。说明书 CN 102127157 A CN 102127162 A6/19 页 8 0055 质粒构建： PCR 扩增 Mtf1 编码序列插入到 pREP3 在 SmalI 构建了 pREP3-mtf1T。 0056 Mtf1 基因扩增的 PCR 片断用 XhoI 和 EcoRI 克隆到 pGEX-4T-1 中构建了 pGEX-4T-mtf1T，包含了 Mtf1C 末端 GST 的标记。Rpo41 基因扩增的 PCR 片断用用 XhoI 和 EcoR。

36、I 克隆到到载体 pET28a，进而产生了一个 N 端 His 标记的 Rpo41。克隆是用 DNA 测序证实的。 0057 Mtf1 和 Rpo41 的表达和纯化：含 pGEX-4T-mtf1E.coli BL21 细胞在 PBS 缓冲液 (pH8.0) 中裂解后用 Glutathione Sepharose 4B 来纯化。His 标签的 Rpo41 细胞在缓冲液 (20mM Imidazole， 20mM Phosphate， 0.5M NaCl， pH 7.4， 1mMphenylmethylsulfonyl fluoride) 中裂解后用 Ni2+-NTA-agar。

37、ose 纯化，用 20mMimidazole 洗柱，用 500mM imidazole， 20mM Phosphate， 0.5M NaCl， pH 7.4Ni2 洗脱，在 20mM Phosphate， 0.1M NaCl， 0.2mM ETDA and 1mM DTT 中透析过夜。 0058 荧光实时 PCR 分析：在液体培养基中细胞生长 OD600 0.5，使用试剂 TRIzol Reagent(Invitrogen) 提取总 RNA。反转录 RNA 用 TaKaRa PrimeSciptTMlstStrand cDNA Synthesis 试剂盒，仪器型。

38、号是 iQ5 Continuous FluorescenceDetector System(Bio-Rad)。PCR 反应包括： 250Nm 的正向和反向引物， 1l 的 cDNA(5ng)， 10l 2X SYBR-green Realtime PCR Master Mix(SYBR PremixEx TaqTM， TaKaRa)，总体积为 20l。所有结果是从至少有两个独立的生物重复和四个技术重复中得到。受 -amanitin 处理的细胞， 0.1g/ml 和 1g/ml-amanitin 加到 OD600 0.5 的细胞 6 小时之后收集细胞。 0059 细胞染色和用共聚焦显微。

39、镜观察：对 DAPI 和 calcofluor 染色，细胞生长至 OD600 0.5，在 70乙醇中固定，用 DAPI 染细胞核，或细胞用 50g/ml 的 calcofluor 在 50 glycerol and 0.3mg/ml p-phenylenediamine 缓冲液中染色，在 Leica TCS-SP5 显微镜下观察。 0060 凝胶电泳迁移法 (EMSA) ： 5 端生物素标记的 PCR 引物用来合成生物素标记的探针，在反应中， 200ng 纯化的 GST 标签的 Mtfl， 50fMol 的探针和 5ng/L ofpolydI/dC 在结合缓冲液 (10m。

40、M Tris HCl pH 7.5， 50mM KCl， 0.1mM EDTA， 1mMDTT) 在冰上孵育 30 分钟，然后样品在 4 TBE 缓冲液中在 6 polyacrylamidenative 胶上进行电泳， DNA/ 蛋白复合物被转移到 Hybond-N+ 膜上，并用 LightShiftChemiluminescent EMSA kit(Thermo Scientific)EMSA 试剂盒进行检测。 0061 体外转录：体外转录所用的 DNA 模板是 PCR 产生的， His 标记的 Rpo41 和 GST 标记的 Mtf1 蛋白是在大肠杆菌中表达和纯化的。转录反应包。

41、括 500ng 的 DNA 模板， 10pmol 的 Rpo41 和 10pmol 的 Mtf1，在反应缓冲液是 50mM Tris(pH 7.9)， 20mMMgCl2， 1mM dithiothreitol， 50MUTP， -32PUTP(1000cpm/pmol UTP)， 250M ATP， GTP 和 CTP，总反应体积极是 20l。反应在 30孵育 60 分钟，加入 25l 的在冰上的终止缓冲液 (90 formamide， 50mM EDTA， bromophenol blue， and xylene cyanol)。样本在 70变性 5 分钟然后在6polyacry。

42、lamide胶上进行电泳。干胶后X光片在放入增强屏幕中再放置-70，胶片冲洗后观察放射性的条带。 0062 本发明提供了一种线粒体 RNA 聚合酶附属转录因子，它的氨基酸序列包括序列表 SEQ ID NO ： 3 中的 1-366 位。RNA 聚合酶蛋白和上述线粒体 RNA 聚合酶附属转录因子可以相互作用，形成聚合酶 - 转录因子复合体。实验证明，上述线粒体 RNA 聚合酶附属转录因子说明书 CN 102127157 A CN 102127162 A7/19 页 9 可用于转录蛋白，涉及调控细胞周期，还可用作肿瘤药物筛选的药靶。本发明为基因转录、尤其是细胞核内的基因转录。

43、提供了一套精确有效的转录工具，为基因功能的研究提供了一种新途径。同时，本发明的线粒体RNA聚合酶附属转录因子涉及调控细胞周期， Mtf1的基因敲除菌株无法形成克隆，考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型，可以将 Mtf1 作为抗肿瘤药物筛选的靶标。附图说明 0063 图 1 是裂殖酵母与芽殖酵母的 Mtf1 氨基酸序列对比图。 0064 图 2 是裂殖酵母 Mtf1 结构域图。 0065 图 3 是缺失 Mtf1 细胞和野生型细胞的形态对比图。 0066 图 4 是 Mtf1 在细胞中的亚定位图。 0067 图 5 是过量 Mtf1 干扰细胞周期进程图。 0068 图 6。

44、是维生素 B1 抑制 Mtf1mRNA 表达图。 0069 图 7 是过表达 Mtf1 影响有丝分裂进程图。 0070 图 8 是 Mtf1 的转录因子活性不依赖于 RNA 聚合酶 II 的细胞结果图。 0071 图 9 表明增加 -amanitine 的浓度 Srk1mRNA 表达水平不受影响。 0072 图 10 是 Mtf1 结合 Srk1 基因的上游序列图。其中，图 A 是 5 个可覆盖上游区域的 DNA 片段； B 显示片段 4(F4) 和 Mtf1 结合在胶上产生了迁移速度慢的条带； C 显示片段 F4-4、 F4-2 和 Mtf1 结合在胶上产生了迁移速度慢的条带。 0。

45、073 图 11 是 F4-4、 F4-2、 F4-5 转录 RNA 电泳图。 0074 图 12 是 F4-4 转录不同长度片段 RNA 的电泳图。具体实施方式 0075 本发明经过深入而广泛的研究，在裂殖酵母中分离得到了一种新型线粒体 RNA 聚合酶 Rpo41 和附属转录因子 Mtf1。在成功克隆出这两个基因后，利用转基因和基因敲除技术验证其用途。结果表明， Rpo41和Mtf1形成的复合体不但可以负责线粒体基因组的转录，同时，还可以转录核基因 Srk1，进而影响酵母正常的细胞周期进程。 0076 实施例 1 ：裂殖酵母新型线粒体 RNA 聚合酶 Rpo41 和附属转。

46、录因子 Mtf1 的克隆 0077 根据芽殖酵母中同源蛋白氨基酸序列，在英国桑格研究中心网站 Genedb 上进行 Blast 比对，结果显示，裂殖酵母中分别存在一个高度保守的同源线粒体 RNA 聚合酶，系统名 SPAC26H5.12，以及一个高度保守的线粒体转录因子，系统名 SPAC1002.08c。裂殖酵母与芽殖酵母中 Mtf1 同源蛋白之间氨基酸序列的对比结果参见图 1，通过比对，申请人发现裂殖酵母 Mtf1 具有一个保守的 N 端结构域和一个保守的 C 端结构域，参见图 2。 0078 在本发明下述实施例中，如无特别说明， SPAC。

47、26H5.12 被简称为 Rpo41， SPAC1002.08c 被简称为 Mtf1。 0079 实施例 2 ：裂殖酵母 Mtf1 在细胞中的亚定位 0080 为了研究裂殖酵母 Mtf1 在细胞中的功能，本发明使用超速离心的方法，分别提取了裂殖酵母线粒体，细胞核和细胞质成分，使用Western-blot方法检测Mtf1在细胞中的亚定位，如图 4 所示， Mtf1 在细胞核和线粒体中都有定位，这一结果暗示了 Mtf1 不仅在裂殖说明书 CN 102127157 A CN 102127162 A8/19 页 10 酵母线粒体中发挥功能，同时很可能也在细胞核中具有转录。

48、基因的功能。 0081 实施例 3 ：裂殖酵母 Mtf1 敲除突变体有细胞周期调控和细胞形态上的缺陷 0082 为了探讨其细胞功能，本发明对裂殖酵母的 Mtf1 进行基因敲除，敲除是在二倍体细胞中进行的，后经交配产生的孢子在发芽后在显微镜下观察表型。缺失 Mtf1 的细胞表现出类似的形态，即：敲除菌株无法形成克隆，在平板上只能分裂几次。图 3 表明，缺失 Mtf1 的细胞和野生型细胞相比在形态上更长更大，并且变成鸡蛋或瓶子的形状。DAPI 染色表明缺失 Mtf1 的细胞没有明显细胞核的缺陷。使用荧光白 Calcofluor( 卡尔科弗卢尔荧光染色剂)染色的结果显示缺。

49、失Mtf1的细胞有较高比例的细胞横隔，其中一些细胞含有多个细胞横隔。此结果暗示 Mtf1 可能有调控细胞周期和细胞形态方面的功能，体内 Mtf1 功能的缺失会造成酵母分裂的不正常。 0083 实施例 4 ： Mtf1 过量表达对裂殖酵母细胞周期的影响。 0084 首先将Mtf1的编码序列克隆到裂殖酵母过量表达载体pREP3中，载体上过量表达 Mtf1 的强启动子 Pnmt1 能够受维生素 B1 抑制性的调控。对在不加维生素 B1 和加了 60M 维生素B1的条件下的细胞进行定量PCR的检测Mtf1表达量。在没有维生素B1的条件下过量表达 Mtf1 的细胞比仅转入空载体的细胞中 Mtf1 表达水平超过 600 倍以上。虽然 60M 维生素B1可以抑制Mtf1mRNA表达水平到最低水平，但抑制并不完全(图6)，此结果暗示了 Mtf1 过量表达菌株的构建成功。申请人利用激光共聚焦显微镜观察到在没有维生素 B1 的条件下过量表达Mtf1的细胞和仅转入空载体的细胞相比是明显变长的，而在加了60M维生素 B1 的条件下过量表达 Mtf1 的细胞没有变长，此结果表明过量表达 Mtf1 会干扰细胞周期进程 ( 图 5)。 0085 实施例 5 ： Chip-chip 的方法确定 Srk1 可能是 Mtf1 的靶基因 0086。

摘要
申请专利号：	CN201010022770.8	申请日：	20100113
公开号：	CN102127157A	公开日：	20110720
当前法律状态：		有效性：	失效
法律详情：
IPC分类号：	C07K14/39,C12N15/31,C12N9/00,C12P21/02,C12Q1/68,C12Q1/02	主分类号：	C07K14/39,C12N15/31,C12N9/00,C12P21/02,C12Q1/68,C12Q1/02
申请人：	复旦大学
发明人：	阿拉斯太尔·马歇尔,王哲,陈东戎,孙文夏,蒋恒义,张静
地址：	200433 上海市邯郸路220号
优先权：	CN201010022770A
专利代理机构：	上海正旦专利代理有限公司	代理人：	吴桂琴;包兆宜
PDF完整版下载：	PDF下载

内容摘要

本发明属于生物技术领域，涉及一种线粒体RNA聚合酶转录因子Mtf1和聚合酶-转录因子组合物。本发明提供了一种线粒体RNA聚合酶附属转录因子Mtf1，它的氨基酸序列包括序列表SEQ ID NO：3中的1-366位。RNA聚合酶蛋白和Mtf1可以相互作用，形成聚合酶-转录因子复合体。Mtf1可用于转录RNA，涉及调控细胞周期，还可用作肿瘤药物筛选的药靶。本发明为基因转录、尤其是细胞核内的基因转录提供了一套精确有效的转录工具，为基因功能的研究提供了一种新途径。同时，Mtf1涉及调控细胞周期，Mtf1的基因敲除菌株无法形成克隆，Mtf1可作为抗肿瘤药物筛选的靶标。

权利要求书

1.一种线粒体RNA聚合酶附属转录因子，其特征在于，它的氨基酸序列包括序列表SEQ ID NO：3中的1-366位。 2.如权利要求1所述的线粒体RNA聚合酶附属转录因子，其特征在于，它的多核苷酸编码序列如SEQ ID NO：4所示。 3.权利要求1所述线粒体RNA聚合酶附属转录因子的制备方法，其特征在于，培养表达所述线粒体RNA聚合酶附属转录因子的宿主细胞，然后从培养物中分离出所述的线粒体RNA聚合酶附属转录因子。 4.一种转录组合物，其特征在于，该转录组合物包括RNA聚合酶蛋白和权利要求1所述的线粒体RNA聚合酶附属转录因子。 5.如权利要求4所述的转录组合物，其特征在于，所述RNA聚合酶蛋白的氨基酸序列包括序列表SEQ ID NO：1中的1-1120位。 6.权利要求4所述的转录组合物在转录RNA中的用途。 7.权利要求4所述的转录组合物在调控细胞周期中的用途。 8.权利要求4所述的转录组合物在筛选抗肿瘤药物的药靶中的用途。 9.如权利要求6所述的用途，其特征在于，所述转录组合物中识别的启动子区域包括序列表SEQ ID NO：5中的1361-1376位。

说明书

技术领域

本发明属于生物技术领域，涉及一种新型聚合酶-转录因子复合体。更具体地，本发明涉及一种线粒体RNA聚合酶Rpo41-转录因子Mtf1复合体的基因克隆，蛋白制备，功能研究及其在生物技术领域的应用。

背景技术

细胞中的DNA转录成RNA是生命最重要的一个过程。其中，依赖于DNA的RNA聚合酶以及附属转录因子组成的转录复合体是完成上述过程的核心装置[参考文献1，2，3，4]。因此，对于转录复合体的研究一直是科学界的热点。目前普遍认为，在真核生物中编码三类负责转录细胞核基因的RNA聚合酶(I，II和III)[参考文献5]。其中，最为重要的众多mRNA的转录是由RNA聚合酶II为核心的转录复合体来完成。另外，在真核生物中还编码一类线粒体RNA聚合酶，这类蛋白本身是由核基因组编码，在细胞质中合成，并最终转运到线粒体中发挥功能。在线粒体中，它主要负责转录线粒体基因组编码的rRNA，tRNA以及一些呼吸链相关的基因。因此，以线粒体RNA聚合酶及其附属转录因子组成的转录复合体是真核生物能够进行正常的能量代谢的关键。

酵母是进行分子遗传学研究的良好模型。其较小的基因组(5000个基因左右)，易于培养，方便观察的特点使其被广泛用来研究RNA转录的分子机制。现有的研究表明，在芽殖酵母中，线粒体基因的转录是线粒体RNA聚合酶Rpo41和线粒体转录因子Mtf1组成的转录复合体完成的[参考文献6，7]。其中，敲除Mtf1的芽殖酵母表现出更为细小的细胞形态，线粒体DNA的缺失，以及无法在非发酵碳源培养基上生长。从结构上推测，芽殖酵母中的Mtf1更类似于细菌中的Sigma因子，它可以结合线粒体聚合酶Rpo41形成功能完全的“全酶”，再特异性的结合线粒体基因上游启动子的核心元件，确保正确的转录开始。

迄今为止，几乎所有的对芽殖酵母Rpo41和Mtf1蛋白的报道都只限于其在线粒体中的功能。为何RNA聚合酶II负责转录数千个基因，而线粒体RNA聚合酶只负责转录数十个基因，这样一种资源配置方式在细胞内是否经济？带着这一疑问，本发明启动了相关研究计划，本申请人以另一种在进化上更接近人类细胞的酵母-裂殖酵母作为研究模型，在裂殖酵母中，本发明首先通过生物信息学方法，找到与芽殖酵母中Rpo41和Mtf1同源的两个蛋白，系统编号分别为SPAC26H5.12和SPAC1002.08c，在Sanger Genedb数据库中这两个基因均被标注为‘尚未具有研究性报道公开’。本发明首次克隆到裂殖酵母中Rpo41和Mtf1两个基因，进行了相应的转基因和基因敲除研究，同时还在大肠杆菌中表达纯化出这两个蛋白，验证了它们作为转录因子的活性。非常有意思的是，研究表明，Rpo41和Mtf1组成的转录复合体不仅可以有效的转录线粒体中的基因，而且还能够高效的转录细胞核中编码的基因。本发明不仅解决了‘线粒体RNA聚合酶在细胞核中是否同样具有功能’这一重要理论问题，而且这一新型转录机制也能够被发展为一种有效的生物技术工具，应用于科学研究和重组生物工程产品的生产，与此同时，这一转录复合体还可以被用做抗肿瘤和其他疾病药物筛选的靶点。

本发明的参考文献如下：

1.Goodrich，J.A.，Cutler，G.，and Tjian，R.(1996).Contacts incontext：promoter specificity and macromolecular interactions intranscription.Cell 84，825-830.

2.Tansey，W.P.，and Herr，W.(1997).TAFs：guilt by association？Cell 88，729-732.

3.Roeder，R.G.(2005).Transcriptional regulation and the role ofdiverse coactivators in animal cells.FEBS Lett 579，909-15.

4.Sekinger，E.A.，Moqtaderi，Z.，and Struhl，K.(2005).Intrinsichistone-DNA interactions and low nucleosome density are important forpreferential accessibility of promoter regions in yeast.Mol.Cell 18，735-748.

5.Roeder，R.G.，and Rutter，W.J.(1969).Multiple forms ofDNA-dependent RNA polymerase in eukaryotic organisms.Nature 224，234-237.

6.Bonawitz，N.D.，Clayton，D.A.，and Shadel，G.S.(2006).Initiation and beyond：multiple functions of the human mitochondrialtranscription machinery.Mol Cell 24，813-25.

7.Asin-Cayuela，J.，and Gustafsson，C.M.(2007).Mitochondrialtranscription and its regulation in mammalian cells.Trends Biochem Sci32，111-7.

发明内容

本发明的目的是提供一种新型RNA聚合酶和其附属转录因子基因及其编码的蛋白。

本发明的另一目的是提供上述基因及其编码蛋白的用途。

本发明提供了一种线粒体RNA聚合酶附属转录因子(Mtf1)，它的氨基酸序列包括序列表SEQ ID NO：3中的1-366位。

在本发明的一个实施例中，所述的线粒体RNA聚合酶附属转录因子的氨基酸序列如SEQ ID NO：3中的1-366位所示。系统名为SPAC1002.08c，在本发明中被简称为Mtf1。

在本发明中，线粒体RNA聚合酶附属转录因子还包括具有相同转录因子功能的、SEQ ID NO：3中的1-366位序列的变异形式。这些变异形式包括(但并不限于)：若干个(通常为1-50个，较佳地1-30个，更佳地1-20个，最佳地1-10个)氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加一个或数个(通常为20个以内，较佳地为10个以内，更佳地为5个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。

编码线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸序列选自序列表SEQ ID NO：4中的1-1101位。在本发明中，线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸编码序列也包括简并序列。简并序列是指，有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性，所以与SEQ ID NO：4中的1-1101位核苷酸序列同源性低至约70％的简并序列也能编码出SEQ ID NO.3所述的序列。

本发明还提供了一种转录组合物，该转录组合物包括RNA聚合酶蛋白和上述线粒体RNA聚合酶附属转录因子。RNA聚合酶蛋白和上述线粒体RNA聚合酶附属转录因子可以结合，形成聚合酶-转录因子复合体。

RNA聚合酶蛋白可以是通常使用的RNA聚合酶II或者本发明的实施例中使用Rpo41。

在本发明的一个实施例中，所述RNA聚合酶蛋白Rpo41的氨基酸序列包括序列表SEQ ID NO：1中的1-1120位。其系统名SPAC26H5.12，在本发明中被简称为Rpo41。

在本发明中，RNA聚合酶蛋白Rpo41还包括具有相同RNA聚合酶功能的、SEQID NO：1中的1-1120位序列的变异形式。这些变异形式包括(但并不限于)：若干个(通常为1-50个，较佳地1-30个，更佳地1-20个，最佳地1-10个)氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加一个或数个(通常为20个以内，较佳地为10个以内，更佳地为5个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。

编码本发明的新型RNA聚合酶的多核苷酸序列选自序列表SEQ ID NO：2中的1-3363位。

编码线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸序列选自序列表SEQ ID NO：2中的1-3363位。在本发明中，线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸编码序列也包括简并序列。简并序列是指，有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性，所以与SEQ ID NO：2中的1-3363位核苷酸序列同源性低至约70％的简并序列也能编码出SEQ ID NO：1所述的序列。

本发明提供了所述转录组合物转录RNA的用途。也可以将该转录组合物用于调控细胞周期。或者，将该转录组合物用作肿瘤药物筛选药靶。

Mtf1的基因敲除菌株无法形成克隆，在平板上只能分裂几次。使用荧光白Calcofluor染色的结果显示缺失Mtf1的细胞有较高比例的细胞横隔，其中一些细胞含有多个细胞横隔。此结果暗示Mtf1可能有调控细胞周期和细胞形态方面的功能。过量表达Mtf1出现细胞长度增加的表形。考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型。因此，本发明认为可以将Mtf1作为抗肿瘤药物筛选的靶标。本发明认为，能够使Mtf1基因敲除菌株、Mtf1过量表达菌株恢复或部分恢复正常表形的化合物均能够被认为是潜在的抗肿瘤药物分子。

本发明提供了所述转录组合物的用途，即将转录组合物用于转录蛋白。其中，所述转录组合物识别的启动子区域包括序列表SEQ ID NO：5中的1350-1477位。也可以是SEQ ID NO：5中的1350-1477位中的部分。

本发明提供了数种载体，包括：

(a)含有线粒体RNA聚合酶附属转录因子的多核苷酸编码序列的载体。

(b)含有编码本发明的RNA聚合酶的多核苷酸的载体。

(c)同时含有编码本发明的新型RNA聚合酶和其附属转录因子的多核苷酸的载体。

本发明还提供了一种遗传工程化的宿主细胞，它是选自下组的宿主细胞：

(a)用本发明上述的载体转化或转导的宿主细胞。

(b)用编码Rpo41和/或Mtf1的多核苷酸转化或转导的宿主细胞。

本发明还提供了Rpo41和/或Mtf1过量表达菌株，可以通过下面的方法制备，该方法包含：

(a)向宿主感受态细胞中转化相应的过量表达载体。

(b)利用过量表达载体上的抗生素筛选标签筛选阳性菌株。

本发明还提供了Rpo41和/或Mtf1基因敲除菌株，可以通过下面的方法制备，该方法包含：

(a)向宿主感受态细胞中转化相应的同源重组PCR片段。

(b)利用过量表达载体上的抗生素筛选标签筛选阳性菌株。

本发明提供了所述线粒体RNA聚合酶附属转录因子的制备方法，可以是按照常规方法，培养表达所述线粒体RNA聚合酶附属转录因子的宿主细胞，然后从培养物中分离出所述线粒体RNA聚合酶附属转录因子。

本发明提供了所述线粒体RNA聚合酶附属转录因子也可以按照其序列，直接人工合成。

本发明中的RNA聚合酶也可以通过上述两种方法制备。

实验表明，Mtf1具备转录因子的活性。而且其转录因子活性不依赖于RNA聚合酶II，即在缺乏通常使用的RNA聚合酶II的情况下，Mtf1也能够发挥转录因子的作用。Mtf1和Rpo41组成蛋白复合体，能转录成功核基因。较好的，这些基因具备F4片段，更好的，具备F4-4片段。与商业化的T7聚合酶相比，因为Mtf1和Rpo41来自真核生物，因此能够更为精确，高效的转录真核来源的RNA，特别是某些含有复杂二级结构的RNA片段，因为转录因子Mtf1能够“融解”启动子片段的碱基对，因此，在优化的转录缓冲液和反应条件下，Mtf1和Rpo41组成的转录体系能够被开发成一种商业化的转录系统，此系统能够特异性地转录包含19bp(SEQ ID NO：51361-1379)核心序列的RNA片段。

另一方面，过量表达Mtf1会干扰细胞周期进程。Mtf1的基因敲除菌株敲除菌株无法形成克隆，在平板上只能分裂几次。过量表达Mtf1出现细胞长度增加的表形。裂殖酵母长期被用作筛选抗肿瘤药物的模型，Mtf1则可以作为抗肿瘤药物筛选的靶标。能够使Mtf1基因敲除菌株、Mtf1过量表达菌株恢复或部分恢复正常表形的化合物，均能够被认为是潜在的抗肿瘤药物分子。本发明还提供了高通量寻找本发明新型RNA聚合酶附属转录因子在裂殖酵母体内靶点的方法。

本发明提供了数种分离的多核苷酸，这些多核苷酸序列编码本发明的新型RNA聚合酶和其附属转录因子蛋白的结合的启动子区域。其中，所述的多核苷酸序列分别选自序列表SEQ ID NO：5，其中，片段F1为10-337位，片段F2为316-734位，片段F3为715-1177位，片段F4为960-1534位，片段F5为1510-1964位，片段F4-1为1167-1239位，片段F4-2为1211-1314位，片段F4-3为1303-1380位，片段F4-4为1350-1477位，片段F4-5为1457-1546位。

本发明中另一些分离的多核苷酸，编码本发明的RNA聚合酶和其附属转录因子组成的转录复合体起始转录的启动子区域。其中，所述的多核苷酸序列分别选自序列表SEQ ID NO：5，其中，片段F4-2为1211-1314位，片段F4-4为1350-1477位，片段F4-5为1457-1546位，片段F4-479BP为1350-1428位，片段F4-489BP为1350-1438位，片段F4-499BP为1350-1448位。

本发明所用实验方法，如未特别指出，则可以使用本领域的常规操作。以下列举本发明部分实验方法。

构建mtf1+缺失菌株：mtf1+缺失菌株是由在二倍体细胞中转化PCR片段实现的，PCR反应是用长引物进行的，引物含有80个碱基序列同源于Mtf1的C-末端，20个碱基序列同源于质粒pFA6a-kanMX6。引物序列如下：CTCCAAACCACAAGATAAACAATTGTCTATTCCAGTGTTTGAAAGCATTGTTAGGATACTGTTGACATGTAAAGCAACATCCGCTGCAGGTCGACGGATCCCC(SEQ ID NO：6)和ATCGATGTTAATCCCACATTGGGTGAAGGAGGGTAATAGAGTTTCCGCACCTGGGCCTAAATAATAAATGGATTTTGAAAGTGGCCGCATAGGCCACTAGTGGATCT(SEQ ID NO：7)。

转化后选择能在G418板上生长的克隆。二倍体菌株生成孢子，收集孢子后在平板上发芽。mtf1+缺失菌株的确认是用定量PCR检测Mtf1基因的表达水平和用PCR检测基因组DNA。

在染色体的mtf1上加TAP的标记：在染色体的mtf1上加TAP的标记是通过用PCR产物转化单倍体细胞实现的，PCR的引物包含80bp序列于Mtf1C-末端基因序列同源和20bp的序列于质粒pFA6a2PA同源。引物序列为：ACTTTCTTACCATTTCAAAAATTATACAAAAATATCCTTTCAAACATCATTTACATTTGGGTACAATAATTGAAGATTCATACGCTGCAGGTCGACGGATCCCC(SEQ ID NO：8)和CAAAATTACTGGATGCAAAGAAATGCGTGTATGAACAAAAACAATCAATACGTTTGTTTCCCCCAATTTTCTGTAAATTTGGCCGCATAGGCCACTAGTGGATCT(SEQ ID NO：9)。

染色体标记的证实是通过菌落PCR和用rabbit anti mouse IgG peroxidase抗体做Western blot来实现的。

细胞核，线粒体和细胞质的提取与Western blot：Mtf1TAP标记的菌株用来提取细胞核线粒体和细胞质，细胞核的提取方法是Shimizu et a1.1991)所描述的，线粒体和细胞质提取和纯化是Chiron et al.2007所描述的。纯化的细胞核，线粒体和细胞质的样本在10％的SDS PAGE凝胶进行电泳，然后转到硝酸纤维素膜上。用rabbit anti mouse IgG peroxidase抗体在1∶8000稀释后孵育1小时，洗涤后进行化学发光反应，用X光胶片检测荧光信号。

ChIP-chip芯片分析：所使用的芯片间包含了所有裂殖酵母的非编码区，非编码区大于2kb的用了一个以上的PCR产物的探针，探针的平均长度为1kb。总共有5200个从100bp到2kb大小不等的探针。该芯片不包括线粒体染色体基因。在室温下Mtf1TAP标记的细胞在1％甲醛固定15分钟，然后在125mM glycine中5分钟。经过TBS洗两次然后悬浮在0.4毫升的裂解液(50mM HEPES-KOH[pH 7.4]，140mM NaCl，1mM EDTA，1％Triton X-100，0.1％sodium deoxy-cholate，1mM phenylmethylsulfonyl fluoride，10μg/ml aprotinin，1ug/ml leupeptin，1μg/mlpepstatin)中，细胞用玻璃珠打浆机破碎1分钟，破碎的细胞超声4次以打断染色体DN。离心12,000g 10分钟获得上清，然后和IgG Sepharose 6 fast flow bead进行结合。2μg的DNA用Cye-3或Cye-5进行标记(Klenow)后和芯片杂交。数据采集，处理和正常化是(Heichinger et al.2006)中所描述的。

质粒构建：PCR扩增Mtf1编码序列插入到pREP3在SmalI构建了pREP3-mtf1T。

Mtf1基因扩增的PCR片断用XhoI和EcoRI克隆到pGEX-4T-1中构建了pGEX-4T-mtf1T，包含了Mtf1C末端GST的标记。Rpo41基因扩增的PCR片断用用XhoI和EcoRI克隆到到载体pET28a，进而产生了一个N端His标记的Rpo41。克隆是用DNA测序证实的。

Mtf1和Rpo41的表达和纯化：含pGEX-4T-mtf1E.coli BL21细胞在PBS缓冲液(pH8.0)中裂解后用Glutathione Sepharose 4B来纯化。His标签的Rpo41细胞在缓冲液(20mM Imidazole，20mM Phosphate，0.5M NaCl，pH 7.4，1mMphenylmethylsulfonyl fluoride)中裂解后用Ni2+-NTA-agarose纯化，用20mMimidazole洗柱，用500mM imidazole，20mM Phosphate，0.5M NaCl，pH 7.4Ni2洗脱，在20mM Phosphate，0.1M NaCl，0.2mM ETDA and 1mM DTT中透析过夜。

荧光实时PCR分析：在液体培养基中细胞生长OD600＝0.5，使用试剂TRIzol Reagent(Invitrogen)提取总RNA。反转录RNA用TaKaRa PrimeSciptTMlstStrand cDNA Synthesis试剂盒，仪器型号是iQ5 Continuous FluorescenceDetector System(Bio-Rad)。PCR反应包括：250Nm的正向和反向引物，1μl的cDNA(5ng)，10μl 2X SYBR-green Realtime PCR Master Mix(SYBR PremixEx TaqTM，TaKaRa)，总体积为20μl。所有结果是从至少有两个独立的生物重复和四个技术重复中得到。受α-amanitin处理的细胞，0.1μg/ml和1μg/mlα-amanitin加到OD600＝0.5的细胞6小时之后收集细胞。

细胞染色和用共聚焦显微镜观察：对DAPI和calcofluor染色，细胞生长至OD600＝0.5，在70％乙醇中固定，用DAPI染细胞核，或细胞用50μg/ml的calcofluor在50％glycerol and 0.3mg/ml p-phenylenediamine缓冲液中染色，在Leica TCS-SP5显微镜下观察。

凝胶电泳迁移法(EMSA)：5’端生物素标记的PCR引物用来合成生物素标记的探针，在反应中，200ng纯化的GST标签的Mtfl，50fMol的探针和5ng/μL ofpolydI/dC在结合缓冲液(10mM Tris HCl pH 7.5，50mM KCl，0.1mM EDTA，1mMDTT)在冰上孵育30分钟，然后样品在4℃TBE缓冲液中在6％polyacrylamidenative胶上进行电泳，DNA/蛋白复合物被转移到Hybond-N+膜上，并用LightShiftChemiluminescent EMSA kit(Thermo Scientific)EMSA试剂盒进行检测。

体外转录：体外转录所用的DNA模板是PCR产生的，His标记的Rpo41和GST标记的Mtf1蛋白是在大肠杆菌中表达和纯化的。转录反应包括500ng的DNA模板，10pmol的Rpo41和10pmol的Mtf1，在反应缓冲液是50mM Tris(pH 7.9)，20mMMgCl2，1mM dithiothreitol，50μMUTP，[α-32P]UTP(1000cpm/pmol UTP)，250μM ATP，GTP和CTP，总反应体积极是20μl。反应在30℃孵育60分钟，加入25μl的在冰上的终止缓冲液(90％formamide，50mM EDTA，bromophenol blue，and xylene cyanol)。样本在70℃变性5分钟然后在6％polyacrylamide胶上进行电泳。干胶后X光片在放入增强屏幕中再放置-70℃，胶片冲洗后观察放射性的条带。

本发明提供了一种线粒体RNA聚合酶附属转录因子，它的氨基酸序列包括序列表SEQ ID NO：3中的1-366位。RNA聚合酶蛋白和上述线粒体RNA聚合酶附属转录因子可以相互作用，形成聚合酶-转录因子复合体。实验证明，上述线粒体RNA聚合酶附属转录因子可用于转录蛋白，涉及调控细胞周期，还可用作肿瘤药物筛选的药靶。本发明为基因转录、尤其是细胞核内的基因转录提供了一套精确有效的转录工具，为基因功能的研究提供了一种新途径。同时，本发明的线粒体RNA聚合酶附属转录因子涉及调控细胞周期，Mtf1的基因敲除菌株无法形成克隆，考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型，可以将Mtf1作为抗肿瘤药物筛选的靶标。

附图说明

图1是裂殖酵母与芽殖酵母的Mtf1氨基酸序列对比图。

图2是裂殖酵母Mtf1结构域图。

图3是缺失Mtf1细胞和野生型细胞的形态对比图。

图4是Mtf1在细胞中的亚定位图。

图5是过量Mtf1干扰细胞周期进程图。

图6是维生素B1抑制Mtf1mRNA表达图。

图7是过表达Mtf1影响有丝分裂进程图。

图8是Mtf1的转录因子活性不依赖于RNA聚合酶II的细胞结果图。

图9表明增加α-amanitine的浓度Srk1mRNA表达水平不受影响。

图10是Mtf1结合Srk1基因的上游序列图。其中，图A是5个可覆盖上游区域的DNA片段；B显示片段4(F4)和Mtf1结合在胶上产生了迁移速度慢的条带；C显示片段F4-4、F4-2和Mtf1结合在胶上产生了迁移速度慢的条带。

图11是F4-4、F4-2、F4-5转录RNA电泳图。

图12是F4-4转录不同长度片段RNA的电泳图。

具体实施方式

本发明经过深入而广泛的研究，在裂殖酵母中分离得到了一种新型线粒体RNA聚合酶Rpo41和附属转录因子Mtf1。在成功克隆出这两个基因后，利用转基因和基因敲除技术验证其用途。结果表明，Rpo41和Mtf1形成的复合体不但可以负责线粒体基因组的转录，同时，还可以转录核基因Srk1，进而影响酵母正常的细胞周期进程。

实施例1：裂殖酵母新型线粒体RNA聚合酶Rpo41和附属转录因子Mtf1的克隆

根据芽殖酵母中同源蛋白氨基酸序列，在英国桑格研究中心网站Genedb上进行Blast比对，结果显示，裂殖酵母中分别存在一个高度保守的同源线粒体RNA聚合酶，系统名SPAC26H5.12，以及一个高度保守的线粒体转录因子，系统名SPAC1002.08c。裂殖酵母与芽殖酵母中Mtf1同源蛋白之间氨基酸序列的对比结果参见图1，通过比对，申请人发现裂殖酵母Mtf1具有一个保守的N端结构域和一个保守的C端结构域，参见图2。

在本发明下述实施例中，如无特别说明，SPAC26H5.12被简称为Rpo41，SPAC1002.08c被简称为Mtf1。

实施例2：裂殖酵母Mtf1在细胞中的亚定位

为了研究裂殖酵母Mtf1在细胞中的功能，本发明使用超速离心的方法，分别提取了裂殖酵母线粒体，细胞核和细胞质成分，使用Western-blot方法检测Mtf1在细胞中的亚定位，如图4所示，Mtf1在细胞核和线粒体中都有定位，这一结果暗示了Mtf1不仅在裂殖酵母线粒体中发挥功能，同时很可能也在细胞核中具有转录基因的功能。

实施例3：裂殖酵母Mtf1敲除突变体有细胞周期调控和细胞形态上的缺陷

为了探讨其细胞功能，本发明对裂殖酵母的Mtf1进行基因敲除，敲除是在二倍体细胞中进行的，后经交配产生的孢子在发芽后在显微镜下观察表型。缺失Mtf1的细胞表现出类似的形态，即：敲除菌株无法形成克隆，在平板上只能分裂几次。图3表明，缺失Mtf1的细胞和野生型细胞相比在形态上更长更大，并且变成鸡蛋或瓶子的形状。DAPI染色表明缺失Mtf1的细胞没有明显细胞核的缺陷。使用荧光白Calcofluor(卡尔科弗卢尔荧光染色剂)染色的结果显示缺失Mtf1的细胞有较高比例的细胞横隔，其中一些细胞含有多个细胞横隔。此结果暗示Mtf1可能有调控细胞周期和细胞形态方面的功能，体内Mtf1功能的缺失会造成酵母分裂的不正常。

实施例4：Mtf1过量表达对裂殖酵母细胞周期的影响。

首先将Mtf1的编码序列克隆到裂殖酵母过量表达载体pREP3中，载体上过量表达Mtf1的强启动子Pnmt1能够受维生素B1抑制性的调控。对在不加维生素B1和加了60μM维生素B1的条件下的细胞进行定量PCR的检测Mtf1表达量。在没有维生素B1的条件下过量表达Mtf1的细胞比仅转入空载体的细胞中Mtf1表达水平超过600倍以上。虽然60μM维生素B1可以抑制Mtf1mRNA表达水平到最低水平，但抑制并不完全(图6)，此结果暗示了Mtf1过量表达菌株的构建成功。申请人利用激光共聚焦显微镜观察到在没有维生素B1的条件下过量表达Mtf1的细胞和仅转入空载体的细胞相比是明显变长的，而在加了60μM维生素B1的条件下过量表达Mtf1的细胞没有变长，此结果表明过量表达Mtf1会干扰细胞周期进程(图5)。

实施例5：Chip-chip的方法确定Srk1可能是Mtf1的靶基因

为了在裂殖酵母全基因组中找到Mtf1的靶基因，使用同源重组基因打靶技术，将酵母基因组上的Mtf1基因编码区末端加了TAP标签，利用染色体免疫共沉淀偶联芯片杂交的方法，筛选Mtf1在体内的直接结合的DNA片段，分析表明总共有70个非编码区的DNA片段可能和Mtf1结合，其中一个信号很强且重复出现多次的DNA片段是Srk1(Sty1调节激酶1)的上游区域。

实施例6：过量表达Mtf1影响到有丝分裂的进程是通过调节Srk1基因的转录实现的

利用荧光定量PCR的实验方法检测了过量表达Mtf1细胞中Srk1mRNA的水平发现Srk1mRNA表达量在过量表达Mtf1细胞中比在只有转化了载体的细胞中增加了18倍(图7)。在过量表达Rpo41的菌株中Srk1mRNA的水平也过量表达3倍，此结果说明Srk1就是Rpo41和Mtf1形成的复合体在体内调控的靶基因。而已有的研究表明，Srk1过量表达菌株表现出细胞长度增加的表形，与实验中观察到Mtf1过量表达菌株的表型类似，此证据进一步指明了Mtf1在体内主要是通过调控Srk1基因的表达从而影响细胞周期和细胞分裂过程。

实施例7：Mtf1的转录因子的活性不依赖于RNA聚合酶II

在经典生物学理论中，真核细胞中RNA聚合酶II和相应转录因子负责合成细胞中mRNA。而芽殖酵母中的研究显示，Rpo41是线粒体中RNA聚合酶，它与转录因子Mtf1共同参与线粒体基因的转录。

在前述实施例中，已经证明作为线粒体转录因子的Mtf1同样可以控制核基因Srk1基因的表达，进而调控细胞周期。因此，下一步的疑问是：RNA聚合酶II还是Rpo41和Mtf1一起转录Srk1mRNA。用不同浓度的RNA聚合酶II特异性抑制剂α-amanitine(它不影响线粒体的RNA聚合酶)来处理野生型972细胞，对比没有用α-amanitine处理过的细胞并检测Srk1的表达水平的变化。选择线粒体基因cox1和15S rRNA共同作为参照，cox1和15S rRNA是由Rpo41转录的因此其表达量在加了α-amanitine应该是不会改变的。首先，检测了3个受RNA聚合酶II转录的基因(actin，tublin，SPAC23H4.13c)在不同浓度的α-amanitine的条件下，这3个基因的表达量和没处理的细胞相比都有所降低(图8)。然后，比较了在加和不加α-amanitine时Srk1和tub1mRNA表达水平，Srk1mRNA和tub1用cox1和15S rRNA正常化后的信号相对表达量是100％。图9表明增加α-amanitine的浓度Srk1mRNA表达水平不受影响。与此相反，tub1mRNA表达水平是减少的。在不同浓度的α-amanitine tub1mRNA的表达水平是低于Srk1的。这些结果表明Srk1mRNA转录是不依赖于RNA聚合酶II。因此，本发明推测很有可能是线粒体聚合酶Rpo41和转录因子在某种情况下也能够在细胞核中转录Srk1的mRNA。

实施例8：体外制备重组Mtf1和Rpo41蛋白

本发明将裂殖酵母中Mtf1和Rpo41的编码区分别克隆进原核表达载体pGEX-4T-1和pET28A中，测序验证序列无误后，将pGEX-4T-mtf1和pET28A-rpo41分别转入E.coli BL21细胞，使用IPTG诱导表达重组蛋白。如实验方法中所述，分别使用Glutathione Sepharose 4B和Ni2+-NTA-agarose纯化出Mtf1和Rpo41重组蛋白，使用SDS-PAGE验证表达产物的分子量，使用Bradford方法测定蛋白浓度。

实施例9：Mtf1能够结合Srk1基因的上游序列

为了更为深入研究Mtf1的生物化学性质，利用凝胶电泳迁移率(EMSA)分析的方法检测了Mtf1和Srk1基因的上游序列的结合能力。生物信息学分析显示，Srk1基因编码区的上游有2000个左右的碱基对，并且十分的富含A+T(62％)。用5’生物素标记的PCR引物进行PCR扩增产生了5个可覆盖上游区域的DNA片段(图10A)，生物素标记的DNA片段和从细菌中纯化的Mtf1用于EMSA的检测。在5个DNA片段中，片段4(F4)和Mtf1结合在胶上产生了迁移速度慢的条带(图10B)。F4进一步被分为5个DNA片段用来作EMSA，图10C表明，F4-2和F4-4和Mtf1结合在胶上产生了迁移速度慢的条带。此结果显示F4-2和F4-4片段中可能包括Mtf1和Rpo41起始转录的位点。

实施例10：Mtf1和Rpo41组成的复合体能转录核基因

上述实施例中纯化的Rpo41和Mtf1蛋白，以及鉴定出的Srk1上游启动子片段F4-2和F4-4被用于体外转录反应，以确定Mtf1和Rpo41是否能够在体外组成一个转录核基因的系统。体外转录反应中加有α-P32UTP，P32标记的RNA首先在6％的PAGE凝胶上电泳，然后利用放射自显影技术确定是否有转录出的RNA片段。如图11所示，虽然F4-2和F4-4两个DNA片段在EMSA实验中都能够结合Mtf1蛋白，但只有F4-4为模板能够明显转录出RNA片段，而另一个副对照F4-5也不能转录出RNA片段。根据已经发表的裂殖酵母中的启动子的保守序列，预测在F4-4片段的5’端存在一个类似的9bp的潜在的启动子保守序列。因此，以F4-4片段的5’端为起点，分别设计了三条分别长为79bp，89bp和99bp的DNA模板，图12显示这三条模板都能转录出RNA片段，此结果证明了Rpo41和Mtf1确实能够转录包含预测启动子区域的核基因。而且，图12显示79bp，89bp和99bp三条模板转录出的RNA大小依次增加，此结果也显示了实验中的转录方向与预测的一致，证明了在体外系统中，Mtf1和Rpo41组成的复合体确实能够转录核基因Srk1。

实施例11：Mtf1和Rpo41作为转录工具酶的应用

人工转录RNA在生物技术领域具有广泛的应用，目前，主要使用的是来自噬菌体的T7RNA聚合酶，它可以识别并结合一个21或22个bp的特定的启动子片段，并高效地转录下游RNA片段。基于对Mtf1和Rpo41功能的研究，发现重组的Mtf1和Rpo41蛋白在体外能够高效地转录包含XX核心序列的片段，与商业化的T7聚合酶相比，因为Mtf1和Rpo41来自真核生物，因此能够更为精确，高效的转录真核来源的RNA，特别是某些含有复杂二级结构的RNA片段，因为转录因子Mtf1能够“融解”启动子片段的碱基对，因此，在优化的转录缓冲液和反应条件下，Mtf1和Rpo41组成的转录体系能够被开发成一种商业化的转录系统，此系统能够特异性地转录包含19bp(SEQ ID NO：51361-1379)核心序列的RNA片段。

实施例12：Mtf1作为药物筛选靶标的应用

如前实施例所示，Mtf1的基因敲除菌株无法形成克隆，在平板上只能分裂几次。使用荧光白Calcofluor染色的结果显示缺失Mtf1的细胞有较高比例的细胞横隔，其中一些细胞含有多个细胞横隔。此结果暗示Mtf1可能有调控细胞周期和细胞形态方面的功能。过量表达Mtf1出现细胞长度增加的表形。考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型。因此，本发明认为可以将Mtf1作为抗肿瘤药物筛选的靶标。本发明认为，能够使Mtf1基因敲除菌株、Mtf1过量表达菌株恢复或部分恢复正常表形的化合物均能够被认为是潜在的抗肿瘤药物分子。

序列表

<210>1

<211>1120

<212>PRT

<213>裂殖酵母

<400>1

Met Pro Ile Glu Ala Tyr Glu Pro Tyr Lys Asn Glu Leu Lys Ser Lys

1 5 10 15

Ile Gly Lys Asp Phe Ile Ile Asp Leu Ser Tyr Lys Ser Gly Thr Ala

20 25 30

Ser Leu Phe Glu Ala Cys Val Tyr Asn Gly Asp Phe Leu Arg Ser Lys

35 40 45

Gln Leu Leu Lys Ser Phe Ile Asp His Asn Lys Gly Asp Lys Ile Leu

50 55 60

Leu Pro Met Ile Asn Leu Tyr Ile Arg Glu Ile Ile Gln Arg Gly Ser

65 70 75 80

Phe Glu Leu Thr Asp Val Leu Ser Asn Ala Lys Glu Leu Leu Gln Gln

85 90 95

Ala Arg Leu Asn Gly Asp Ser Leu Thr Tyr Ala Leu Leu Cys Gln Ala

100 105 110

Ser Leu Asn Pro Thr Gln Arg Gln Leu Gly Leu Pro Val Leu His Glu

115 120 125

Leu Ile His Asn Trp Arg Ser Ala Asn Gly Lys Val Ile Asp Ile Leu

130 135 140

Met His Glu Ser Val Phe Ser Pro Glu Glu Val Lys Leu Ile Met Asp

145 150 155 160

Gln Leu Asn Ile Pro Ile Asn Asn Phe Thr Pro Ser Gln Leu Gln Leu

165 170 175

Leu Gly Ile Thr Asn Ser Thr Ile Val Gly Glu Ser Glu Asn Gly Lys

180 185 190

Asp Gln Asn Gly Asp Ser Ser Leu Lys Glu Lys Gln Pro Asp Val Glu

195 200 205

Thr Thr Val Thr Lys Ser Ala Asn Leu Asn Ala Leu Arg Ser Ser Leu

210 215 220

Ser Ser Leu Leu Thr Glu Ser Ile Asp Leu Pro Ile Asp Glu Val Ser

225 230 235 240

Leu Glu Phe Gly Asn Gln Gly Asp Thr Phe Asn Leu Ala Arg Gln Lys

245 250 255

Leu Leu Glu Lys Ser Ala Ile Leu Ser Ala Ala Glu Val Trp Lys Ser

260 265 270

Glu His Glu Ser Val Leu Asn Arg Gly Asn Leu Gln Val Pro Lys Asn

275 280 285

Val Ser Ser Leu Phe Tyr Ser Trp Tyr Val Gln Leu Glu Gln Leu Phe

290 295 300

Lys Glu Glu Ile Ser Leu Ile Asp Asp Leu Ala Leu Asn Glu Ser Leu

305 310 315 320

Asp Lys Lys Asn Asp Arg Leu Ile Tyr Gly Pro Phe Leu Lys Leu Leu

325 330 335

Ser Ser Lys Lys Leu Ala Ala Leu Thr Ile Met Glu Val Ala Gln Leu

340 345 350

Ser Thr Asn Pro Arg Tyr Asp Arg Gly Ala Arg Val Thr Thr Leu Leu

355 360 365

Gly Gly Leu Gly Arg Ser Phe Glu Arg Glu Phe Leu Ser Glu Gln Ile

370 375 380

Gln Arg Gln Glu Lys Asn Lys Ser Tyr Lys Asp Lys Lys Arg Leu Lys

385 390 395 400

Glu Leu Phe Asn Asp Pro Arg Lys Phe Arg Gln Ala Val Lys Asn Leu

405 410 415

Arg Leu Ser Asn Thr Arg Asp Asn Ile Val Leu Asn Pro Ser Val Asp

420 425 430

Ser Trp Pro Ser Ala Ile Val Met Lys Val Gly Ser Val Ala Leu Cys

435 440 445

Leu Leu Leu Ser Val Ala Lys Ile Glu Val Thr Ala Lys Asp Leu Ser

450 455 460

Thr Gly Gly Ile Leu Lys Gln Glu Val Ala Ala Phe Val His Thr Tyr

465 470 475 480

Gln Tyr Ser Asn Gly Arg Lys Val Gly Met Ile Val Pro His Val Glu

485 490 495

Phe Tyr Lys Leu Leu Ser Arg Asp Ile Glu Lys Pro His Leu His Pro

500 505 510

Gln Leu Leu Pro Met Leu Val Thr Pro Lys Pro Trp Thr Ser Trp Ile

515 520 525

Asp Gly Gly Tyr Tyr Tyr Ser Arg Gln Pro Leu Val Arg Leu Lys Gly

530 535 540

Ala Leu Glu Gln Val Asp Tyr Leu Met Lys Ala Ser Glu Asn Gly Gln

545 550 555 560

Leu Asp Glu Leu Phe Lys Ala Val Ser Ser Leu Gly Lys Val Ser Trp

565 570 575

Arg Ile Asn Gln Arg Leu Phe Asn Val Leu Ile Arg Ile Trp Asn Ser

580 585 590

Gly Glu Lys Phe Leu Ser Ile Pro Pro Arg Glu Val Lys Cys Asp Met

595 600 605

Pro Pro Tyr Pro Lys Asn Ser Ile Asn Pro Arg Asp Lys Val Ile Trp

610 615 620

His Thr Arg Arg Lys Glu Leu Ala Ala Leu Lys Thr Gly Ala His Ser

625 630 635 640

Gln Arg Cys Asp Phe Asn Tyr Lys Leu Glu Ile Ala Arg Ala Phe Leu

645 650 655

Asn Glu Lys Phe Tyr Phe Pro His Ser Leu Asp Phe Arg Gly Arg Ala

660 665 670

Tyr Pro Leu Ser Ser His Leu His His Val Ser Asn Asp Val Cys Arg

675 680 685

Gly Leu Leu Glu Phe Ser Thr Gly Lys Pro Leu Gly Pro Lys Gly Leu

690 695 700

Asn Trp Leu Lys Val His Leu Ala Asn Leu Phe Gly Ile Ser Lys Lys

705 710 715 720

Asp Phe Ala Thr Arg Gln Ala Phe Val Asp Asp Asn Met Gln Glu Val

725 730 735

Phe Asp Ser Ala Asp Arg Pro Leu Asp Gly Asn Lys Trp Trp Ser Lys

740 745 750

Ala Asp Asp Pro Phe Gln Ala Leu Ala Ala Cys Phe Glu Ile Ala Glu

755 760 765

Ala Val Arg Ser Gly Asp His Glu Ser Tyr Ile Ser His Ile Pro Ile

770 775 780

Gln Gln Asp Gly Thr Cys Asn Gly Leu Gln His Tyr Ala Ala Leu Gly

785 790 795 800

Gly Asp Ile Glu Gly Ala Lys Gln Val Asn Leu Trp Pro Ser Asp His

805 810 815

Pro Ser Asp Val Tyr Glu Ala Val Ala Glu Ile Val Arg Gly Phe Leu

820 825 830

Lys Lys Asp Ala Glu Ala Gly Asp Glu Met Ala Asn Phe Leu Lys Asp

835 840 845

Lys Val Thr Arg Ser Val Val Lys Pro Thr Val Met Thr Asn Val Tyr

850 855 860

Gly Val Thr Tyr Val Gly Ala Arg Lys Gln Ile Ser Glu Lys Leu Glu

865 870 875 880

Asn Ile Asp Gly Met Glu Lys Leu Lys Val Ala Asp Tyr Ala Asn Tyr

885 890 895

Leu Thr Lys Lys Val Phe Glu Ala Leu Arg Ser Leu Phe Thr Gln Ala

900 905 910

His Glu Ile Gln Asp Trp Leu Ser Ala Cys Cys Asn Leu Ile Thr His

915 920 925

Ser Leu Pro Ala Asp Tyr Ile Lys Glu Gly Ile Lys Asp Glu Leu Thr

930 935 940

Pro Val Val Trp Thr Thr Leu Leu Asn Leu Pro Ile Val Gln Pro Tyr

945 950 955 960

Arg Asn Tyr Lys Ser Arg Gln Ile Arg Thr Asn Leu Gln Thr Val Phe

965 970 975

Ile Glu Glu Arg Asp Arg Thr Ala Thr Val Gln Pro His Lys Gln Ala

980 985 990

Thr Ala Phe Pro Pro Asn Phe Ile His Ser Leu Asp Ala Thr His Met

995 1000 1005

Phe Met Thr Cys Leu Lys Cys Ser Glu Gln Asn Ile Asn Phe Ala

1010 1015 1020

Ala Val His Asp Ser Tyr Trp Thr His Ala Cys Asp Val Asp Gln

1025 1030 1035

Met Asn Ser Leu Leu Arg Glu Ala Phe Val Leu Leu His Ser Asn

1040 1045 1050

Asn Ile Met Glu Arg Leu Lys Gln Glu Phe Glu Glu Arg Tyr Lys

1055 1060 1065

Gly Phe Leu Val Ser Lys Lys Ala Ile Lys Ala Asn Asp Glu Asp

1070 1075 1080

Leu Lys Ala Lys Phe Gly Asn Lys Ser Tyr Ile Pro Leu Glu Phe

1085 1090 1095

Pro Pro Leu Pro Ala Arg Gly Ala Leu Asp Leu Lys Lys Val Leu

1100 1105 1110

Glu Ser Lys Tyr Phe Phe Ser

1115 1120

<210>2

<211>3363

<212>DNA

<213>裂殖酵母

<400>2

atgcccattg aagcgtacga gccttataag aatgaactta aaagtaaaat tggaaaggat 60

ttcataatag acttgagtta caagtctggg actgctagtt tatttgaggc gtgcgtctac 120

aatggtgatt ttttacggtc taagcagctc cttaaaagtt ttattgatca taacaaaggt 180

gataaaatac tgttaccaat gattaattta tatatccgtg aaatcattca gcgtggatct 240

ttcgagttga ctgatgtcct gtcaaatgca aaagaactat tgcaacaggc aagactgaat 300

ggagattctt taacgtatgc tctactttgc caagcatcac ttaatccgac tcagcgccaa 360

cttggattac ccgtattaca cgaactaatt cacaattggc gttcagcaaa cggtaaagtt 420

atagatatct taatgcatga gtcagttttt tcgcccgaag aggtgaaact tattatggat 480

caacttaaca tacctataaa taattttact ccttctcaat tgcaattgct tggaatcact 540

aattctacaa ttgttggaga aagtgaaaat ggtaaagatc aaaatggtga ctcttccctg 600

aaagaaaagc aaccagacgt cgagactact gtaacaaaaa gtgcaaactt aaatgccctt 660

agaagttcac tctctagtct actgactgaa tccatagatt tgccgatcga tgaagtttct 720

ttagagtttg gaaatcaagg tgatacattc aacctcgcta gacagaagct tttagaaaaa 780

agcgcaattc tatcagctgc tgaagtttgg aagtcagaac atgaaagtgt tttaaatcga 840

ggtaatctgc aagtgccgaa aaatgtttcc tctttgttct atagttggta tgtacaactt 900

gaacaattgt tcaaagagga aatttccctc atagacgatt tagcattaaa tgaatctttg 960

gataagaaaa acgaccggtt aatttatggc ccgtttttaa agcttttatc ttccaagaag 1020

ctggcagcgc taacaataat ggaagtagca caattgtcta caaatcctcg atacgatcgt 1080

ggtgctcgtg ttacaacgtt actcggtgga ttaggtagaa gttttgagcg tgaatttttg 1140

tcggaacaaa ttcaaaggca agaaaaaaat aaaagctaca aggataagaa aagattaaaa 1200

gaattgttca acgatcctcg aaaatttcga caagcggtga agaatttacg tctttcaaat 1260

acaagggata atattgtttt aaatccaagt gttgatagtt ggccttctgc aatagtcatg 1320

aaagttggtt cagtcgctct ttgtcttttg ttaagtgttg caaaaattga agtaacagct 1380

aaggatttaa gcacgggcgg catattgaaa caggaagttg cagcgtttgt ccacacgtac 1440

caatattcta atggtaggaa agttgggatg attgttccgc atgtggaatt ttacaagctt 1500

ctttctcgtg atattgagaa gccgcaccta catcctcaat tgcttcctat gctagttacg 1560

ccaaagcctt ggactagttg gattgatggt ggttattatt atagccgcca accgctcgtc 1620

cgtttaaaag gtgcactgga gcaggtagat tacttaatga aggcttcaga aaatggacaa 1680

cttgatgaac tctttaaggc agtaagtagc cttggtaaag tttcatggcg tatcaatcaa 1740

cgacttttta atgttctaat taggatttgg aactctggag aaaaatttct ttctattcct 1800

ccgagagagg taaaatgcga tatgccgcct tatccaaaaa attcaataaa tcctcgtgat 1860

aaggtcattt ggcataccag aagaaaagag cttgctgcct taaaaacagg tgctcactct 1920

caaagatgtg actttaacta caaacttgag attgcacgag catttttaaa cgaaaaattt 1980

tattttcctc atagtttaga ttttcgcggt cgtgcatatc ctctaagttc tcatttgcat 2040

cacgtcagca acgatgtttg tcgtggtttg ctggagtttt cgacgggtaa accgttaggc 2100

ccaaaaggat taaattggct aaaagtccat cttgctaacc tcttcggaat cagcaagaaa 2160

gactttgcta cccgccaggc gtttgtcgat gacaatatgc aggaagtttt tgattctgct 2220

gatcgtcctc tggacggcaa taaatggtgg tcaaaagctg atgatccgtt tcaagctctt 2280

gctgcctgct ttgagatagc agaggcagta cgctctggtg atcatgaaag ttatatttcc 2340

catataccca tccagcaaga tggaacttgt aacggtctac aacattatgc cgctttaggt 2400

ggtgacattg aaggtgctaa gcaagtaaat ttatggccaa gtgaccaccc aagtgatgtt 2460

tatgaggcag ttgcagaaat tgtgcgtggg tttctaaaaa aggatgccga agcaggggac 2520

gaaatggcta atttcttaaa agacaaagtt accagaagtg tggtcaagcc tacggttatg 2580

actaatgttt atggtgtaac gtatgttgga gcccgcaaac aaatttccga aaagctggag 2640

aatattgatg gaatggaaaa gctgaaggtt gcggattacg ccaattattt gacgaaaaaa 2700

gtttttgaag ctcttcgttc tttatttacg caggctcatg aaattcaaga ttggctatcc 2760

gcttgttgta atctaattac tcactcatta ccagccgatt acataaaaga aggaatcaag 2820

gatgaactta ctccagtagt gtggacaacg cttctaaatt tgcctatagt acaaccatat 2880

cgtaattaca aatcccgcca aattcgtacc aacttacaga ctgtctttat tgaagaaaga 2940

gatagaacag caacagtaca accacacaaa caggccactg cttttcctcc taattttatt 3000

cactctttag atgcaacgca tatgtttatg acttgtttaa aatgtagcga acaaaacatt 3060

aactttgctg ctgttcatga ctcttattgg acacacgctt gtgatgttga tcaaatgaat 3120

agccttttgc gcgaagcatt tgtgttgttg cactcaaaca acattatgga aaggctaaaa 3180

caggagtttg aggagagata caaaggtttt ttagtttcga agaaggcgat caaagctaat 3240

gatgaagatt tgaaagctaa atttggtaat aaatcttata ttcctttgga atttccgcca 3300

ctgccggcga gaggtgcttt ggatttaaaa aaagttttgg agagtaagta ttttttctca 3360

taa 3363

<210>3

<211>366

<212>PRT

<213>裂殖酵母

<400>3

Met Lys Leu Pro Lys Ile Leu Tyr Asp Ala Ala Ala Phe Gly Gly Pro

1 5 10 15

Arg Ser Thr Gly Phe Val Lys Ile Leu Asn Leu Asn Gly Arg Ser Ser

20 25 30

Tyr Lys Ser Ser Tyr Leu Val Asn Gln Asn Leu Met Asp Glu Ala Leu

35 40 45

Val Lys Ser Asn Leu Leu Lys Glu Tyr Asn Ser Glu Lys Met Thr Ile

50 55 60

Leu Glu Met Ala Pro Gly Pro Gly Val Thr Thr Thr Ser Leu Phe Asn

65 70 75 80

Tyr Phe Gln Pro Lys Ser His Val Val Leu Glu Ser Arg Glu Val Phe

85 90 95

Ser Lys Pro Leu Gln Lys Leu Cys Thr Leu Ser Asp Gly Arg Ile Lys

100 105 110

Trp Val His Gln Asp Gly Tyr Tyr Trp Gln Thr Tyr Glu Asp Val Tyr

115 120 125

Val Ser Lys Val Leu Asp Pro Arg Ile Gln Thr Glu Glu Glu Gln Lys

130 135 140

Leu Ser Pro His Arg Glu Leu Leu Phe Phe Ala His Leu Pro His Gly

145 150 155 160

Tyr Ala Gly Leu Leu Phe Val Ser Gln Ile Leu Asp Phe Leu Ser Ala

165 170 175

Arg Asp Trp Leu Gly Ile Phe Gly Arg Val Arg Val Leu Leu Trp Leu

180 185 190

Pro Cys Ser Pro Thr Val Thr Leu Leu Gly Ser Arg Gly Phe Ser Lys

195 200 205

Arg Ser Lys Thr Ser Val Phe Arg Glu Ala Phe Thr Asp Ser Arg Val

210 215 220

Leu Ala Ala Ser Glu Ser Thr Leu Gln Lys Leu Cys Met Gly Tyr Ser

225 230 235 240

Lys Glu Ala Lys Glu Asn Tyr Gln Ile Ser Pro Asn Pro Leu Leu Val

245 250 255

Ser Pro Thr Pro Ile Thr Ser Glu Pro His Lys Glu Asp Leu Thr Leu

260 265 270

Val Glu Met Cys Ser Lys Pro Gln Asp Lys Gln Leu Ser Ile Pro Val

275 280 285

Phe Glu Ser Ile Val Arg Ile Leu Leu Thr Cys Lys Ala Thr Ser Leu

290 295 300

Ser Lys Ser Ile Tyr Tyr Leu Gly Pro Gly Ala Glu Thr Leu Leu Pro

305 310 315 320

Ser Phe Thr Gln Cys Gly Ile Asn Ile Asp Met Pro Val Gly Leu Leu

325 330 335

Ser Ala Ala Asp Phe Leu Thr Ile Ser Lys Ile Ile Gln Lys Tyr Pro

340 345 350

Phe Lys His His Leu His Leu Gly Thr Ile Ile Glu Asp Ser

355 360 365

<210>4

<211>1101

<212>DNA

<213>裂殖酵母

<400>4

atgaagcttc ctaaaatttt atatgacgca gctgcatttg gaggaccaag atccacgggg 60

tttgttaaga tattaaacct aaacggtcgt tcttcgtata agtcatcgta tcttgtgaat 120

cagaatttga tggatgaagc gcttgtgaaa agcaatctgc ttaaggaata caactcggag 180

aaaatgacta ttttagaaat ggcaccggga ccgggagtga ctaccacttc gctgttcaat 240

tacttccaac ctaaaagtca cgttgtgcta gaatcacggg aagttttttc caaaccttta 300

caaaaattgt gtacgctttc tgatggaagg attaagtggg tgcatcaaga tggttattat 360

tggcaaactt acgaagatgt gtacgtttcg aaggttttgg atcctcgtat tcaaacagaa 420

gaggagcaga agttatcacc acatcgcgaa cttttatttt ttgctcatct tcctcatggt 480

tatgccgggt tattatttgt ttctcaaatt ttagactttc tctcggcaag ggattggctt 540

ggcatttttg gaagagttcg tgtattgcta tggttgccct gttctcctac tgttactctt 600

cttggaagta ggggattttc aaaaagatcc aagacatcag ttttccgaga ggcctttaca 660

gactctcgtg tattagctgc ctccgagtca acattgcaaa aattatgtat ggggtatagt 720

aaagaggcca aggagaatta tcaaatttct ccaaatcctt tattagtttc acccacgcca 780

attactagtg aaccgcataa agaggacctt actttggttg aaatgtgctc caaaccacaa 840

gataaacaat tgtctattcc agtgtttgaa agcattgtta ggatactgtt gacatgtaaa 900

gcaacatcac tttcaaaatc catttattat ttaggcccag gtgcggaaac tctattaccc 960

tccttcaccc aatgtgggat taacatcgat atgcccgttg gactattgag tgcagccgac 1020

tttcttacca tttcaaaaat tatacaaaaa tatcctttca aacatcattt acatttgggt 1080

acaataattg aagattcata a 1101

<210>5

<211>1987

<212>DNA

<213>人工合成

<400>5

gatgataaac aagctcgcca tctctatact taagggcttg cattgtatgg aaagggcgca 60

attgccgtgc cctataagaa gaacttttga tttttcaaat gaattttaga tcttgaagtc 120

aggcgacaac agccaaaaca tcatctcatc tcattcattc aacaatgagg aatgggcgat 180

ttttcatcca gcgtttttat caggtcaatt gcgtcgatct cattgtacac caagatgatg 240

gatatgtaat gaagccagcc agtcggctta tgaaaatttt gctaattata agaaatcaat 300

tgcaagtaac agaaatgaga tggatcgctg catcaacaag gataatgaga tagacagata 360

aagtttgttg aaaattttca cgacagaaga aaatcactca actaatcaac tcaaaatgga 420

ataacatgga aatttatttc gccaaacagt gcagaagcca ctcaaaagtg aaatgagcaa 480

tggaggggag gaaggaaaga ttggttgatt tgctgtatca gatgaaattc atgggtgaat 540

gaaaaagaaa aaaaggtttg caagaggatg gatgagtgag attgaaaaaa tattagatct 600

cgaataaatt ctttctatcc atctttcata gtatacaatc gaaaacaaga tagaacacat 660

ccatgccatc catacttcta tctttttttt tctttctctc tctctctctc cccccctagc 720

attcctccaa caacctcttt ataaacgata tcctcttctc ttcccttcct acaccaatat 780

cctcctattt tgtctctgat gtcatgctga cctccaccca ctttacactt ttacctcgcc 840

attgcaccgt gtcgcttacc gcaaaacctc atcgagtcat ggatgcgcaa cgtcaccacc 900

atcgtaagcg aatacagagt tggaacgagc ggctcgcatg atgccaatga cgtacgttaa 960

cgaaggacgt caaagtaggc aaatccgccg acataaactt cttgtctttc gcataccacg 1020

attgttggac accaacaata tatttctgtg aaaatcaatt gaaaagctaa tttagtaatt 1080

ttttggagac tattggaagg gtacccagta ttggaaagtt atatgattct taaaaatgta 1140

cgtttgtaaa tgtttgctca ctcgttcgtg tgggtaatgt ttgagtcgga tttttgtttg 1200

gattgtggat gtaaacgcgg atattagagg ctggagatga gtatcggaaa gactttgcgt 1260

ttggagagtg ttgttgacgt tacacttcct acctttggac tgggttgggg atagggatct 1320

taggagagat aagtggacga atgaattagg acggttggac aatatcgagt cttggaagat 1380

tactgaattc taataaaaaa aaaagaaaag caagaagcga tttttttctt ttgtgttttt 1440

atttcatttt tattttcttt ccaagtctgt gactagtttt ttggactttt ttttggattt 1500

tttttttctt ctacgtcagg tgctttcata cggagatttg ctctttcctt gatgatcagt 1560

tttgatttca tctttacctt attctatatc acgtctcctt ccccttctgc taggcggtga 1620

ttgtatgctt gacttcattc tctacatcat tcaggtgacg ggtttcgctt tcaagtcgtt 1680

aagttaaatt tggcggatgc gcaagtgtat cttttttttc attctttttg tgcgaaattc 1740

cttttttttt tctttttttt ttcttttttc tatcatcttg tctctctgtt atcttggttt 1800

agttcaagag tacggatgcg gatagatcag tgtcaagaat ttggaagcaa atgtgttggc 1860

acatttccag acgtaaaacc aaacgactag agatctttaa ttagttattt ttctaataat 1920

acccatatct cttgattgat tccgtttgtc gccgtctgtt caaataatgc gttttaaagt 1980

atgtttg 1987

<210>6

<211>103

<212>DNA

<213>人工合成

<400>6

ctccaaacca caagataaac aattgtctat tccagtgttt gaaagcattg ttaggatact 60

gttgacatgt aaagcaacat ccgctgcagg tcgacggatc ccc 103

<210>7

<21l>107

<212>DNA

<213>人工合成

<400>7

atcgatgtta atcccacatt gggtgaagga gggtaataga gtttccgcac ctgggcctaa 60

ataataaatg gattttgaaa gtggccgcat aggccactag tggatct 107

<210>8

<211>104

<212>DNA

<213>人工合成

<400>8

actttcttac catttcaaaa attatacaaa aatatccttt caaacatcat ttacatttgg 60

gtacaataat tgaagattca tacgctgcag gtcgacggat cccc 104

<210>9

<211>105

<212>DNA

<213>人工合成

<400>9

caaaattact ggatgcaaag aaatgcgtgt atgaacaaaa acaatcaata cgtttgtttc 60

ccccaatttt ctgtaaattt ggccgcatag gccactagtg gatct 105

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

30 金币 0人已下载

下载	加入VIP,免费下载

版权申诉 PDF格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

关键词：: 一种线粒体 RNA 聚合附属转录因子复合体应用

专利查询网所有文档均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

0条评论

还可以输入200字符

暂无评论，赶快抢占沙发吧。

关于本文

本文标题：一种线粒体RNA聚合酶附属转录因子、其聚合酶-转录因子复合体及应用.pdf
链接地址：https://www.zhuanlichaxun.net/p-9019357.html