书签 分享 收藏 举报 版权申诉 / 29

一种线粒体RNA聚合酶附属转录因子、其聚合酶-转录因子复合体及应用.pdf

  • 上传人:没水****6
  • 文档编号:9019357
  • 上传时间:2021-01-27
  • 格式:PDF
  • 页数:29
  • 大小:1.07MB
  • 摘要
    申请专利号:

    CN201010022770.8

    申请日:

    20100113

    公开号:

    CN102127157A

    公开日:

    20110720

    当前法律状态:

    有效性:

    失效

    法律详情:

    IPC分类号:

    C07K14/39,C12N15/31,C12N9/00,C12P21/02,C12Q1/68,C12Q1/02

    主分类号:

    C07K14/39,C12N15/31,C12N9/00,C12P21/02,C12Q1/68,C12Q1/02

    申请人:

    复旦大学

    发明人:

    阿拉斯太尔·马歇尔,王哲,陈东戎,孙文夏,蒋恒义,张静

    地址:

    200433 上海市邯郸路220号

    优先权:

    CN201010022770A

    专利代理机构:

    上海正旦专利代理有限公司

    代理人:

    吴桂琴;包兆宜

    PDF完整版下载: PDF下载
    内容摘要

    本发明属于生物技术领域,涉及一种线粒体RNA聚合酶转录因子Mtf1和聚合酶-转录因子组合物。本发明提供了一种线粒体RNA聚合酶附属转录因子Mtf1,它的氨基酸序列包括序列表SEQ ID NO:3中的1-366位。RNA聚合酶蛋白和Mtf1可以相互作用,形成聚合酶-转录因子复合体。Mtf1可用于转录RNA,涉及调控细胞周期,还可用作肿瘤药物筛选的药靶。本发明为基因转录、尤其是细胞核内的基因转录提供了一套精确有效的转录工具,为基因功能的研究提供了一种新途径。同时,Mtf1涉及调控细胞周期,Mtf1的基因敲除菌株无法形成克隆,Mtf1可作为抗肿瘤药物筛选的靶标。

    权利要求书

    1.一种线粒体RNA聚合酶附属转录因子,其特征在于,它的氨基酸序列包括序列表SEQ ID NO:3中的1-366位。 2.如权利要求1所述的线粒体RNA聚合酶附属转录因子,其特征在于,它的多核苷酸编码序列如SEQ ID NO:4所示。 3.权利要求1所述线粒体RNA聚合酶附属转录因子的制备方法,其特征在于,培养表达所述线粒体RNA聚合酶附属转录因子的宿主细胞,然后从培养物中分离出所述的线粒体RNA聚合酶附属转录因子。 4.一种转录组合物,其特征在于,该转录组合物包括RNA聚合酶蛋白和权利要求1所述的线粒体RNA聚合酶附属转录因子。 5.如权利要求4所述的转录组合物,其特征在于,所述RNA聚合酶蛋白的氨基酸序列包括序列表SEQ ID NO:1中的1-1120位。 6.权利要求4所述的转录组合物在转录RNA中的用途。 7.权利要求4所述的转录组合物在调控细胞周期中的用途。 8.权利要求4所述的转录组合物在筛选抗肿瘤药物的药靶中的用途。 9.如权利要求6所述的用途,其特征在于,所述转录组合物中识别的启动子区域包括序列表SEQ ID NO:5中的1361-1376位。

    说明书

    

    技术领域

    本发明属于生物技术领域,涉及一种新型聚合酶-转录因子复合体。更具体地,本发明涉及一种线粒体RNA聚合酶Rpo41-转录因子Mtf1复合体的基因克隆,蛋白制备,功能研究及其在生物技术领域的应用。

    背景技术

    细胞中的DNA转录成RNA是生命最重要的一个过程。其中,依赖于DNA的RNA聚合酶以及附属转录因子组成的转录复合体是完成上述过程的核心装置[参考文献1,2,3,4]。因此,对于转录复合体的研究一直是科学界的热点。目前普遍认为,在真核生物中编码三类负责转录细胞核基因的RNA聚合酶(I,II和III)[参考文献5]。其中,最为重要的众多mRNA的转录是由RNA聚合酶II为核心的转录复合体来完成。另外,在真核生物中还编码一类线粒体RNA聚合酶,这类蛋白本身是由核基因组编码,在细胞质中合成,并最终转运到线粒体中发挥功能。在线粒体中,它主要负责转录线粒体基因组编码的rRNA,tRNA以及一些呼吸链相关的基因。因此,以线粒体RNA聚合酶及其附属转录因子组成的转录复合体是真核生物能够进行正常的能量代谢的关键。

    酵母是进行分子遗传学研究的良好模型。其较小的基因组(5000个基因左右),易于培养,方便观察的特点使其被广泛用来研究RNA转录的分子机制。现有的研究表明,在芽殖酵母中,线粒体基因的转录是线粒体RNA聚合酶Rpo41和线粒体转录因子Mtf1组成的转录复合体完成的[参考文献6,7]。其中,敲除Mtf1的芽殖酵母表现出更为细小的细胞形态,线粒体DNA的缺失,以及无法在非发酵碳源培养基上生长。从结构上推测,芽殖酵母中的Mtf1更类似于细菌中的Sigma因子,它可以结合线粒体聚合酶Rpo41形成功能完全的“全酶”,再特异性的结合线粒体基因上游启动子的核心元件,确保正确的转录开始。

    迄今为止,几乎所有的对芽殖酵母Rpo41和Mtf1蛋白的报道都只限于其在线粒体中的功能。为何RNA聚合酶II负责转录数千个基因,而线粒体RNA聚合酶只负责转录数十个基因,这样一种资源配置方式在细胞内是否经济?带着这一疑问,本发明启动了相关研究计划,本申请人以另一种在进化上更接近人类细胞的酵母-裂殖酵母作为研究模型,在裂殖酵母中,本发明首先通过生物信息学方法,找到与芽殖酵母中Rpo41和Mtf1同源的两个蛋白,系统编号分别为SPAC26H5.12和SPAC1002.08c,在Sanger Genedb数据库中这两个基因均被标注为‘尚未具有研究性报道公开’。本发明首次克隆到裂殖酵母中Rpo41和Mtf1两个基因,进行了相应的转基因和基因敲除研究,同时还在大肠杆菌中表达纯化出这两个蛋白,验证了它们作为转录因子的活性。非常有意思的是,研究表明,Rpo41和Mtf1组成的转录复合体不仅可以有效的转录线粒体中的基因,而且还能够高效的转录细胞核中编码的基因。本发明不仅解决了‘线粒体RNA聚合酶在细胞核中是否同样具有功能’这一重要理论问题,而且这一新型转录机制也能够被发展为一种有效的生物技术工具,应用于科学研究和重组生物工程产品的生产,与此同时,这一转录复合体还可以被用做抗肿瘤和其他疾病药物筛选的靶点。

    本发明的参考文献如下:

    1.Goodrich,J.A.,Cutler,G.,and Tjian,R.(1996).Contacts incontext:promoter specificity and macromolecular interactions intranscription.Cell 84,825-830.

    2.Tansey,W.P.,and Herr,W.(1997).TAFs:guilt by association?Cell 88,729-732.

    3.Roeder,R.G.(2005).Transcriptional regulation and the role ofdiverse coactivators in animal cells.FEBS Lett 579,909-15.

    4.Sekinger,E.A.,Moqtaderi,Z.,and Struhl,K.(2005).Intrinsichistone-DNA interactions and low nucleosome density are important forpreferential accessibility of promoter regions in yeast.Mol.Cell 18,735-748.

    5.Roeder,R.G.,and Rutter,W.J.(1969).Multiple forms ofDNA-dependent RNA polymerase in eukaryotic organisms.Nature 224,234-237.

    6.Bonawitz,N.D.,Clayton,D.A.,and Shadel,G.S.(2006).Initiation and beyond:multiple functions of the human mitochondrialtranscription machinery.Mol Cell 24,813-25.

    7.Asin-Cayuela,J.,and Gustafsson,C.M.(2007).Mitochondrialtranscription and its regulation in mammalian cells.Trends Biochem Sci32,111-7.

    发明内容

    本发明的目的是提供一种新型RNA聚合酶和其附属转录因子基因及其编码的蛋白。

    本发明的另一目的是提供上述基因及其编码蛋白的用途。

    本发明提供了一种线粒体RNA聚合酶附属转录因子(Mtf1),它的氨基酸序列包括序列表SEQ ID NO:3中的1-366位。

    在本发明的一个实施例中,所述的线粒体RNA聚合酶附属转录因子的氨基酸序列如SEQ ID NO:3中的1-366位所示。系统名为SPAC1002.08c,在本发明中被简称为Mtf1。

    在本发明中,线粒体RNA聚合酶附属转录因子还包括具有相同转录因子功能的、SEQ ID NO:3中的1-366位序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。

    编码线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸序列选自序列表SEQ ID NO:4中的1-1101位。在本发明中,线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸编码序列也包括简并序列。简并序列是指,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO:4中的1-1101位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.3所述的序列。

    本发明还提供了一种转录组合物,该转录组合物包括RNA聚合酶蛋白和上述线粒体RNA聚合酶附属转录因子。RNA聚合酶蛋白和上述线粒体RNA聚合酶附属转录因子可以结合,形成聚合酶-转录因子复合体。

    RNA聚合酶蛋白可以是通常使用的RNA聚合酶II或者本发明的实施例中使用Rpo41。

    在本发明的一个实施例中,所述RNA聚合酶蛋白Rpo41的氨基酸序列包括序列表SEQ ID NO:1中的1-1120位。其系统名SPAC26H5.12,在本发明中被简称为Rpo41。

    在本发明中,RNA聚合酶蛋白Rpo41还包括具有相同RNA聚合酶功能的、SEQID NO:1中的1-1120位序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。

    编码本发明的新型RNA聚合酶的多核苷酸序列选自序列表SEQ ID NO:2中的1-3363位。

    编码线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸序列选自序列表SEQ ID NO:2中的1-3363位。在本发明中,线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸编码序列也包括简并序列。简并序列是指,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO:2中的1-3363位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO:1所述的序列。

    本发明提供了所述转录组合物转录RNA的用途。也可以将该转录组合物用于调控细胞周期。或者,将该转录组合物用作肿瘤药物筛选药靶。

    Mtf1的基因敲除菌株无法形成克隆,在平板上只能分裂几次。使用荧光白Calcofluor染色的结果显示缺失Mtf1的细胞有较高比例的细胞横隔,其中一些细胞含有多个细胞横隔。此结果暗示Mtf1可能有调控细胞周期和细胞形态方面的功能。过量表达Mtf1出现细胞长度增加的表形。考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型。因此,本发明认为可以将Mtf1作为抗肿瘤药物筛选的靶标。本发明认为,能够使Mtf1基因敲除菌株、Mtf1过量表达菌株恢复或部分恢复正常表形的化合物均能够被认为是潜在的抗肿瘤药物分子。

    本发明提供了所述转录组合物的用途,即将转录组合物用于转录蛋白。其中,所述转录组合物识别的启动子区域包括序列表SEQ ID NO:5中的1350-1477位。也可以是SEQ ID NO:5中的1350-1477位中的部分。

    本发明提供了数种载体,包括:

    (a)含有线粒体RNA聚合酶附属转录因子的多核苷酸编码序列的载体。

    (b)含有编码本发明的RNA聚合酶的多核苷酸的载体。

    (c)同时含有编码本发明的新型RNA聚合酶和其附属转录因子的多核苷酸的载体。

    本发明还提供了一种遗传工程化的宿主细胞,它是选自下组的宿主细胞:

    (a)用本发明上述的载体转化或转导的宿主细胞。

    (b)用编码Rpo41和/或Mtf1的多核苷酸转化或转导的宿主细胞。

    本发明还提供了Rpo41和/或Mtf1过量表达菌株,可以通过下面的方法制备,该方法包含:

    (a)向宿主感受态细胞中转化相应的过量表达载体。

    (b)利用过量表达载体上的抗生素筛选标签筛选阳性菌株。

    本发明还提供了Rpo41和/或Mtf1基因敲除菌株,可以通过下面的方法制备,该方法包含:

    (a)向宿主感受态细胞中转化相应的同源重组PCR片段。

    (b)利用过量表达载体上的抗生素筛选标签筛选阳性菌株。

    本发明提供了所述线粒体RNA聚合酶附属转录因子的制备方法,可以是按照常规方法,培养表达所述线粒体RNA聚合酶附属转录因子的宿主细胞,然后从培养物中分离出所述线粒体RNA聚合酶附属转录因子。

    本发明提供了所述线粒体RNA聚合酶附属转录因子也可以按照其序列,直接人工合成。

    本发明中的RNA聚合酶也可以通过上述两种方法制备。

    实验表明,Mtf1具备转录因子的活性。而且其转录因子活性不依赖于RNA聚合酶II,即在缺乏通常使用的RNA聚合酶II的情况下,Mtf1也能够发挥转录因子的作用。Mtf1和Rpo41组成蛋白复合体,能转录成功核基因。较好的,这些基因具备F4片段,更好的,具备F4-4片段。与商业化的T7聚合酶相比,因为Mtf1和Rpo41来自真核生物,因此能够更为精确,高效的转录真核来源的RNA,特别是某些含有复杂二级结构的RNA片段,因为转录因子Mtf1能够“融解”启动子片段的碱基对,因此,在优化的转录缓冲液和反应条件下,Mtf1和Rpo41组成的转录体系能够被开发成一种商业化的转录系统,此系统能够特异性地转录包含19bp(SEQ ID NO:51361-1379)核心序列的RNA片段。

    另一方面,过量表达Mtf1会干扰细胞周期进程。Mtf1的基因敲除菌株敲除菌株无法形成克隆,在平板上只能分裂几次。过量表达Mtf1出现细胞长度增加的表形。裂殖酵母长期被用作筛选抗肿瘤药物的模型,Mtf1则可以作为抗肿瘤药物筛选的靶标。能够使Mtf1基因敲除菌株、Mtf1过量表达菌株恢复或部分恢复正常表形的化合物,均能够被认为是潜在的抗肿瘤药物分子。本发明还提供了高通量寻找本发明新型RNA聚合酶附属转录因子在裂殖酵母体内靶点的方法。

    本发明提供了数种分离的多核苷酸,这些多核苷酸序列编码本发明的新型RNA聚合酶和其附属转录因子蛋白的结合的启动子区域。其中,所述的多核苷酸序列分别选自序列表SEQ ID NO:5,其中,片段F1为10-337位,片段F2为316-734位,片段F3为715-1177位,片段F4为960-1534位,片段F5为1510-1964位,片段F4-1为1167-1239位,片段F4-2为1211-1314位,片段F4-3为1303-1380位,片段F4-4为1350-1477位,片段F4-5为1457-1546位。

    本发明中另一些分离的多核苷酸,编码本发明的RNA聚合酶和其附属转录因子组成的转录复合体起始转录的启动子区域。其中,所述的多核苷酸序列分别选自序列表SEQ ID NO:5,其中,片段F4-2为1211-1314位,片段F4-4为1350-1477位,片段F4-5为1457-1546位,片段F4-479BP为1350-1428位,片段F4-489BP为1350-1438位,片段F4-499BP为1350-1448位。

    本发明所用实验方法,如未特别指出,则可以使用本领域的常规操作。以下列举本发明部分实验方法。

    构建mtf1+缺失菌株:mtf1+缺失菌株是由在二倍体细胞中转化PCR片段实现的,PCR反应是用长引物进行的,引物含有80个碱基序列同源于Mtf1的C-末端,20个碱基序列同源于质粒pFA6a-kanMX6。引物序列如下:CTCCAAACCACAAGATAAACAATTGTCTATTCCAGTGTTTGAAAGCATTGTTAGGATACTGTTGACATGTAAAGCAACATCCGCTGCAGGTCGACGGATCCCC(SEQ ID NO:6)和ATCGATGTTAATCCCACATTGGGTGAAGGAGGGTAATAGAGTTTCCGCACCTGGGCCTAAATAATAAATGGATTTTGAAAGTGGCCGCATAGGCCACTAGTGGATCT(SEQ ID NO:7)。

    转化后选择能在G418板上生长的克隆。二倍体菌株生成孢子,收集孢子后在平板上发芽。mtf1+缺失菌株的确认是用定量PCR检测Mtf1基因的表达水平和用PCR检测基因组DNA。

    在染色体的mtf1上加TAP的标记:在染色体的mtf1上加TAP的标记是通过用PCR产物转化单倍体细胞实现的,PCR的引物包含80bp序列于Mtf1C-末端基因序列同源和20bp的序列于质粒pFA6a2PA同源。引物序列为:ACTTTCTTACCATTTCAAAAATTATACAAAAATATCCTTTCAAACATCATTTACATTTGGGTACAATAATTGAAGATTCATACGCTGCAGGTCGACGGATCCCC(SEQ ID NO:8)和CAAAATTACTGGATGCAAAGAAATGCGTGTATGAACAAAAACAATCAATACGTTTGTTTCCCCCAATTTTCTGTAAATTTGGCCGCATAGGCCACTAGTGGATCT(SEQ ID NO:9)。

    染色体标记的证实是通过菌落PCR和用rabbit anti mouse IgG peroxidase抗体做Western blot来实现的。

    细胞核,线粒体和细胞质的提取与Western blot:Mtf1TAP标记的菌株用来提取细胞核线粒体和细胞质,细胞核的提取方法是Shimizu et a1.1991)所描述的,线粒体和细胞质提取和纯化是Chiron et al.2007所描述的。纯化的细胞核,线粒体和细胞质的样本在10%的SDS PAGE凝胶进行电泳,然后转到硝酸纤维素膜上。用rabbit anti mouse IgG peroxidase抗体在1∶8000稀释后孵育1小时,洗涤后进行化学发光反应,用X光胶片检测荧光信号。

    ChIP-chip芯片分析:所使用的芯片间包含了所有裂殖酵母的非编码区,非编码区大于2kb的用了一个以上的PCR产物的探针,探针的平均长度为1kb。总共有5200个从100bp到2kb大小不等的探针。该芯片不包括线粒体染色体基因。在室温下Mtf1TAP标记的细胞在1%甲醛固定15分钟,然后在125mM glycine中5分钟。经过TBS洗两次然后悬浮在0.4毫升的裂解液(50mM HEPES-KOH[pH 7.4],140mM NaCl,1mM EDTA,1%Triton X-100,0.1%sodium deoxy-cholate,1mM phenylmethylsulfonyl fluoride,10μg/ml aprotinin,1ug/ml leupeptin,1μg/mlpepstatin)中,细胞用玻璃珠打浆机破碎1分钟,破碎的细胞超声4次以打断染色体DN。离心12,000g 10分钟获得上清,然后和IgG Sepharose 6 fast flow bead进行结合。2μg的DNA用Cye-3或Cye-5进行标记(Klenow)后和芯片杂交。数据采集,处理和正常化是(Heichinger et al.2006)中所描述的。

    质粒构建:PCR扩增Mtf1编码序列插入到pREP3在SmalI构建了pREP3-mtf1T。

    Mtf1基因扩增的PCR片断用XhoI和EcoRI克隆到pGEX-4T-1中构建了pGEX-4T-mtf1T,包含了Mtf1C末端GST的标记。Rpo41基因扩增的PCR片断用用XhoI和EcoRI克隆到到载体pET28a,进而产生了一个N端His标记的Rpo41。克隆是用DNA测序证实的。

    Mtf1和Rpo41的表达和纯化:含pGEX-4T-mtf1E.coli BL21细胞在PBS缓冲液(pH8.0)中裂解后用Glutathione Sepharose 4B来纯化。His标签的Rpo41细胞在缓冲液(20mM Imidazole,20mM Phosphate,0.5M NaCl,pH 7.4,1mMphenylmethylsulfonyl fluoride)中裂解后用Ni2+-NTA-agarose纯化,用20mMimidazole洗柱,用500mM imidazole,20mM Phosphate,0.5M NaCl,pH 7.4Ni2洗脱,在20mM Phosphate,0.1M NaCl,0.2mM ETDA and 1mM DTT中透析过夜。

    荧光实时PCR分析:在液体培养基中细胞生长OD600=0.5,使用试剂TRIzol Reagent(Invitrogen)提取总RNA。反转录RNA用TaKaRa PrimeSciptTMlstStrand cDNA Synthesis试剂盒,仪器型号是iQ5 Continuous FluorescenceDetector System(Bio-Rad)。PCR反应包括:250Nm的正向和反向引物,1μl的cDNA(5ng),10μl 2X SYBR-green Realtime PCR Master Mix(SYBR PremixEx TaqTM,TaKaRa),总体积为20μl。所有结果是从至少有两个独立的生物重复和四个技术重复中得到。受α-amanitin处理的细胞,0.1μg/ml和1μg/mlα-amanitin加到OD600=0.5的细胞6小时之后收集细胞。

    细胞染色和用共聚焦显微镜观察:对DAPI和calcofluor染色,细胞生长至OD600=0.5,在70%乙醇中固定,用DAPI染细胞核,或细胞用50μg/ml的calcofluor在50%glycerol and 0.3mg/ml p-phenylenediamine缓冲液中染色,在Leica TCS-SP5显微镜下观察。

    凝胶电泳迁移法(EMSA):5’端生物素标记的PCR引物用来合成生物素标记的探针,在反应中,200ng纯化的GST标签的Mtfl,50fMol的探针和5ng/μL ofpolydI/dC在结合缓冲液(10mM Tris HCl pH 7.5,50mM KCl,0.1mM EDTA,1mMDTT)在冰上孵育30分钟,然后样品在4℃TBE缓冲液中在6%polyacrylamidenative胶上进行电泳,DNA/蛋白复合物被转移到Hybond-N+膜上,并用LightShiftChemiluminescent EMSA kit(Thermo Scientific)EMSA试剂盒进行检测。

    体外转录:体外转录所用的DNA模板是PCR产生的,His标记的Rpo41和GST标记的Mtf1蛋白是在大肠杆菌中表达和纯化的。转录反应包括500ng的DNA模板,10pmol的Rpo41和10pmol的Mtf1,在反应缓冲液是50mM Tris(pH 7.9),20mMMgCl2,1mM dithiothreitol,50μMUTP,[α-32P]UTP(1000cpm/pmol UTP),250μM ATP,GTP和CTP,总反应体积极是20μl。反应在30℃孵育60分钟,加入25μl的在冰上的终止缓冲液(90%formamide,50mM EDTA,bromophenol blue,and xylene cyanol)。样本在70℃变性5分钟然后在6%polyacrylamide胶上进行电泳。干胶后X光片在放入增强屏幕中再放置-70℃,胶片冲洗后观察放射性的条带。

    本发明提供了一种线粒体RNA聚合酶附属转录因子,它的氨基酸序列包括序列表SEQ ID NO:3中的1-366位。RNA聚合酶蛋白和上述线粒体RNA聚合酶附属转录因子可以相互作用,形成聚合酶-转录因子复合体。实验证明,上述线粒体RNA聚合酶附属转录因子可用于转录蛋白,涉及调控细胞周期,还可用作肿瘤药物筛选的药靶。本发明为基因转录、尤其是细胞核内的基因转录提供了一套精确有效的转录工具,为基因功能的研究提供了一种新途径。同时,本发明的线粒体RNA聚合酶附属转录因子涉及调控细胞周期,Mtf1的基因敲除菌株无法形成克隆,考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型,可以将Mtf1作为抗肿瘤药物筛选的靶标。

    附图说明

    图1是裂殖酵母与芽殖酵母的Mtf1氨基酸序列对比图。

    图2是裂殖酵母Mtf1结构域图。

    图3是缺失Mtf1细胞和野生型细胞的形态对比图。

    图4是Mtf1在细胞中的亚定位图。

    图5是过量Mtf1干扰细胞周期进程图。

    图6是维生素B1抑制Mtf1mRNA表达图。

    图7是过表达Mtf1影响有丝分裂进程图。

    图8是Mtf1的转录因子活性不依赖于RNA聚合酶II的细胞结果图。

    图9表明增加α-amanitine的浓度Srk1mRNA表达水平不受影响。

    图10是Mtf1结合Srk1基因的上游序列图。其中,图A是5个可覆盖上游区域的DNA片段;B显示片段4(F4)和Mtf1结合在胶上产生了迁移速度慢的条带;C显示片段F4-4、F4-2和Mtf1结合在胶上产生了迁移速度慢的条带。

    图11是F4-4、F4-2、F4-5转录RNA电泳图。

    图12是F4-4转录不同长度片段RNA的电泳图。

    具体实施方式

    本发明经过深入而广泛的研究,在裂殖酵母中分离得到了一种新型线粒体RNA聚合酶Rpo41和附属转录因子Mtf1。在成功克隆出这两个基因后,利用转基因和基因敲除技术验证其用途。结果表明,Rpo41和Mtf1形成的复合体不但可以负责线粒体基因组的转录,同时,还可以转录核基因Srk1,进而影响酵母正常的细胞周期进程。

    实施例1:裂殖酵母新型线粒体RNA聚合酶Rpo41和附属转录因子Mtf1的克隆

    根据芽殖酵母中同源蛋白氨基酸序列,在英国桑格研究中心网站Genedb上进行Blast比对,结果显示,裂殖酵母中分别存在一个高度保守的同源线粒体RNA聚合酶,系统名SPAC26H5.12,以及一个高度保守的线粒体转录因子,系统名SPAC1002.08c。裂殖酵母与芽殖酵母中Mtf1同源蛋白之间氨基酸序列的对比结果参见图1,通过比对,申请人发现裂殖酵母Mtf1具有一个保守的N端结构域和一个保守的C端结构域,参见图2。

    在本发明下述实施例中,如无特别说明,SPAC26H5.12被简称为Rpo41,SPAC1002.08c被简称为Mtf1。

    实施例2:裂殖酵母Mtf1在细胞中的亚定位

    为了研究裂殖酵母Mtf1在细胞中的功能,本发明使用超速离心的方法,分别提取了裂殖酵母线粒体,细胞核和细胞质成分,使用Western-blot方法检测Mtf1在细胞中的亚定位,如图4所示,Mtf1在细胞核和线粒体中都有定位,这一结果暗示了Mtf1不仅在裂殖酵母线粒体中发挥功能,同时很可能也在细胞核中具有转录基因的功能。

    实施例3:裂殖酵母Mtf1敲除突变体有细胞周期调控和细胞形态上的缺陷

    为了探讨其细胞功能,本发明对裂殖酵母的Mtf1进行基因敲除,敲除是在二倍体细胞中进行的,后经交配产生的孢子在发芽后在显微镜下观察表型。缺失Mtf1的细胞表现出类似的形态,即:敲除菌株无法形成克隆,在平板上只能分裂几次。图3表明,缺失Mtf1的细胞和野生型细胞相比在形态上更长更大,并且变成鸡蛋或瓶子的形状。DAPI染色表明缺失Mtf1的细胞没有明显细胞核的缺陷。使用荧光白Calcofluor(卡尔科弗卢尔荧光染色剂)染色的结果显示缺失Mtf1的细胞有较高比例的细胞横隔,其中一些细胞含有多个细胞横隔。此结果暗示Mtf1可能有调控细胞周期和细胞形态方面的功能,体内Mtf1功能的缺失会造成酵母分裂的不正常。

    实施例4:Mtf1过量表达对裂殖酵母细胞周期的影响。

    首先将Mtf1的编码序列克隆到裂殖酵母过量表达载体pREP3中,载体上过量表达Mtf1的强启动子Pnmt1能够受维生素B1抑制性的调控。对在不加维生素B1和加了60μM维生素B1的条件下的细胞进行定量PCR的检测Mtf1表达量。在没有维生素B1的条件下过量表达Mtf1的细胞比仅转入空载体的细胞中Mtf1表达水平超过600倍以上。虽然60μM维生素B1可以抑制Mtf1mRNA表达水平到最低水平,但抑制并不完全(图6),此结果暗示了Mtf1过量表达菌株的构建成功。申请人利用激光共聚焦显微镜观察到在没有维生素B1的条件下过量表达Mtf1的细胞和仅转入空载体的细胞相比是明显变长的,而在加了60μM维生素B1的条件下过量表达Mtf1的细胞没有变长,此结果表明过量表达Mtf1会干扰细胞周期进程(图5)。

    实施例5:Chip-chip的方法确定Srk1可能是Mtf1的靶基因

    为了在裂殖酵母全基因组中找到Mtf1的靶基因,使用同源重组基因打靶技术,将酵母基因组上的Mtf1基因编码区末端加了TAP标签,利用染色体免疫共沉淀偶联芯片杂交的方法,筛选Mtf1在体内的直接结合的DNA片段,分析表明总共有70个非编码区的DNA片段可能和Mtf1结合,其中一个信号很强且重复出现多次的DNA片段是Srk1(Sty1调节激酶1)的上游区域。

    实施例6:过量表达Mtf1影响到有丝分裂的进程是通过调节Srk1基因的转录实现的

    利用荧光定量PCR的实验方法检测了过量表达Mtf1细胞中Srk1mRNA的水平发现Srk1mRNA表达量在过量表达Mtf1细胞中比在只有转化了载体的细胞中增加了18倍(图7)。在过量表达Rpo41的菌株中Srk1mRNA的水平也过量表达3倍,此结果说明Srk1就是Rpo41和Mtf1形成的复合体在体内调控的靶基因。而已有的研究表明,Srk1过量表达菌株表现出细胞长度增加的表形,与实验中观察到Mtf1过量表达菌株的表型类似,此证据进一步指明了Mtf1在体内主要是通过调控Srk1基因的表达从而影响细胞周期和细胞分裂过程。

    实施例7:Mtf1的转录因子的活性不依赖于RNA聚合酶II

    在经典生物学理论中,真核细胞中RNA聚合酶II和相应转录因子负责合成细胞中mRNA。而芽殖酵母中的研究显示,Rpo41是线粒体中RNA聚合酶,它与转录因子Mtf1共同参与线粒体基因的转录。

    在前述实施例中,已经证明作为线粒体转录因子的Mtf1同样可以控制核基因Srk1基因的表达,进而调控细胞周期。因此,下一步的疑问是:RNA聚合酶II还是Rpo41和Mtf1一起转录Srk1mRNA。用不同浓度的RNA聚合酶II特异性抑制剂α-amanitine(它不影响线粒体的RNA聚合酶)来处理野生型972细胞,对比没有用α-amanitine处理过的细胞并检测Srk1的表达水平的变化。选择线粒体基因cox1和15S rRNA共同作为参照,cox1和15S rRNA是由Rpo41转录的因此其表达量在加了α-amanitine应该是不会改变的。首先,检测了3个受RNA聚合酶II转录的基因(actin,tublin,SPAC23H4.13c)在不同浓度的α-amanitine的条件下,这3个基因的表达量和没处理的细胞相比都有所降低(图8)。然后,比较了在加和不加α-amanitine时Srk1和tub1mRNA表达水平,Srk1mRNA和tub1用cox1和15S rRNA正常化后的信号相对表达量是100%。图9表明增加α-amanitine的浓度Srk1mRNA表达水平不受影响。与此相反,tub1mRNA表达水平是减少的。在不同浓度的α-amanitine tub1mRNA的表达水平是低于Srk1的。这些结果表明Srk1mRNA转录是不依赖于RNA聚合酶II。因此,本发明推测很有可能是线粒体聚合酶Rpo41和转录因子在某种情况下也能够在细胞核中转录Srk1的mRNA。

    实施例8:体外制备重组Mtf1和Rpo41蛋白

    本发明将裂殖酵母中Mtf1和Rpo41的编码区分别克隆进原核表达载体pGEX-4T-1和pET28A中,测序验证序列无误后,将pGEX-4T-mtf1和pET28A-rpo41分别转入E.coli BL21细胞,使用IPTG诱导表达重组蛋白。如实验方法中所述,分别使用Glutathione Sepharose 4B和Ni2+-NTA-agarose纯化出Mtf1和Rpo41重组蛋白,使用SDS-PAGE验证表达产物的分子量,使用Bradford方法测定蛋白浓度。

    实施例9:Mtf1能够结合Srk1基因的上游序列

    为了更为深入研究Mtf1的生物化学性质,利用凝胶电泳迁移率(EMSA)分析的方法检测了Mtf1和Srk1基因的上游序列的结合能力。生物信息学分析显示,Srk1基因编码区的上游有2000个左右的碱基对,并且十分的富含A+T(62%)。用5’生物素标记的PCR引物进行PCR扩增产生了5个可覆盖上游区域的DNA片段(图10A),生物素标记的DNA片段和从细菌中纯化的Mtf1用于EMSA的检测。在5个DNA片段中,片段4(F4)和Mtf1结合在胶上产生了迁移速度慢的条带(图10B)。F4进一步被分为5个DNA片段用来作EMSA,图10C表明,F4-2和F4-4和Mtf1结合在胶上产生了迁移速度慢的条带。此结果显示F4-2和F4-4片段中可能包括Mtf1和Rpo41起始转录的位点。

    实施例10:Mtf1和Rpo41组成的复合体能转录核基因

    上述实施例中纯化的Rpo41和Mtf1蛋白,以及鉴定出的Srk1上游启动子片段F4-2和F4-4被用于体外转录反应,以确定Mtf1和Rpo41是否能够在体外组成一个转录核基因的系统。体外转录反应中加有α-P32UTP,P32标记的RNA首先在6%的PAGE凝胶上电泳,然后利用放射自显影技术确定是否有转录出的RNA片段。如图11所示,虽然F4-2和F4-4两个DNA片段在EMSA实验中都能够结合Mtf1蛋白,但只有F4-4为模板能够明显转录出RNA片段,而另一个副对照F4-5也不能转录出RNA片段。根据已经发表的裂殖酵母中的启动子的保守序列,预测在F4-4片段的5’端存在一个类似的9bp的潜在的启动子保守序列。因此,以F4-4片段的5’端为起点,分别设计了三条分别长为79bp,89bp和99bp的DNA模板,图12显示这三条模板都能转录出RNA片段,此结果证明了Rpo41和Mtf1确实能够转录包含预测启动子区域的核基因。而且,图12显示79bp,89bp和99bp三条模板转录出的RNA大小依次增加,此结果也显示了实验中的转录方向与预测的一致,证明了在体外系统中,Mtf1和Rpo41组成的复合体确实能够转录核基因Srk1。

    实施例11:Mtf1和Rpo41作为转录工具酶的应用

    人工转录RNA在生物技术领域具有广泛的应用,目前,主要使用的是来自噬菌体的T7RNA聚合酶,它可以识别并结合一个21或22个bp的特定的启动子片段,并高效地转录下游RNA片段。基于对Mtf1和Rpo41功能的研究,发现重组的Mtf1和Rpo41蛋白在体外能够高效地转录包含XX核心序列的片段,与商业化的T7聚合酶相比,因为Mtf1和Rpo41来自真核生物,因此能够更为精确,高效的转录真核来源的RNA,特别是某些含有复杂二级结构的RNA片段,因为转录因子Mtf1能够“融解”启动子片段的碱基对,因此,在优化的转录缓冲液和反应条件下,Mtf1和Rpo41组成的转录体系能够被开发成一种商业化的转录系统,此系统能够特异性地转录包含19bp(SEQ ID NO:51361-1379)核心序列的RNA片段。

    实施例12:Mtf1作为药物筛选靶标的应用

    如前实施例所示,Mtf1的基因敲除菌株无法形成克隆,在平板上只能分裂几次。使用荧光白Calcofluor染色的结果显示缺失Mtf1的细胞有较高比例的细胞横隔,其中一些细胞含有多个细胞横隔。此结果暗示Mtf1可能有调控细胞周期和细胞形态方面的功能。过量表达Mtf1出现细胞长度增加的表形。考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型。因此,本发明认为可以将Mtf1作为抗肿瘤药物筛选的靶标。本发明认为,能够使Mtf1基因敲除菌株、Mtf1过量表达菌株恢复或部分恢复正常表形的化合物均能够被认为是潜在的抗肿瘤药物分子。

                            序列表

    <210>1

    <211>1120

    <212>PRT

    <213>裂殖酵母

    <400>1

    Met Pro Ile Glu Ala Tyr Glu Pro Tyr Lys Asn Glu Leu Lys Ser Lys

    1               5                   10                  15

    Ile Gly Lys Asp Phe Ile Ile Asp Leu Ser Tyr Lys Ser Gly Thr Ala

                20                  25                  30

    Ser Leu Phe Glu Ala Cys Val Tyr Asn Gly Asp Phe Leu Arg Ser Lys

            35                  40                  45

    Gln Leu Leu Lys Ser Phe Ile Asp His Asn Lys Gly Asp Lys Ile Leu

        50                  55                  60

    Leu Pro Met Ile Asn Leu Tyr Ile Arg Glu Ile Ile Gln Arg Gly Ser

    65                  70                  75                  80

    Phe Glu Leu Thr Asp Val Leu Ser Asn Ala Lys Glu Leu Leu Gln Gln

                    85                  90                  95

    Ala Arg Leu Asn Gly Asp Ser Leu Thr Tyr Ala Leu Leu Cys Gln Ala

                100                 105                 110

    Ser Leu Asn Pro Thr Gln Arg Gln Leu Gly Leu Pro Val Leu His Glu

            115                 120                 125

    Leu Ile His Asn Trp Arg Ser Ala Asn Gly Lys Val Ile Asp Ile Leu

        130                 135                 140

    Met His Glu Ser Val Phe Ser Pro Glu Glu Val Lys Leu Ile Met Asp

    145                 150                 155                160

    Gln Leu Asn Ile Pro Ile Asn Asn Phe Thr Pro Ser Gln Leu Gln Leu

                    165                 170                 175

    Leu Gly Ile Thr Asn Ser Thr Ile Val Gly Glu Ser Glu Asn Gly Lys

                180                 185                 190

    Asp Gln Asn Gly Asp Ser Ser Leu Lys Glu Lys Gln Pro Asp Val Glu

            195                 200                 205

    Thr Thr Val Thr Lys Ser Ala Asn Leu Asn Ala Leu Arg Ser Ser Leu

         210                215                 220

    Ser Ser Leu Leu Thr Glu Ser Ile Asp Leu Pro Ile Asp Glu Val Ser

    225                 230                 235                240

    Leu Glu Phe Gly Asn Gln Gly Asp Thr Phe Asn Leu Ala Arg Gln Lys

                    245                 250                 255

    Leu Leu Glu Lys Ser Ala Ile Leu Ser Ala Ala Glu Val Trp Lys Ser

                260                 265                 270

    Glu His Glu Ser Val Leu Asn Arg Gly Asn Leu Gln Val Pro Lys Asn

            275                 280                 285

    Val Ser Ser Leu Phe Tyr Ser Trp Tyr Val Gln Leu Glu Gln Leu Phe

        290                 295                 300

    Lys Glu Glu Ile Ser Leu Ile Asp Asp Leu Ala Leu Asn Glu Ser Leu

    305                 310                 315                 320

    Asp Lys Lys Asn Asp Arg Leu Ile Tyr Gly Pro Phe Leu Lys Leu Leu

                    325                 330                 335

    Ser Ser Lys Lys Leu Ala Ala Leu Thr Ile Met Glu Val Ala Gln Leu

                340                 345                 350

    Ser Thr Asn Pro Arg Tyr Asp Arg Gly Ala Arg Val Thr Thr Leu Leu

            355                 360                 365

    Gly Gly Leu Gly Arg Ser Phe Glu Arg Glu Phe Leu Ser Glu Gln Ile

        370                 375                 380

    Gln Arg Gln Glu Lys Asn Lys Ser Tyr Lys Asp Lys Lys Arg Leu Lys

    385                 390                 395                 400

    Glu Leu Phe Asn Asp Pro Arg Lys Phe Arg Gln Ala Val Lys Asn Leu

                    405                 410                 415

    Arg Leu Ser Asn Thr Arg Asp Asn Ile Val Leu Asn Pro Ser Val Asp

                420                 425                 430

    Ser Trp Pro Ser Ala Ile Val Met Lys Val Gly Ser Val Ala Leu Cys

            435                 440                 445

    Leu Leu Leu Ser Val Ala Lys Ile Glu Val Thr Ala Lys Asp Leu Ser

        450                 455                 460

    Thr Gly Gly Ile Leu Lys Gln Glu Val Ala Ala Phe Val His Thr Tyr

    465                 470                 475                 480

    Gln Tyr Ser Asn Gly Arg Lys Val Gly Met Ile Val Pro His Val Glu

                    485                 490                 495

    Phe Tyr Lys Leu Leu Ser Arg Asp Ile Glu Lys Pro His Leu His Pro

                500                 505                 510

    Gln Leu Leu Pro Met Leu Val Thr Pro Lys Pro Trp Thr Ser Trp Ile

            515                 520                 525

    Asp Gly Gly Tyr Tyr Tyr Ser Arg Gln Pro Leu Val Arg Leu Lys Gly

        530                 535                 540

    Ala Leu Glu Gln Val Asp Tyr Leu Met Lys Ala Ser Glu Asn Gly Gln

    545                 550                 555                 560

    Leu Asp Glu Leu Phe Lys Ala Val Ser Ser Leu Gly Lys Val Ser Trp

                    565                 570                 575

    Arg Ile Asn Gln Arg Leu Phe Asn Val Leu Ile Arg Ile Trp Asn Ser

                580                 585                 590

    Gly Glu Lys Phe Leu Ser Ile Pro Pro Arg Glu Val Lys Cys Asp Met

            595                 600                 605

    Pro Pro Tyr Pro Lys Asn Ser Ile Asn Pro Arg Asp Lys Val Ile Trp

        610                 615                 620

    His Thr Arg Arg Lys Glu Leu Ala Ala Leu Lys Thr Gly Ala His Ser

    625                 630                 635                 640

    Gln Arg Cys Asp Phe Asn Tyr Lys Leu Glu Ile Ala Arg Ala Phe Leu

                    645                 650                 655

    Asn Glu Lys Phe Tyr Phe Pro His Ser Leu Asp Phe Arg Gly Arg Ala

                660                 665                 670

    Tyr Pro Leu Ser Ser His Leu His His Val Ser Asn Asp Val Cys Arg

            675                 680                 685

    Gly Leu Leu Glu Phe Ser Thr Gly Lys Pro Leu Gly Pro Lys Gly Leu

        690                 695                 700

    Asn Trp Leu Lys Val His Leu Ala Asn Leu Phe Gly Ile Ser Lys Lys

    705                 710                 715                 720

    Asp Phe Ala Thr Arg Gln Ala Phe Val Asp Asp Asn Met Gln Glu Val

                    725                 730                 735

    Phe Asp Ser Ala Asp Arg Pro Leu Asp Gly Asn Lys Trp Trp Ser Lys

                740                 745                 750

    Ala Asp Asp Pro Phe Gln Ala Leu Ala Ala Cys Phe Glu Ile Ala Glu

            755                 760                 765

    Ala Val Arg Ser Gly Asp His Glu Ser Tyr Ile Ser His Ile Pro Ile

        770                 775                 780

    Gln Gln Asp Gly Thr Cys Asn Gly Leu Gln His Tyr Ala Ala Leu Gly

    785                 790                 795                 800

    Gly Asp Ile Glu Gly Ala Lys Gln Val Asn Leu Trp Pro Ser Asp His

                    805                 810                 815

    Pro Ser Asp Val Tyr Glu Ala Val Ala Glu Ile Val Arg Gly Phe Leu

                820                 825                 830

    Lys Lys Asp Ala Glu Ala Gly Asp Glu Met Ala Asn Phe Leu Lys Asp

            835                 840                 845

    Lys Val Thr Arg Ser Val Val Lys Pro Thr Val Met Thr Asn Val Tyr

         850                 855                 860

    Gly Val Thr Tyr Val Gly Ala Arg Lys Gln Ile Ser Glu Lys Leu Glu

    865                 870                 875                 880

    Asn Ile Asp Gly Met Glu Lys Leu Lys Val Ala Asp Tyr Ala Asn Tyr

                    885                 890                 895

    Leu Thr Lys Lys Val Phe Glu Ala Leu Arg Ser Leu Phe Thr Gln Ala

                900                 905                 910

    His Glu Ile Gln Asp Trp Leu Ser Ala Cys Cys Asn Leu Ile Thr His

            915                 920                 925

    Ser Leu Pro Ala Asp Tyr Ile Lys Glu Gly Ile Lys Asp Glu Leu Thr

        930                 935                 940

    Pro Val Val Trp Thr Thr Leu Leu Asn Leu Pro Ile Val Gln Pro Tyr

    945                 950                 955                 960

    Arg Asn Tyr Lys Ser Arg Gln Ile Arg Thr Asn Leu Gln Thr Val Phe

                    965                 970                 975

    Ile Glu Glu Arg Asp Arg Thr Ala Thr Val Gln Pro His Lys Gln Ala

                980                 985                 990

    Thr Ala Phe Pro Pro Asn Phe Ile His Ser Leu Asp Ala Thr His Met

            995                 1000                1005

    Phe Met Thr Cys Leu Lys Cys Ser Glu Gln Asn Ile Asn Phe Ala

        1010                1015                1020

    Ala Val His Asp Ser Tyr Trp Thr His Ala Cys Asp Val Asp Gln

        1025                1030                1035

    Met Asn Ser Leu Leu Arg Glu Ala Phe Val Leu Leu His Ser Asn

        1040                1045                1050

    Asn Ile Met Glu Arg Leu Lys Gln Glu Phe Glu Glu Arg Tyr Lys

        1055                1060                1065

    Gly Phe Leu Val Ser Lys Lys Ala Ile Lys Ala Asn Asp Glu Asp

        1070                1075                1080

    Leu Lys Ala Lys Phe Gly Asn Lys Ser Tyr Ile Pro Leu Glu Phe

        1085                1090                1095

    Pro Pro Leu Pro Ala Arg Gly Ala Leu Asp Leu Lys Lys Val Leu

        1100                1105                1110

    Glu Ser Lys Tyr Phe Phe Ser

        1115                1120

    <210>2

    <211>3363

    <212>DNA

    <213>裂殖酵母

    <400>2

    atgcccattg aagcgtacga gccttataag aatgaactta aaagtaaaat tggaaaggat     60

    ttcataatag acttgagtta caagtctggg actgctagtt tatttgaggc gtgcgtctac    120

    aatggtgatt ttttacggtc taagcagctc cttaaaagtt ttattgatca taacaaaggt    180

    gataaaatac tgttaccaat gattaattta tatatccgtg aaatcattca gcgtggatct    240

    ttcgagttga ctgatgtcct gtcaaatgca aaagaactat tgcaacaggc aagactgaat    300

    ggagattctt taacgtatgc tctactttgc caagcatcac ttaatccgac tcagcgccaa    360

    cttggattac ccgtattaca cgaactaatt cacaattggc gttcagcaaa cggtaaagtt    420

    atagatatct taatgcatga gtcagttttt tcgcccgaag aggtgaaact tattatggat    480

    caacttaaca tacctataaa taattttact ccttctcaat tgcaattgct tggaatcact    540

    aattctacaa ttgttggaga aagtgaaaat ggtaaagatc aaaatggtga ctcttccctg    600

    aaagaaaagc aaccagacgt cgagactact gtaacaaaaa gtgcaaactt aaatgccctt    660

    agaagttcac tctctagtct actgactgaa tccatagatt tgccgatcga tgaagtttct    720

    ttagagtttg gaaatcaagg tgatacattc aacctcgcta gacagaagct tttagaaaaa    780

    agcgcaattc tatcagctgc tgaagtttgg aagtcagaac atgaaagtgt tttaaatcga    840

    ggtaatctgc aagtgccgaa aaatgtttcc tctttgttct atagttggta tgtacaactt    900

    gaacaattgt tcaaagagga aatttccctc atagacgatt tagcattaaa tgaatctttg    960

    gataagaaaa acgaccggtt aatttatggc ccgtttttaa agcttttatc ttccaagaag    1020

    ctggcagcgc taacaataat ggaagtagca caattgtcta caaatcctcg atacgatcgt    1080

    ggtgctcgtg ttacaacgtt actcggtgga ttaggtagaa gttttgagcg tgaatttttg    1140

    tcggaacaaa ttcaaaggca agaaaaaaat aaaagctaca aggataagaa aagattaaaa    1200

    gaattgttca acgatcctcg aaaatttcga caagcggtga agaatttacg tctttcaaat    1260

    acaagggata atattgtttt aaatccaagt gttgatagtt ggccttctgc aatagtcatg    1320

    aaagttggtt cagtcgctct ttgtcttttg ttaagtgttg caaaaattga agtaacagct    1380

    aaggatttaa gcacgggcgg catattgaaa caggaagttg cagcgtttgt ccacacgtac    1440

    caatattcta atggtaggaa agttgggatg attgttccgc atgtggaatt ttacaagctt    1500

    ctttctcgtg atattgagaa gccgcaccta catcctcaat tgcttcctat gctagttacg    1560

    ccaaagcctt ggactagttg gattgatggt ggttattatt atagccgcca accgctcgtc    1620

    cgtttaaaag gtgcactgga gcaggtagat tacttaatga aggcttcaga aaatggacaa    1680

    cttgatgaac tctttaaggc agtaagtagc cttggtaaag tttcatggcg tatcaatcaa    1740

    cgacttttta atgttctaat taggatttgg aactctggag aaaaatttct ttctattcct    1800

    ccgagagagg taaaatgcga tatgccgcct tatccaaaaa attcaataaa tcctcgtgat    1860

    aaggtcattt ggcataccag aagaaaagag cttgctgcct taaaaacagg tgctcactct    1920

    caaagatgtg actttaacta caaacttgag attgcacgag catttttaaa cgaaaaattt    1980

    tattttcctc atagtttaga ttttcgcggt cgtgcatatc ctctaagttc tcatttgcat    2040

    cacgtcagca acgatgtttg tcgtggtttg ctggagtttt cgacgggtaa accgttaggc    2100

    ccaaaaggat taaattggct aaaagtccat cttgctaacc tcttcggaat cagcaagaaa    2160

    gactttgcta cccgccaggc gtttgtcgat gacaatatgc aggaagtttt tgattctgct    2220

    gatcgtcctc tggacggcaa taaatggtgg tcaaaagctg atgatccgtt tcaagctctt    2280

    gctgcctgct ttgagatagc agaggcagta cgctctggtg atcatgaaag ttatatttcc    2340

    catataccca tccagcaaga tggaacttgt aacggtctac aacattatgc cgctttaggt    2400

    ggtgacattg aaggtgctaa gcaagtaaat ttatggccaa gtgaccaccc aagtgatgtt    2460

    tatgaggcag ttgcagaaat tgtgcgtggg tttctaaaaa aggatgccga agcaggggac    2520

    gaaatggcta atttcttaaa agacaaagtt accagaagtg tggtcaagcc tacggttatg    2580

    actaatgttt atggtgtaac gtatgttgga gcccgcaaac aaatttccga aaagctggag    2640

    aatattgatg gaatggaaaa gctgaaggtt gcggattacg ccaattattt gacgaaaaaa    2700

    gtttttgaag ctcttcgttc tttatttacg caggctcatg aaattcaaga ttggctatcc    2760

    gcttgttgta atctaattac tcactcatta ccagccgatt acataaaaga aggaatcaag    2820

    gatgaactta ctccagtagt gtggacaacg cttctaaatt tgcctatagt acaaccatat    2880

    cgtaattaca aatcccgcca aattcgtacc aacttacaga ctgtctttat tgaagaaaga    2940

    gatagaacag caacagtaca accacacaaa caggccactg cttttcctcc taattttatt  3000

    cactctttag atgcaacgca tatgtttatg acttgtttaa aatgtagcga acaaaacatt  3060

    aactttgctg ctgttcatga ctcttattgg acacacgctt gtgatgttga tcaaatgaat  3120

    agccttttgc gcgaagcatt tgtgttgttg cactcaaaca acattatgga aaggctaaaa  3180

    caggagtttg aggagagata caaaggtttt ttagtttcga agaaggcgat caaagctaat  3240

    gatgaagatt tgaaagctaa atttggtaat aaatcttata ttcctttgga atttccgcca  3300

    ctgccggcga gaggtgcttt ggatttaaaa aaagttttgg agagtaagta ttttttctca  3360

    taa                                                                3363

    <210>3

    <211>366

    <212>PRT

    <213>裂殖酵母

    <400>3

    Met Lys Leu Pro Lys Ile Leu Tyr Asp Ala Ala Ala Phe Gly Gly Pro

    1               5                   10                  15

    Arg Ser Thr Gly Phe Val Lys Ile Leu Asn Leu Asn Gly Arg Ser Ser

                20                  25                  30

    Tyr Lys Ser Ser Tyr Leu Val Asn Gln Asn Leu Met Asp Glu Ala Leu

            35                  40                  45

    Val Lys Ser Asn Leu Leu Lys Glu Tyr Asn Ser Glu Lys Met Thr Ile

        50                  55                  60

    Leu Glu Met Ala Pro Gly Pro Gly Val Thr Thr Thr Ser Leu Phe Asn

    65                  70                  75                  80

    Tyr Phe Gln Pro Lys Ser His Val Val Leu Glu Ser Arg Glu Val Phe

                    85                  90                  95

    Ser Lys Pro Leu Gln Lys Leu Cys Thr Leu Ser Asp Gly Arg Ile Lys

                100                 105                 110

    Trp Val His Gln Asp Gly Tyr Tyr Trp Gln Thr Tyr Glu Asp Val Tyr

            115                 120                 125

    Val Ser Lys Val Leu Asp Pro Arg Ile Gln Thr Glu Glu Glu Gln Lys

        130                 135                 140

    Leu Ser Pro His Arg Glu Leu Leu Phe Phe Ala His Leu Pro His Gly

    145                 150                 155                 160

    Tyr Ala Gly Leu Leu Phe Val Ser Gln Ile Leu Asp Phe Leu Ser Ala

                    165                 170                 175

    Arg Asp Trp Leu Gly Ile Phe Gly Arg Val Arg Val Leu Leu Trp Leu

                180                 185                 190

    Pro Cys Ser Pro Thr Val Thr Leu Leu Gly Ser Arg Gly Phe Ser Lys

            195                 200                 205

    Arg Ser Lys Thr Ser Val Phe Arg Glu Ala Phe Thr Asp Ser Arg Val

        210                 215                 220

    Leu Ala Ala Ser Glu Ser Thr Leu Gln Lys Leu Cys Met Gly Tyr Ser

    225                 230                 235                 240

    Lys Glu Ala Lys Glu Asn Tyr Gln Ile Ser Pro Asn Pro Leu Leu Val

                    245                 250                 255

    Ser Pro Thr Pro Ile Thr Ser Glu Pro His Lys Glu Asp Leu Thr Leu

                260                 265                 270

    Val Glu Met Cys Ser Lys Pro Gln Asp Lys Gln Leu Ser Ile Pro Val

            275                 280                 285

    Phe Glu Ser Ile Val Arg Ile Leu Leu Thr Cys Lys Ala Thr Ser Leu

        290                 295                 300

    Ser Lys Ser Ile Tyr Tyr Leu Gly Pro Gly Ala Glu Thr Leu Leu Pro

    305                 310                 315                 320

    Ser Phe Thr Gln Cys Gly Ile Asn Ile Asp Met Pro Val Gly Leu Leu

                    325                 330                 335

    Ser Ala Ala Asp Phe Leu Thr Ile Ser Lys Ile Ile Gln Lys Tyr Pro

                340                 345                 350

    Phe Lys His His Leu His Leu Gly Thr Ile Ile Glu Asp Ser

            355                 360                 365

    <210>4

    <211>1101

    <212>DNA

    <213>裂殖酵母

    <400>4

    atgaagcttc ctaaaatttt atatgacgca gctgcatttg gaggaccaag atccacgggg   60

    tttgttaaga tattaaacct aaacggtcgt tcttcgtata agtcatcgta tcttgtgaat  120

    cagaatttga tggatgaagc gcttgtgaaa agcaatctgc ttaaggaata caactcggag  180

    aaaatgacta ttttagaaat ggcaccggga ccgggagtga ctaccacttc gctgttcaat  240

    tacttccaac ctaaaagtca cgttgtgcta gaatcacggg aagttttttc caaaccttta  300

    caaaaattgt gtacgctttc tgatggaagg attaagtggg tgcatcaaga tggttattat  360

    tggcaaactt acgaagatgt gtacgtttcg aaggttttgg atcctcgtat tcaaacagaa  420

    gaggagcaga agttatcacc acatcgcgaa cttttatttt ttgctcatct tcctcatggt  480

    tatgccgggt tattatttgt ttctcaaatt ttagactttc tctcggcaag ggattggctt  540

    ggcatttttg gaagagttcg tgtattgcta tggttgccct gttctcctac tgttactctt  600

    cttggaagta ggggattttc aaaaagatcc aagacatcag ttttccgaga ggcctttaca  660

    gactctcgtg tattagctgc ctccgagtca acattgcaaa aattatgtat ggggtatagt  720

    aaagaggcca aggagaatta tcaaatttct ccaaatcctt tattagtttc acccacgcca  780

    attactagtg aaccgcataa agaggacctt actttggttg aaatgtgctc caaaccacaa  840

    gataaacaat tgtctattcc agtgtttgaa agcattgtta ggatactgtt gacatgtaaa  900

    gcaacatcac tttcaaaatc catttattat ttaggcccag gtgcggaaac tctattaccc  960

    tccttcaccc aatgtgggat taacatcgat atgcccgttg gactattgag tgcagccgac  1020

    tttcttacca tttcaaaaat tatacaaaaa tatcctttca aacatcattt acatttgggt  1080

    acaataattg aagattcata a                                            1101

    <210>5

    <211>1987

    <212>DNA

    <213>人工合成

    <400>5

    gatgataaac aagctcgcca tctctatact taagggcttg cattgtatgg aaagggcgca   60

    attgccgtgc cctataagaa gaacttttga tttttcaaat gaattttaga tcttgaagtc  120

    aggcgacaac agccaaaaca tcatctcatc tcattcattc aacaatgagg aatgggcgat  180

    ttttcatcca gcgtttttat caggtcaatt gcgtcgatct cattgtacac caagatgatg  240

    gatatgtaat gaagccagcc agtcggctta tgaaaatttt gctaattata agaaatcaat  300

    tgcaagtaac agaaatgaga tggatcgctg catcaacaag gataatgaga tagacagata  360

    aagtttgttg aaaattttca cgacagaaga aaatcactca actaatcaac tcaaaatgga  420

    ataacatgga aatttatttc gccaaacagt gcagaagcca ctcaaaagtg aaatgagcaa  480

    tggaggggag gaaggaaaga ttggttgatt tgctgtatca gatgaaattc atgggtgaat  540

    gaaaaagaaa aaaaggtttg caagaggatg gatgagtgag attgaaaaaa tattagatct  600

    cgaataaatt ctttctatcc atctttcata gtatacaatc gaaaacaaga tagaacacat  660

    ccatgccatc catacttcta tctttttttt tctttctctc tctctctctc cccccctagc  720

    attcctccaa caacctcttt ataaacgata tcctcttctc ttcccttcct acaccaatat  780

    cctcctattt tgtctctgat gtcatgctga cctccaccca ctttacactt ttacctcgcc  840

    attgcaccgt gtcgcttacc gcaaaacctc atcgagtcat ggatgcgcaa cgtcaccacc  900

    atcgtaagcg aatacagagt tggaacgagc ggctcgcatg atgccaatga cgtacgttaa  960

    cgaaggacgt caaagtaggc aaatccgccg acataaactt cttgtctttc gcataccacg  1020

    attgttggac accaacaata tatttctgtg aaaatcaatt gaaaagctaa tttagtaatt  1080

    ttttggagac tattggaagg gtacccagta ttggaaagtt atatgattct taaaaatgta  1140

    cgtttgtaaa tgtttgctca ctcgttcgtg tgggtaatgt ttgagtcgga tttttgtttg  1200

    gattgtggat gtaaacgcgg atattagagg ctggagatga gtatcggaaa gactttgcgt  1260

    ttggagagtg ttgttgacgt tacacttcct acctttggac tgggttgggg atagggatct  1320

    taggagagat aagtggacga atgaattagg acggttggac aatatcgagt cttggaagat  1380

    tactgaattc taataaaaaa aaaagaaaag caagaagcga tttttttctt ttgtgttttt  1440

    atttcatttt tattttcttt ccaagtctgt gactagtttt ttggactttt ttttggattt  1500

    tttttttctt ctacgtcagg tgctttcata cggagatttg ctctttcctt gatgatcagt  1560

    tttgatttca tctttacctt attctatatc acgtctcctt ccccttctgc taggcggtga  1620

    ttgtatgctt gacttcattc tctacatcat tcaggtgacg ggtttcgctt tcaagtcgtt  1680

    aagttaaatt tggcggatgc gcaagtgtat cttttttttc attctttttg tgcgaaattc  1740

    cttttttttt tctttttttt ttcttttttc tatcatcttg tctctctgtt atcttggttt  1800

    agttcaagag tacggatgcg gatagatcag tgtcaagaat ttggaagcaa atgtgttggc  1860

    acatttccag acgtaaaacc aaacgactag agatctttaa ttagttattt ttctaataat  1920

    acccatatct cttgattgat tccgtttgtc gccgtctgtt caaataatgc gttttaaagt  1980

    atgtttg                                                            1987

    <210>6

    <211>103

    <212>DNA

    <213>人工合成

    <400>6

    ctccaaacca caagataaac aattgtctat tccagtgttt gaaagcattg ttaggatact    60

    gttgacatgt aaagcaacat ccgctgcagg tcgacggatc ccc                     103

    <210>7

    <21l>107

    <212>DNA

    <213>人工合成

    <400>7

    atcgatgtta atcccacatt gggtgaagga gggtaataga gtttccgcac ctgggcctaa    60

    ataataaatg gattttgaaa gtggccgcat aggccactag tggatct                 107

    <210>8

    <211>104

    <212>DNA

    <213>人工合成

    <400>8

    actttcttac catttcaaaa attatacaaa aatatccttt caaacatcat ttacatttgg    60

    gtacaataat tgaagattca tacgctgcag gtcgacggat cccc                    104

    <210>9

    <211>105

    <212>DNA

    <213>人工合成

    <400>9

    caaaattact ggatgcaaag aaatgcgtgt atgaacaaaa acaatcaata cgtttgtttc    60

    ccccaatttt ctgtaaattt ggccgcatag gccactagtg gatct                   105

    关 键  词:
    一种 线粒体 RNA 聚合 附属 转录 因子 复合体 应用
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种线粒体RNA聚合酶附属转录因子、其聚合酶-转录因子复合体及应用.pdf
    链接地址:https://www.zhuanlichaxun.net/p-9019357.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1