技术领域
本发明属于生物技术领域,涉及一种新型聚合酶-转录因子复合体。更具体地,本发明涉及一种线粒体RNA聚合酶Rpo41-转录因子Mtf1复合体的基因克隆,蛋白制备,功能研究及其在生物技术领域的应用。
背景技术
细胞中的DNA转录成RNA是生命最重要的一个过程。其中,依赖于DNA的RNA聚合酶以及附属转录因子组成的转录复合体是完成上述过程的核心装置[参考文献1,2,3,4]。因此,对于转录复合体的研究一直是科学界的热点。目前普遍认为,在真核生物中编码三类负责转录细胞核基因的RNA聚合酶(I,II和III)[参考文献5]。其中,最为重要的众多mRNA的转录是由RNA聚合酶II为核心的转录复合体来完成。另外,在真核生物中还编码一类线粒体RNA聚合酶,这类蛋白本身是由核基因组编码,在细胞质中合成,并最终转运到线粒体中发挥功能。在线粒体中,它主要负责转录线粒体基因组编码的rRNA,tRNA以及一些呼吸链相关的基因。因此,以线粒体RNA聚合酶及其附属转录因子组成的转录复合体是真核生物能够进行正常的能量代谢的关键。
酵母是进行分子遗传学研究的良好模型。其较小的基因组(5000个基因左右),易于培养,方便观察的特点使其被广泛用来研究RNA转录的分子机制。现有的研究表明,在芽殖酵母中,线粒体基因的转录是线粒体RNA聚合酶Rpo41和线粒体转录因子Mtf1组成的转录复合体完成的[参考文献6,7]。其中,敲除Mtf1的芽殖酵母表现出更为细小的细胞形态,线粒体DNA的缺失,以及无法在非发酵碳源培养基上生长。从结构上推测,芽殖酵母中的Mtf1更类似于细菌中的Sigma因子,它可以结合线粒体聚合酶Rpo41形成功能完全的“全酶”,再特异性的结合线粒体基因上游启动子的核心元件,确保正确的转录开始。
迄今为止,几乎所有的对芽殖酵母Rpo41和Mtf1蛋白的报道都只限于其在线粒体中的功能。为何RNA聚合酶II负责转录数千个基因,而线粒体RNA聚合酶只负责转录数十个基因,这样一种资源配置方式在细胞内是否经济?带着这一疑问,本发明启动了相关研究计划,本申请人以另一种在进化上更接近人类细胞的酵母-裂殖酵母作为研究模型,在裂殖酵母中,本发明首先通过生物信息学方法,找到与芽殖酵母中Rpo41和Mtf1同源的两个蛋白,系统编号分别为SPAC26H5.12和SPAC1002.08c,在Sanger Genedb数据库中这两个基因均被标注为‘尚未具有研究性报道公开’。本发明首次克隆到裂殖酵母中Rpo41和Mtf1两个基因,进行了相应的转基因和基因敲除研究,同时还在大肠杆菌中表达纯化出这两个蛋白,验证了它们作为转录因子的活性。非常有意思的是,研究表明,Rpo41和Mtf1组成的转录复合体不仅可以有效的转录线粒体中的基因,而且还能够高效的转录细胞核中编码的基因。本发明不仅解决了‘线粒体RNA聚合酶在细胞核中是否同样具有功能’这一重要理论问题,而且这一新型转录机制也能够被发展为一种有效的生物技术工具,应用于科学研究和重组生物工程产品的生产,与此同时,这一转录复合体还可以被用做抗肿瘤和其他疾病药物筛选的靶点。
本发明的参考文献如下:
1.Goodrich,J.A.,Cutler,G.,and Tjian,R.(1996).Contacts incontext:promoter specificity and macromolecular interactions intranscription.Cell 84,825-830.
2.Tansey,W.P.,and Herr,W.(1997).TAFs:guilt by association?Cell 88,729-732.
3.Roeder,R.G.(2005).Transcriptional regulation and the role ofdiverse coactivators in animal cells.FEBS Lett 579,909-15.
4.Sekinger,E.A.,Moqtaderi,Z.,and Struhl,K.(2005).Intrinsichistone-DNA interactions and low nucleosome density are important forpreferential accessibility of promoter regions in yeast.Mol.Cell 18,735-748.
5.Roeder,R.G.,and Rutter,W.J.(1969).Multiple forms ofDNA-dependent RNA polymerase in eukaryotic organisms.Nature 224,234-237.
6.Bonawitz,N.D.,Clayton,D.A.,and Shadel,G.S.(2006).Initiation and beyond:multiple functions of the human mitochondrialtranscription machinery.Mol Cell 24,813-25.
7.Asin-Cayuela,J.,and Gustafsson,C.M.(2007).Mitochondrialtranscription and its regulation in mammalian cells.Trends Biochem Sci32,111-7.
发明内容
本发明的目的是提供一种新型RNA聚合酶和其附属转录因子基因及其编码的蛋白。
本发明的另一目的是提供上述基因及其编码蛋白的用途。
本发明提供了一种线粒体RNA聚合酶附属转录因子(Mtf1),它的氨基酸序列包括序列表SEQ ID NO:3中的1-366位。
在本发明的一个实施例中,所述的线粒体RNA聚合酶附属转录因子的氨基酸序列如SEQ ID NO:3中的1-366位所示。系统名为SPAC1002.08c,在本发明中被简称为Mtf1。
在本发明中,线粒体RNA聚合酶附属转录因子还包括具有相同转录因子功能的、SEQ ID NO:3中的1-366位序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。
编码线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸序列选自序列表SEQ ID NO:4中的1-1101位。在本发明中,线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸编码序列也包括简并序列。简并序列是指,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO:4中的1-1101位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.3所述的序列。
本发明还提供了一种转录组合物,该转录组合物包括RNA聚合酶蛋白和上述线粒体RNA聚合酶附属转录因子。RNA聚合酶蛋白和上述线粒体RNA聚合酶附属转录因子可以结合,形成聚合酶-转录因子复合体。
RNA聚合酶蛋白可以是通常使用的RNA聚合酶II或者本发明的实施例中使用Rpo41。
在本发明的一个实施例中,所述RNA聚合酶蛋白Rpo41的氨基酸序列包括序列表SEQ ID NO:1中的1-1120位。其系统名SPAC26H5.12,在本发明中被简称为Rpo41。
在本发明中,RNA聚合酶蛋白Rpo41还包括具有相同RNA聚合酶功能的、SEQID NO:1中的1-1120位序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。
编码本发明的新型RNA聚合酶的多核苷酸序列选自序列表SEQ ID NO:2中的1-3363位。
编码线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸序列选自序列表SEQ ID NO:2中的1-3363位。在本发明中,线粒体RNA聚合酶附属转录因子蛋白Mtf1的多核苷酸编码序列也包括简并序列。简并序列是指,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO:2中的1-3363位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO:1所述的序列。
本发明提供了所述转录组合物转录RNA的用途。也可以将该转录组合物用于调控细胞周期。或者,将该转录组合物用作肿瘤药物筛选药靶。
Mtf1的基因敲除菌株无法形成克隆,在平板上只能分裂几次。使用荧光白Calcofluor染色的结果显示缺失Mtf1的细胞有较高比例的细胞横隔,其中一些细胞含有多个细胞横隔。此结果暗示Mtf1可能有调控细胞周期和细胞形态方面的功能。过量表达Mtf1出现细胞长度增加的表形。考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型。因此,本发明认为可以将Mtf1作为抗肿瘤药物筛选的靶标。本发明认为,能够使Mtf1基因敲除菌株、Mtf1过量表达菌株恢复或部分恢复正常表形的化合物均能够被认为是潜在的抗肿瘤药物分子。
本发明提供了所述转录组合物的用途,即将转录组合物用于转录蛋白。其中,所述转录组合物识别的启动子区域包括序列表SEQ ID NO:5中的1350-1477位。也可以是SEQ ID NO:5中的1350-1477位中的部分。
本发明提供了数种载体,包括:
(a)含有线粒体RNA聚合酶附属转录因子的多核苷酸编码序列的载体。
(b)含有编码本发明的RNA聚合酶的多核苷酸的载体。
(c)同时含有编码本发明的新型RNA聚合酶和其附属转录因子的多核苷酸的载体。
本发明还提供了一种遗传工程化的宿主细胞,它是选自下组的宿主细胞:
(a)用本发明上述的载体转化或转导的宿主细胞。
(b)用编码Rpo41和/或Mtf1的多核苷酸转化或转导的宿主细胞。
本发明还提供了Rpo41和/或Mtf1过量表达菌株,可以通过下面的方法制备,该方法包含:
(a)向宿主感受态细胞中转化相应的过量表达载体。
(b)利用过量表达载体上的抗生素筛选标签筛选阳性菌株。
本发明还提供了Rpo41和/或Mtf1基因敲除菌株,可以通过下面的方法制备,该方法包含:
(a)向宿主感受态细胞中转化相应的同源重组PCR片段。
(b)利用过量表达载体上的抗生素筛选标签筛选阳性菌株。
本发明提供了所述线粒体RNA聚合酶附属转录因子的制备方法,可以是按照常规方法,培养表达所述线粒体RNA聚合酶附属转录因子的宿主细胞,然后从培养物中分离出所述线粒体RNA聚合酶附属转录因子。
本发明提供了所述线粒体RNA聚合酶附属转录因子也可以按照其序列,直接人工合成。
本发明中的RNA聚合酶也可以通过上述两种方法制备。
实验表明,Mtf1具备转录因子的活性。而且其转录因子活性不依赖于RNA聚合酶II,即在缺乏通常使用的RNA聚合酶II的情况下,Mtf1也能够发挥转录因子的作用。Mtf1和Rpo41组成蛋白复合体,能转录成功核基因。较好的,这些基因具备F4片段,更好的,具备F4-4片段。与商业化的T7聚合酶相比,因为Mtf1和Rpo41来自真核生物,因此能够更为精确,高效的转录真核来源的RNA,特别是某些含有复杂二级结构的RNA片段,因为转录因子Mtf1能够“融解”启动子片段的碱基对,因此,在优化的转录缓冲液和反应条件下,Mtf1和Rpo41组成的转录体系能够被开发成一种商业化的转录系统,此系统能够特异性地转录包含19bp(SEQ ID NO:51361-1379)核心序列的RNA片段。
另一方面,过量表达Mtf1会干扰细胞周期进程。Mtf1的基因敲除菌株敲除菌株无法形成克隆,在平板上只能分裂几次。过量表达Mtf1出现细胞长度增加的表形。裂殖酵母长期被用作筛选抗肿瘤药物的模型,Mtf1则可以作为抗肿瘤药物筛选的靶标。能够使Mtf1基因敲除菌株、Mtf1过量表达菌株恢复或部分恢复正常表形的化合物,均能够被认为是潜在的抗肿瘤药物分子。本发明还提供了高通量寻找本发明新型RNA聚合酶附属转录因子在裂殖酵母体内靶点的方法。
本发明提供了数种分离的多核苷酸,这些多核苷酸序列编码本发明的新型RNA聚合酶和其附属转录因子蛋白的结合的启动子区域。其中,所述的多核苷酸序列分别选自序列表SEQ ID NO:5,其中,片段F1为10-337位,片段F2为316-734位,片段F3为715-1177位,片段F4为960-1534位,片段F5为1510-1964位,片段F4-1为1167-1239位,片段F4-2为1211-1314位,片段F4-3为1303-1380位,片段F4-4为1350-1477位,片段F4-5为1457-1546位。
本发明中另一些分离的多核苷酸,编码本发明的RNA聚合酶和其附属转录因子组成的转录复合体起始转录的启动子区域。其中,所述的多核苷酸序列分别选自序列表SEQ ID NO:5,其中,片段F4-2为1211-1314位,片段F4-4为1350-1477位,片段F4-5为1457-1546位,片段F4-479BP为1350-1428位,片段F4-489BP为1350-1438位,片段F4-499BP为1350-1448位。
本发明所用实验方法,如未特别指出,则可以使用本领域的常规操作。以下列举本发明部分实验方法。
构建mtf1+缺失菌株:mtf1+缺失菌株是由在二倍体细胞中转化PCR片段实现的,PCR反应是用长引物进行的,引物含有80个碱基序列同源于Mtf1的C-末端,20个碱基序列同源于质粒pFA6a-kanMX6。引物序列如下:CTCCAAACCACAAGATAAACAATTGTCTATTCCAGTGTTTGAAAGCATTGTTAGGATACTGTTGACATGTAAAGCAACATCCGCTGCAGGTCGACGGATCCCC(SEQ ID NO:6)和ATCGATGTTAATCCCACATTGGGTGAAGGAGGGTAATAGAGTTTCCGCACCTGGGCCTAAATAATAAATGGATTTTGAAAGTGGCCGCATAGGCCACTAGTGGATCT(SEQ ID NO:7)。
转化后选择能在G418板上生长的克隆。二倍体菌株生成孢子,收集孢子后在平板上发芽。mtf1+缺失菌株的确认是用定量PCR检测Mtf1基因的表达水平和用PCR检测基因组DNA。
在染色体的mtf1上加TAP的标记:在染色体的mtf1上加TAP的标记是通过用PCR产物转化单倍体细胞实现的,PCR的引物包含80bp序列于Mtf1C-末端基因序列同源和20bp的序列于质粒pFA6a2PA同源。引物序列为:ACTTTCTTACCATTTCAAAAATTATACAAAAATATCCTTTCAAACATCATTTACATTTGGGTACAATAATTGAAGATTCATACGCTGCAGGTCGACGGATCCCC(SEQ ID NO:8)和CAAAATTACTGGATGCAAAGAAATGCGTGTATGAACAAAAACAATCAATACGTTTGTTTCCCCCAATTTTCTGTAAATTTGGCCGCATAGGCCACTAGTGGATCT(SEQ ID NO:9)。
染色体标记的证实是通过菌落PCR和用rabbit anti mouse IgG peroxidase抗体做Western blot来实现的。
细胞核,线粒体和细胞质的提取与Western blot:Mtf1TAP标记的菌株用来提取细胞核线粒体和细胞质,细胞核的提取方法是Shimizu et a1.1991)所描述的,线粒体和细胞质提取和纯化是Chiron et al.2007所描述的。纯化的细胞核,线粒体和细胞质的样本在10%的SDS PAGE凝胶进行电泳,然后转到硝酸纤维素膜上。用rabbit anti mouse IgG peroxidase抗体在1∶8000稀释后孵育1小时,洗涤后进行化学发光反应,用X光胶片检测荧光信号。
ChIP-chip芯片分析:所使用的芯片间包含了所有裂殖酵母的非编码区,非编码区大于2kb的用了一个以上的PCR产物的探针,探针的平均长度为1kb。总共有5200个从100bp到2kb大小不等的探针。该芯片不包括线粒体染色体基因。在室温下Mtf1TAP标记的细胞在1%甲醛固定15分钟,然后在125mM glycine中5分钟。经过TBS洗两次然后悬浮在0.4毫升的裂解液(50mM HEPES-KOH[pH 7.4],140mM NaCl,1mM EDTA,1%Triton X-100,0.1%sodium deoxy-cholate,1mM phenylmethylsulfonyl fluoride,10μg/ml aprotinin,1ug/ml leupeptin,1μg/mlpepstatin)中,细胞用玻璃珠打浆机破碎1分钟,破碎的细胞超声4次以打断染色体DN。离心12,000g 10分钟获得上清,然后和IgG Sepharose 6 fast flow bead进行结合。2μg的DNA用Cye-3或Cye-5进行标记(Klenow)后和芯片杂交。数据采集,处理和正常化是(Heichinger et al.2006)中所描述的。
质粒构建:PCR扩增Mtf1编码序列插入到pREP3在SmalI构建了pREP3-mtf1T。
Mtf1基因扩增的PCR片断用XhoI和EcoRI克隆到pGEX-4T-1中构建了pGEX-4T-mtf1T,包含了Mtf1C末端GST的标记。Rpo41基因扩增的PCR片断用用XhoI和EcoRI克隆到到载体pET28a,进而产生了一个N端His标记的Rpo41。克隆是用DNA测序证实的。
Mtf1和Rpo41的表达和纯化:含pGEX-4T-mtf1E.coli BL21细胞在PBS缓冲液(pH8.0)中裂解后用Glutathione Sepharose 4B来纯化。His标签的Rpo41细胞在缓冲液(20mM Imidazole,20mM Phosphate,0.5M NaCl,pH 7.4,1mMphenylmethylsulfonyl fluoride)中裂解后用Ni2+-NTA-agarose纯化,用20mMimidazole洗柱,用500mM imidazole,20mM Phosphate,0.5M NaCl,pH 7.4Ni2洗脱,在20mM Phosphate,0.1M NaCl,0.2mM ETDA and 1mM DTT中透析过夜。
荧光实时PCR分析:在液体培养基中细胞生长OD600=0.5,使用试剂TRIzol Reagent(Invitrogen)提取总RNA。反转录RNA用TaKaRa PrimeSciptTMlstStrand cDNA Synthesis试剂盒,仪器型号是iQ5 Continuous FluorescenceDetector System(Bio-Rad)。PCR反应包括:250Nm的正向和反向引物,1μl的cDNA(5ng),10μl 2X SYBR-green Realtime PCR Master Mix(SYBR PremixEx TaqTM,TaKaRa),总体积为20μl。所有结果是从至少有两个独立的生物重复和四个技术重复中得到。受α-amanitin处理的细胞,0.1μg/ml和1μg/mlα-amanitin加到OD600=0.5的细胞6小时之后收集细胞。
细胞染色和用共聚焦显微镜观察:对DAPI和calcofluor染色,细胞生长至OD600=0.5,在70%乙醇中固定,用DAPI染细胞核,或细胞用50μg/ml的calcofluor在50%glycerol and 0.3mg/ml p-phenylenediamine缓冲液中染色,在Leica TCS-SP5显微镜下观察。
凝胶电泳迁移法(EMSA):5’端生物素标记的PCR引物用来合成生物素标记的探针,在反应中,200ng纯化的GST标签的Mtfl,50fMol的探针和5ng/μL ofpolydI/dC在结合缓冲液(10mM Tris HCl pH 7.5,50mM KCl,0.1mM EDTA,1mMDTT)在冰上孵育30分钟,然后样品在4℃TBE缓冲液中在6%polyacrylamidenative胶上进行电泳,DNA/蛋白复合物被转移到Hybond-N+膜上,并用LightShiftChemiluminescent EMSA kit(Thermo Scientific)EMSA试剂盒进行检测。
体外转录:体外转录所用的DNA模板是PCR产生的,His标记的Rpo41和GST标记的Mtf1蛋白是在大肠杆菌中表达和纯化的。转录反应包括500ng的DNA模板,10pmol的Rpo41和10pmol的Mtf1,在反应缓冲液是50mM Tris(pH 7.9),20mMMgCl2,1mM dithiothreitol,50μMUTP,[α-32P]UTP(1000cpm/pmol UTP),250μM ATP,GTP和CTP,总反应体积极是20μl。反应在30℃孵育60分钟,加入25μl的在冰上的终止缓冲液(90%formamide,50mM EDTA,bromophenol blue,and xylene cyanol)。样本在70℃变性5分钟然后在6%polyacrylamide胶上进行电泳。干胶后X光片在放入增强屏幕中再放置-70℃,胶片冲洗后观察放射性的条带。
本发明提供了一种线粒体RNA聚合酶附属转录因子,它的氨基酸序列包括序列表SEQ ID NO:3中的1-366位。RNA聚合酶蛋白和上述线粒体RNA聚合酶附属转录因子可以相互作用,形成聚合酶-转录因子复合体。实验证明,上述线粒体RNA聚合酶附属转录因子可用于转录蛋白,涉及调控细胞周期,还可用作肿瘤药物筛选的药靶。本发明为基因转录、尤其是细胞核内的基因转录提供了一套精确有效的转录工具,为基因功能的研究提供了一种新途径。同时,本发明的线粒体RNA聚合酶附属转录因子涉及调控细胞周期,Mtf1的基因敲除菌株无法形成克隆,考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型,可以将Mtf1作为抗肿瘤药物筛选的靶标。
附图说明
图1是裂殖酵母与芽殖酵母的Mtf1氨基酸序列对比图。
图2是裂殖酵母Mtf1结构域图。
图3是缺失Mtf1细胞和野生型细胞的形态对比图。
图4是Mtf1在细胞中的亚定位图。
图5是过量Mtf1干扰细胞周期进程图。
图6是维生素B1抑制Mtf1mRNA表达图。
图7是过表达Mtf1影响有丝分裂进程图。
图8是Mtf1的转录因子活性不依赖于RNA聚合酶II的细胞结果图。
图9表明增加α-amanitine的浓度Srk1mRNA表达水平不受影响。
图10是Mtf1结合Srk1基因的上游序列图。其中,图A是5个可覆盖上游区域的DNA片段;B显示片段4(F4)和Mtf1结合在胶上产生了迁移速度慢的条带;C显示片段F4-4、F4-2和Mtf1结合在胶上产生了迁移速度慢的条带。
图11是F4-4、F4-2、F4-5转录RNA电泳图。
图12是F4-4转录不同长度片段RNA的电泳图。
具体实施方式
本发明经过深入而广泛的研究,在裂殖酵母中分离得到了一种新型线粒体RNA聚合酶Rpo41和附属转录因子Mtf1。在成功克隆出这两个基因后,利用转基因和基因敲除技术验证其用途。结果表明,Rpo41和Mtf1形成的复合体不但可以负责线粒体基因组的转录,同时,还可以转录核基因Srk1,进而影响酵母正常的细胞周期进程。
实施例1:裂殖酵母新型线粒体RNA聚合酶Rpo41和附属转录因子Mtf1的克隆
根据芽殖酵母中同源蛋白氨基酸序列,在英国桑格研究中心网站Genedb上进行Blast比对,结果显示,裂殖酵母中分别存在一个高度保守的同源线粒体RNA聚合酶,系统名SPAC26H5.12,以及一个高度保守的线粒体转录因子,系统名SPAC1002.08c。裂殖酵母与芽殖酵母中Mtf1同源蛋白之间氨基酸序列的对比结果参见图1,通过比对,申请人发现裂殖酵母Mtf1具有一个保守的N端结构域和一个保守的C端结构域,参见图2。
在本发明下述实施例中,如无特别说明,SPAC26H5.12被简称为Rpo41,SPAC1002.08c被简称为Mtf1。
实施例2:裂殖酵母Mtf1在细胞中的亚定位
为了研究裂殖酵母Mtf1在细胞中的功能,本发明使用超速离心的方法,分别提取了裂殖酵母线粒体,细胞核和细胞质成分,使用Western-blot方法检测Mtf1在细胞中的亚定位,如图4所示,Mtf1在细胞核和线粒体中都有定位,这一结果暗示了Mtf1不仅在裂殖酵母线粒体中发挥功能,同时很可能也在细胞核中具有转录基因的功能。
实施例3:裂殖酵母Mtf1敲除突变体有细胞周期调控和细胞形态上的缺陷
为了探讨其细胞功能,本发明对裂殖酵母的Mtf1进行基因敲除,敲除是在二倍体细胞中进行的,后经交配产生的孢子在发芽后在显微镜下观察表型。缺失Mtf1的细胞表现出类似的形态,即:敲除菌株无法形成克隆,在平板上只能分裂几次。图3表明,缺失Mtf1的细胞和野生型细胞相比在形态上更长更大,并且变成鸡蛋或瓶子的形状。DAPI染色表明缺失Mtf1的细胞没有明显细胞核的缺陷。使用荧光白Calcofluor(卡尔科弗卢尔荧光染色剂)染色的结果显示缺失Mtf1的细胞有较高比例的细胞横隔,其中一些细胞含有多个细胞横隔。此结果暗示Mtf1可能有调控细胞周期和细胞形态方面的功能,体内Mtf1功能的缺失会造成酵母分裂的不正常。
实施例4:Mtf1过量表达对裂殖酵母细胞周期的影响。
首先将Mtf1的编码序列克隆到裂殖酵母过量表达载体pREP3中,载体上过量表达Mtf1的强启动子Pnmt1能够受维生素B1抑制性的调控。对在不加维生素B1和加了60μM维生素B1的条件下的细胞进行定量PCR的检测Mtf1表达量。在没有维生素B1的条件下过量表达Mtf1的细胞比仅转入空载体的细胞中Mtf1表达水平超过600倍以上。虽然60μM维生素B1可以抑制Mtf1mRNA表达水平到最低水平,但抑制并不完全(图6),此结果暗示了Mtf1过量表达菌株的构建成功。申请人利用激光共聚焦显微镜观察到在没有维生素B1的条件下过量表达Mtf1的细胞和仅转入空载体的细胞相比是明显变长的,而在加了60μM维生素B1的条件下过量表达Mtf1的细胞没有变长,此结果表明过量表达Mtf1会干扰细胞周期进程(图5)。
实施例5:Chip-chip的方法确定Srk1可能是Mtf1的靶基因
为了在裂殖酵母全基因组中找到Mtf1的靶基因,使用同源重组基因打靶技术,将酵母基因组上的Mtf1基因编码区末端加了TAP标签,利用染色体免疫共沉淀偶联芯片杂交的方法,筛选Mtf1在体内的直接结合的DNA片段,分析表明总共有70个非编码区的DNA片段可能和Mtf1结合,其中一个信号很强且重复出现多次的DNA片段是Srk1(Sty1调节激酶1)的上游区域。
实施例6:过量表达Mtf1影响到有丝分裂的进程是通过调节Srk1基因的转录实现的
利用荧光定量PCR的实验方法检测了过量表达Mtf1细胞中Srk1mRNA的水平发现Srk1mRNA表达量在过量表达Mtf1细胞中比在只有转化了载体的细胞中增加了18倍(图7)。在过量表达Rpo41的菌株中Srk1mRNA的水平也过量表达3倍,此结果说明Srk1就是Rpo41和Mtf1形成的复合体在体内调控的靶基因。而已有的研究表明,Srk1过量表达菌株表现出细胞长度增加的表形,与实验中观察到Mtf1过量表达菌株的表型类似,此证据进一步指明了Mtf1在体内主要是通过调控Srk1基因的表达从而影响细胞周期和细胞分裂过程。
实施例7:Mtf1的转录因子的活性不依赖于RNA聚合酶II
在经典生物学理论中,真核细胞中RNA聚合酶II和相应转录因子负责合成细胞中mRNA。而芽殖酵母中的研究显示,Rpo41是线粒体中RNA聚合酶,它与转录因子Mtf1共同参与线粒体基因的转录。
在前述实施例中,已经证明作为线粒体转录因子的Mtf1同样可以控制核基因Srk1基因的表达,进而调控细胞周期。因此,下一步的疑问是:RNA聚合酶II还是Rpo41和Mtf1一起转录Srk1mRNA。用不同浓度的RNA聚合酶II特异性抑制剂α-amanitine(它不影响线粒体的RNA聚合酶)来处理野生型972细胞,对比没有用α-amanitine处理过的细胞并检测Srk1的表达水平的变化。选择线粒体基因cox1和15S rRNA共同作为参照,cox1和15S rRNA是由Rpo41转录的因此其表达量在加了α-amanitine应该是不会改变的。首先,检测了3个受RNA聚合酶II转录的基因(actin,tublin,SPAC23H4.13c)在不同浓度的α-amanitine的条件下,这3个基因的表达量和没处理的细胞相比都有所降低(图8)。然后,比较了在加和不加α-amanitine时Srk1和tub1mRNA表达水平,Srk1mRNA和tub1用cox1和15S rRNA正常化后的信号相对表达量是100%。图9表明增加α-amanitine的浓度Srk1mRNA表达水平不受影响。与此相反,tub1mRNA表达水平是减少的。在不同浓度的α-amanitine tub1mRNA的表达水平是低于Srk1的。这些结果表明Srk1mRNA转录是不依赖于RNA聚合酶II。因此,本发明推测很有可能是线粒体聚合酶Rpo41和转录因子在某种情况下也能够在细胞核中转录Srk1的mRNA。
实施例8:体外制备重组Mtf1和Rpo41蛋白
本发明将裂殖酵母中Mtf1和Rpo41的编码区分别克隆进原核表达载体pGEX-4T-1和pET28A中,测序验证序列无误后,将pGEX-4T-mtf1和pET28A-rpo41分别转入E.coli BL21细胞,使用IPTG诱导表达重组蛋白。如实验方法中所述,分别使用Glutathione Sepharose 4B和Ni2+-NTA-agarose纯化出Mtf1和Rpo41重组蛋白,使用SDS-PAGE验证表达产物的分子量,使用Bradford方法测定蛋白浓度。
实施例9:Mtf1能够结合Srk1基因的上游序列
为了更为深入研究Mtf1的生物化学性质,利用凝胶电泳迁移率(EMSA)分析的方法检测了Mtf1和Srk1基因的上游序列的结合能力。生物信息学分析显示,Srk1基因编码区的上游有2000个左右的碱基对,并且十分的富含A+T(62%)。用5’生物素标记的PCR引物进行PCR扩增产生了5个可覆盖上游区域的DNA片段(图10A),生物素标记的DNA片段和从细菌中纯化的Mtf1用于EMSA的检测。在5个DNA片段中,片段4(F4)和Mtf1结合在胶上产生了迁移速度慢的条带(图10B)。F4进一步被分为5个DNA片段用来作EMSA,图10C表明,F4-2和F4-4和Mtf1结合在胶上产生了迁移速度慢的条带。此结果显示F4-2和F4-4片段中可能包括Mtf1和Rpo41起始转录的位点。
实施例10:Mtf1和Rpo41组成的复合体能转录核基因
上述实施例中纯化的Rpo41和Mtf1蛋白,以及鉴定出的Srk1上游启动子片段F4-2和F4-4被用于体外转录反应,以确定Mtf1和Rpo41是否能够在体外组成一个转录核基因的系统。体外转录反应中加有α-P32UTP,P32标记的RNA首先在6%的PAGE凝胶上电泳,然后利用放射自显影技术确定是否有转录出的RNA片段。如图11所示,虽然F4-2和F4-4两个DNA片段在EMSA实验中都能够结合Mtf1蛋白,但只有F4-4为模板能够明显转录出RNA片段,而另一个副对照F4-5也不能转录出RNA片段。根据已经发表的裂殖酵母中的启动子的保守序列,预测在F4-4片段的5’端存在一个类似的9bp的潜在的启动子保守序列。因此,以F4-4片段的5’端为起点,分别设计了三条分别长为79bp,89bp和99bp的DNA模板,图12显示这三条模板都能转录出RNA片段,此结果证明了Rpo41和Mtf1确实能够转录包含预测启动子区域的核基因。而且,图12显示79bp,89bp和99bp三条模板转录出的RNA大小依次增加,此结果也显示了实验中的转录方向与预测的一致,证明了在体外系统中,Mtf1和Rpo41组成的复合体确实能够转录核基因Srk1。
实施例11:Mtf1和Rpo41作为转录工具酶的应用
人工转录RNA在生物技术领域具有广泛的应用,目前,主要使用的是来自噬菌体的T7RNA聚合酶,它可以识别并结合一个21或22个bp的特定的启动子片段,并高效地转录下游RNA片段。基于对Mtf1和Rpo41功能的研究,发现重组的Mtf1和Rpo41蛋白在体外能够高效地转录包含XX核心序列的片段,与商业化的T7聚合酶相比,因为Mtf1和Rpo41来自真核生物,因此能够更为精确,高效的转录真核来源的RNA,特别是某些含有复杂二级结构的RNA片段,因为转录因子Mtf1能够“融解”启动子片段的碱基对,因此,在优化的转录缓冲液和反应条件下,Mtf1和Rpo41组成的转录体系能够被开发成一种商业化的转录系统,此系统能够特异性地转录包含19bp(SEQ ID NO:51361-1379)核心序列的RNA片段。
实施例12:Mtf1作为药物筛选靶标的应用
如前实施例所示,Mtf1的基因敲除菌株无法形成克隆,在平板上只能分裂几次。使用荧光白Calcofluor染色的结果显示缺失Mtf1的细胞有较高比例的细胞横隔,其中一些细胞含有多个细胞横隔。此结果暗示Mtf1可能有调控细胞周期和细胞形态方面的功能。过量表达Mtf1出现细胞长度增加的表形。考虑到裂殖酵母长期被用作筛选抗肿瘤药物的模型。因此,本发明认为可以将Mtf1作为抗肿瘤药物筛选的靶标。本发明认为,能够使Mtf1基因敲除菌株、Mtf1过量表达菌株恢复或部分恢复正常表形的化合物均能够被认为是潜在的抗肿瘤药物分子。
序列表
<210>1
<211>1120
<212>PRT
<213>裂殖酵母
<400>1
Met Pro Ile Glu Ala Tyr Glu Pro Tyr Lys Asn Glu Leu Lys Ser Lys
1 5 10 15
Ile Gly Lys Asp Phe Ile Ile Asp Leu Ser Tyr Lys Ser Gly Thr Ala
20 25 30
Ser Leu Phe Glu Ala Cys Val Tyr Asn Gly Asp Phe Leu Arg Ser Lys
35 40 45
Gln Leu Leu Lys Ser Phe Ile Asp His Asn Lys Gly Asp Lys Ile Leu
50 55 60
Leu Pro Met Ile Asn Leu Tyr Ile Arg Glu Ile Ile Gln Arg Gly Ser
65 70 75 80
Phe Glu Leu Thr Asp Val Leu Ser Asn Ala Lys Glu Leu Leu Gln Gln
85 90 95
Ala Arg Leu Asn Gly Asp Ser Leu Thr Tyr Ala Leu Leu Cys Gln Ala
100 105 110
Ser Leu Asn Pro Thr Gln Arg Gln Leu Gly Leu Pro Val Leu His Glu
115 120 125
Leu Ile His Asn Trp Arg Ser Ala Asn Gly Lys Val Ile Asp Ile Leu
130 135 140
Met His Glu Ser Val Phe Ser Pro Glu Glu Val Lys Leu Ile Met Asp
145 150 155 160
Gln Leu Asn Ile Pro Ile Asn Asn Phe Thr Pro Ser Gln Leu Gln Leu
165 170 175
Leu Gly Ile Thr Asn Ser Thr Ile Val Gly Glu Ser Glu Asn Gly Lys
180 185 190
Asp Gln Asn Gly Asp Ser Ser Leu Lys Glu Lys Gln Pro Asp Val Glu
195 200 205
Thr Thr Val Thr Lys Ser Ala Asn Leu Asn Ala Leu Arg Ser Ser Leu
210 215 220
Ser Ser Leu Leu Thr Glu Ser Ile Asp Leu Pro Ile Asp Glu Val Ser
225 230 235 240
Leu Glu Phe Gly Asn Gln Gly Asp Thr Phe Asn Leu Ala Arg Gln Lys
245 250 255
Leu Leu Glu Lys Ser Ala Ile Leu Ser Ala Ala Glu Val Trp Lys Ser
260 265 270
Glu His Glu Ser Val Leu Asn Arg Gly Asn Leu Gln Val Pro Lys Asn
275 280 285
Val Ser Ser Leu Phe Tyr Ser Trp Tyr Val Gln Leu Glu Gln Leu Phe
290 295 300
Lys Glu Glu Ile Ser Leu Ile Asp Asp Leu Ala Leu Asn Glu Ser Leu
305 310 315 320
Asp Lys Lys Asn Asp Arg Leu Ile Tyr Gly Pro Phe Leu Lys Leu Leu
325 330 335
Ser Ser Lys Lys Leu Ala Ala Leu Thr Ile Met Glu Val Ala Gln Leu
340 345 350
Ser Thr Asn Pro Arg Tyr Asp Arg Gly Ala Arg Val Thr Thr Leu Leu
355 360 365
Gly Gly Leu Gly Arg Ser Phe Glu Arg Glu Phe Leu Ser Glu Gln Ile
370 375 380
Gln Arg Gln Glu Lys Asn Lys Ser Tyr Lys Asp Lys Lys Arg Leu Lys
385 390 395 400
Glu Leu Phe Asn Asp Pro Arg Lys Phe Arg Gln Ala Val Lys Asn Leu
405 410 415
Arg Leu Ser Asn Thr Arg Asp Asn Ile Val Leu Asn Pro Ser Val Asp
420 425 430
Ser Trp Pro Ser Ala Ile Val Met Lys Val Gly Ser Val Ala Leu Cys
435 440 445
Leu Leu Leu Ser Val Ala Lys Ile Glu Val Thr Ala Lys Asp Leu Ser
450 455 460
Thr Gly Gly Ile Leu Lys Gln Glu Val Ala Ala Phe Val His Thr Tyr
465 470 475 480
Gln Tyr Ser Asn Gly Arg Lys Val Gly Met Ile Val Pro His Val Glu
485 490 495
Phe Tyr Lys Leu Leu Ser Arg Asp Ile Glu Lys Pro His Leu His Pro
500 505 510
Gln Leu Leu Pro Met Leu Val Thr Pro Lys Pro Trp Thr Ser Trp Ile
515 520 525
Asp Gly Gly Tyr Tyr Tyr Ser Arg Gln Pro Leu Val Arg Leu Lys Gly
530 535 540
Ala Leu Glu Gln Val Asp Tyr Leu Met Lys Ala Ser Glu Asn Gly Gln
545 550 555 560
Leu Asp Glu Leu Phe Lys Ala Val Ser Ser Leu Gly Lys Val Ser Trp
565 570 575
Arg Ile Asn Gln Arg Leu Phe Asn Val Leu Ile Arg Ile Trp Asn Ser
580 585 590
Gly Glu Lys Phe Leu Ser Ile Pro Pro Arg Glu Val Lys Cys Asp Met
595 600 605
Pro Pro Tyr Pro Lys Asn Ser Ile Asn Pro Arg Asp Lys Val Ile Trp
610 615 620
His Thr Arg Arg Lys Glu Leu Ala Ala Leu Lys Thr Gly Ala His Ser
625 630 635 640
Gln Arg Cys Asp Phe Asn Tyr Lys Leu Glu Ile Ala Arg Ala Phe Leu
645 650 655
Asn Glu Lys Phe Tyr Phe Pro His Ser Leu Asp Phe Arg Gly Arg Ala
660 665 670
Tyr Pro Leu Ser Ser His Leu His His Val Ser Asn Asp Val Cys Arg
675 680 685
Gly Leu Leu Glu Phe Ser Thr Gly Lys Pro Leu Gly Pro Lys Gly Leu
690 695 700
Asn Trp Leu Lys Val His Leu Ala Asn Leu Phe Gly Ile Ser Lys Lys
705 710 715 720
Asp Phe Ala Thr Arg Gln Ala Phe Val Asp Asp Asn Met Gln Glu Val
725 730 735
Phe Asp Ser Ala Asp Arg Pro Leu Asp Gly Asn Lys Trp Trp Ser Lys
740 745 750
Ala Asp Asp Pro Phe Gln Ala Leu Ala Ala Cys Phe Glu Ile Ala Glu
755 760 765
Ala Val Arg Ser Gly Asp His Glu Ser Tyr Ile Ser His Ile Pro Ile
770 775 780
Gln Gln Asp Gly Thr Cys Asn Gly Leu Gln His Tyr Ala Ala Leu Gly
785 790 795 800
Gly Asp Ile Glu Gly Ala Lys Gln Val Asn Leu Trp Pro Ser Asp His
805 810 815
Pro Ser Asp Val Tyr Glu Ala Val Ala Glu Ile Val Arg Gly Phe Leu
820 825 830
Lys Lys Asp Ala Glu Ala Gly Asp Glu Met Ala Asn Phe Leu Lys Asp
835 840 845
Lys Val Thr Arg Ser Val Val Lys Pro Thr Val Met Thr Asn Val Tyr
850 855 860
Gly Val Thr Tyr Val Gly Ala Arg Lys Gln Ile Ser Glu Lys Leu Glu
865 870 875 880
Asn Ile Asp Gly Met Glu Lys Leu Lys Val Ala Asp Tyr Ala Asn Tyr
885 890 895
Leu Thr Lys Lys Val Phe Glu Ala Leu Arg Ser Leu Phe Thr Gln Ala
900 905 910
His Glu Ile Gln Asp Trp Leu Ser Ala Cys Cys Asn Leu Ile Thr His
915 920 925
Ser Leu Pro Ala Asp Tyr Ile Lys Glu Gly Ile Lys Asp Glu Leu Thr
930 935 940
Pro Val Val Trp Thr Thr Leu Leu Asn Leu Pro Ile Val Gln Pro Tyr
945 950 955 960
Arg Asn Tyr Lys Ser Arg Gln Ile Arg Thr Asn Leu Gln Thr Val Phe
965 970 975
Ile Glu Glu Arg Asp Arg Thr Ala Thr Val Gln Pro His Lys Gln Ala
980 985 990
Thr Ala Phe Pro Pro Asn Phe Ile His Ser Leu Asp Ala Thr His Met
995 1000 1005
Phe Met Thr Cys Leu Lys Cys Ser Glu Gln Asn Ile Asn Phe Ala
1010 1015 1020
Ala Val His Asp Ser Tyr Trp Thr His Ala Cys Asp Val Asp Gln
1025 1030 1035
Met Asn Ser Leu Leu Arg Glu Ala Phe Val Leu Leu His Ser Asn
1040 1045 1050
Asn Ile Met Glu Arg Leu Lys Gln Glu Phe Glu Glu Arg Tyr Lys
1055 1060 1065
Gly Phe Leu Val Ser Lys Lys Ala Ile Lys Ala Asn Asp Glu Asp
1070 1075 1080
Leu Lys Ala Lys Phe Gly Asn Lys Ser Tyr Ile Pro Leu Glu Phe
1085 1090 1095
Pro Pro Leu Pro Ala Arg Gly Ala Leu Asp Leu Lys Lys Val Leu
1100 1105 1110
Glu Ser Lys Tyr Phe Phe Ser
1115 1120
<210>2
<211>3363
<212>DNA
<213>裂殖酵母
<400>2
atgcccattg aagcgtacga gccttataag aatgaactta aaagtaaaat tggaaaggat 60
ttcataatag acttgagtta caagtctggg actgctagtt tatttgaggc gtgcgtctac 120
aatggtgatt ttttacggtc taagcagctc cttaaaagtt ttattgatca taacaaaggt 180
gataaaatac tgttaccaat gattaattta tatatccgtg aaatcattca gcgtggatct 240
ttcgagttga ctgatgtcct gtcaaatgca aaagaactat tgcaacaggc aagactgaat 300
ggagattctt taacgtatgc tctactttgc caagcatcac ttaatccgac tcagcgccaa 360
cttggattac ccgtattaca cgaactaatt cacaattggc gttcagcaaa cggtaaagtt 420
atagatatct taatgcatga gtcagttttt tcgcccgaag aggtgaaact tattatggat 480
caacttaaca tacctataaa taattttact ccttctcaat tgcaattgct tggaatcact 540
aattctacaa ttgttggaga aagtgaaaat ggtaaagatc aaaatggtga ctcttccctg 600
aaagaaaagc aaccagacgt cgagactact gtaacaaaaa gtgcaaactt aaatgccctt 660
agaagttcac tctctagtct actgactgaa tccatagatt tgccgatcga tgaagtttct 720
ttagagtttg gaaatcaagg tgatacattc aacctcgcta gacagaagct tttagaaaaa 780
agcgcaattc tatcagctgc tgaagtttgg aagtcagaac atgaaagtgt tttaaatcga 840
ggtaatctgc aagtgccgaa aaatgtttcc tctttgttct atagttggta tgtacaactt 900
gaacaattgt tcaaagagga aatttccctc atagacgatt tagcattaaa tgaatctttg 960
gataagaaaa acgaccggtt aatttatggc ccgtttttaa agcttttatc ttccaagaag 1020
ctggcagcgc taacaataat ggaagtagca caattgtcta caaatcctcg atacgatcgt 1080
ggtgctcgtg ttacaacgtt actcggtgga ttaggtagaa gttttgagcg tgaatttttg 1140
tcggaacaaa ttcaaaggca agaaaaaaat aaaagctaca aggataagaa aagattaaaa 1200
gaattgttca acgatcctcg aaaatttcga caagcggtga agaatttacg tctttcaaat 1260
acaagggata atattgtttt aaatccaagt gttgatagtt ggccttctgc aatagtcatg 1320
aaagttggtt cagtcgctct ttgtcttttg ttaagtgttg caaaaattga agtaacagct 1380
aaggatttaa gcacgggcgg catattgaaa caggaagttg cagcgtttgt ccacacgtac 1440
caatattcta atggtaggaa agttgggatg attgttccgc atgtggaatt ttacaagctt 1500
ctttctcgtg atattgagaa gccgcaccta catcctcaat tgcttcctat gctagttacg 1560
ccaaagcctt ggactagttg gattgatggt ggttattatt atagccgcca accgctcgtc 1620
cgtttaaaag gtgcactgga gcaggtagat tacttaatga aggcttcaga aaatggacaa 1680
cttgatgaac tctttaaggc agtaagtagc cttggtaaag tttcatggcg tatcaatcaa 1740
cgacttttta atgttctaat taggatttgg aactctggag aaaaatttct ttctattcct 1800
ccgagagagg taaaatgcga tatgccgcct tatccaaaaa attcaataaa tcctcgtgat 1860
aaggtcattt ggcataccag aagaaaagag cttgctgcct taaaaacagg tgctcactct 1920
caaagatgtg actttaacta caaacttgag attgcacgag catttttaaa cgaaaaattt 1980
tattttcctc atagtttaga ttttcgcggt cgtgcatatc ctctaagttc tcatttgcat 2040
cacgtcagca acgatgtttg tcgtggtttg ctggagtttt cgacgggtaa accgttaggc 2100
ccaaaaggat taaattggct aaaagtccat cttgctaacc tcttcggaat cagcaagaaa 2160
gactttgcta cccgccaggc gtttgtcgat gacaatatgc aggaagtttt tgattctgct 2220
gatcgtcctc tggacggcaa taaatggtgg tcaaaagctg atgatccgtt tcaagctctt 2280
gctgcctgct ttgagatagc agaggcagta cgctctggtg atcatgaaag ttatatttcc 2340
catataccca tccagcaaga tggaacttgt aacggtctac aacattatgc cgctttaggt 2400
ggtgacattg aaggtgctaa gcaagtaaat ttatggccaa gtgaccaccc aagtgatgtt 2460
tatgaggcag ttgcagaaat tgtgcgtggg tttctaaaaa aggatgccga agcaggggac 2520
gaaatggcta atttcttaaa agacaaagtt accagaagtg tggtcaagcc tacggttatg 2580
actaatgttt atggtgtaac gtatgttgga gcccgcaaac aaatttccga aaagctggag 2640
aatattgatg gaatggaaaa gctgaaggtt gcggattacg ccaattattt gacgaaaaaa 2700
gtttttgaag ctcttcgttc tttatttacg caggctcatg aaattcaaga ttggctatcc 2760
gcttgttgta atctaattac tcactcatta ccagccgatt acataaaaga aggaatcaag 2820
gatgaactta ctccagtagt gtggacaacg cttctaaatt tgcctatagt acaaccatat 2880
cgtaattaca aatcccgcca aattcgtacc aacttacaga ctgtctttat tgaagaaaga 2940
gatagaacag caacagtaca accacacaaa caggccactg cttttcctcc taattttatt 3000
cactctttag atgcaacgca tatgtttatg acttgtttaa aatgtagcga acaaaacatt 3060
aactttgctg ctgttcatga ctcttattgg acacacgctt gtgatgttga tcaaatgaat 3120
agccttttgc gcgaagcatt tgtgttgttg cactcaaaca acattatgga aaggctaaaa 3180
caggagtttg aggagagata caaaggtttt ttagtttcga agaaggcgat caaagctaat 3240
gatgaagatt tgaaagctaa atttggtaat aaatcttata ttcctttgga atttccgcca 3300
ctgccggcga gaggtgcttt ggatttaaaa aaagttttgg agagtaagta ttttttctca 3360
taa 3363
<210>3
<211>366
<212>PRT
<213>裂殖酵母
<400>3
Met Lys Leu Pro Lys Ile Leu Tyr Asp Ala Ala Ala Phe Gly Gly Pro
1 5 10 15
Arg Ser Thr Gly Phe Val Lys Ile Leu Asn Leu Asn Gly Arg Ser Ser
20 25 30
Tyr Lys Ser Ser Tyr Leu Val Asn Gln Asn Leu Met Asp Glu Ala Leu
35 40 45
Val Lys Ser Asn Leu Leu Lys Glu Tyr Asn Ser Glu Lys Met Thr Ile
50 55 60
Leu Glu Met Ala Pro Gly Pro Gly Val Thr Thr Thr Ser Leu Phe Asn
65 70 75 80
Tyr Phe Gln Pro Lys Ser His Val Val Leu Glu Ser Arg Glu Val Phe
85 90 95
Ser Lys Pro Leu Gln Lys Leu Cys Thr Leu Ser Asp Gly Arg Ile Lys
100 105 110
Trp Val His Gln Asp Gly Tyr Tyr Trp Gln Thr Tyr Glu Asp Val Tyr
115 120 125
Val Ser Lys Val Leu Asp Pro Arg Ile Gln Thr Glu Glu Glu Gln Lys
130 135 140
Leu Ser Pro His Arg Glu Leu Leu Phe Phe Ala His Leu Pro His Gly
145 150 155 160
Tyr Ala Gly Leu Leu Phe Val Ser Gln Ile Leu Asp Phe Leu Ser Ala
165 170 175
Arg Asp Trp Leu Gly Ile Phe Gly Arg Val Arg Val Leu Leu Trp Leu
180 185 190
Pro Cys Ser Pro Thr Val Thr Leu Leu Gly Ser Arg Gly Phe Ser Lys
195 200 205
Arg Ser Lys Thr Ser Val Phe Arg Glu Ala Phe Thr Asp Ser Arg Val
210 215 220
Leu Ala Ala Ser Glu Ser Thr Leu Gln Lys Leu Cys Met Gly Tyr Ser
225 230 235 240
Lys Glu Ala Lys Glu Asn Tyr Gln Ile Ser Pro Asn Pro Leu Leu Val
245 250 255
Ser Pro Thr Pro Ile Thr Ser Glu Pro His Lys Glu Asp Leu Thr Leu
260 265 270
Val Glu Met Cys Ser Lys Pro Gln Asp Lys Gln Leu Ser Ile Pro Val
275 280 285
Phe Glu Ser Ile Val Arg Ile Leu Leu Thr Cys Lys Ala Thr Ser Leu
290 295 300
Ser Lys Ser Ile Tyr Tyr Leu Gly Pro Gly Ala Glu Thr Leu Leu Pro
305 310 315 320
Ser Phe Thr Gln Cys Gly Ile Asn Ile Asp Met Pro Val Gly Leu Leu
325 330 335
Ser Ala Ala Asp Phe Leu Thr Ile Ser Lys Ile Ile Gln Lys Tyr Pro
340 345 350
Phe Lys His His Leu His Leu Gly Thr Ile Ile Glu Asp Ser
355 360 365
<210>4
<211>1101
<212>DNA
<213>裂殖酵母
<400>4
atgaagcttc ctaaaatttt atatgacgca gctgcatttg gaggaccaag atccacgggg 60
tttgttaaga tattaaacct aaacggtcgt tcttcgtata agtcatcgta tcttgtgaat 120
cagaatttga tggatgaagc gcttgtgaaa agcaatctgc ttaaggaata caactcggag 180
aaaatgacta ttttagaaat ggcaccggga ccgggagtga ctaccacttc gctgttcaat 240
tacttccaac ctaaaagtca cgttgtgcta gaatcacggg aagttttttc caaaccttta 300
caaaaattgt gtacgctttc tgatggaagg attaagtggg tgcatcaaga tggttattat 360
tggcaaactt acgaagatgt gtacgtttcg aaggttttgg atcctcgtat tcaaacagaa 420
gaggagcaga agttatcacc acatcgcgaa cttttatttt ttgctcatct tcctcatggt 480
tatgccgggt tattatttgt ttctcaaatt ttagactttc tctcggcaag ggattggctt 540
ggcatttttg gaagagttcg tgtattgcta tggttgccct gttctcctac tgttactctt 600
cttggaagta ggggattttc aaaaagatcc aagacatcag ttttccgaga ggcctttaca 660
gactctcgtg tattagctgc ctccgagtca acattgcaaa aattatgtat ggggtatagt 720
aaagaggcca aggagaatta tcaaatttct ccaaatcctt tattagtttc acccacgcca 780
attactagtg aaccgcataa agaggacctt actttggttg aaatgtgctc caaaccacaa 840
gataaacaat tgtctattcc agtgtttgaa agcattgtta ggatactgtt gacatgtaaa 900
gcaacatcac tttcaaaatc catttattat ttaggcccag gtgcggaaac tctattaccc 960
tccttcaccc aatgtgggat taacatcgat atgcccgttg gactattgag tgcagccgac 1020
tttcttacca tttcaaaaat tatacaaaaa tatcctttca aacatcattt acatttgggt 1080
acaataattg aagattcata a 1101
<210>5
<211>1987
<212>DNA
<213>人工合成
<400>5
gatgataaac aagctcgcca tctctatact taagggcttg cattgtatgg aaagggcgca 60
attgccgtgc cctataagaa gaacttttga tttttcaaat gaattttaga tcttgaagtc 120
aggcgacaac agccaaaaca tcatctcatc tcattcattc aacaatgagg aatgggcgat 180
ttttcatcca gcgtttttat caggtcaatt gcgtcgatct cattgtacac caagatgatg 240
gatatgtaat gaagccagcc agtcggctta tgaaaatttt gctaattata agaaatcaat 300
tgcaagtaac agaaatgaga tggatcgctg catcaacaag gataatgaga tagacagata 360
aagtttgttg aaaattttca cgacagaaga aaatcactca actaatcaac tcaaaatgga 420
ataacatgga aatttatttc gccaaacagt gcagaagcca ctcaaaagtg aaatgagcaa 480
tggaggggag gaaggaaaga ttggttgatt tgctgtatca gatgaaattc atgggtgaat 540
gaaaaagaaa aaaaggtttg caagaggatg gatgagtgag attgaaaaaa tattagatct 600
cgaataaatt ctttctatcc atctttcata gtatacaatc gaaaacaaga tagaacacat 660
ccatgccatc catacttcta tctttttttt tctttctctc tctctctctc cccccctagc 720
attcctccaa caacctcttt ataaacgata tcctcttctc ttcccttcct acaccaatat 780
cctcctattt tgtctctgat gtcatgctga cctccaccca ctttacactt ttacctcgcc 840
attgcaccgt gtcgcttacc gcaaaacctc atcgagtcat ggatgcgcaa cgtcaccacc 900
atcgtaagcg aatacagagt tggaacgagc ggctcgcatg atgccaatga cgtacgttaa 960
cgaaggacgt caaagtaggc aaatccgccg acataaactt cttgtctttc gcataccacg 1020
attgttggac accaacaata tatttctgtg aaaatcaatt gaaaagctaa tttagtaatt 1080
ttttggagac tattggaagg gtacccagta ttggaaagtt atatgattct taaaaatgta 1140
cgtttgtaaa tgtttgctca ctcgttcgtg tgggtaatgt ttgagtcgga tttttgtttg 1200
gattgtggat gtaaacgcgg atattagagg ctggagatga gtatcggaaa gactttgcgt 1260
ttggagagtg ttgttgacgt tacacttcct acctttggac tgggttgggg atagggatct 1320
taggagagat aagtggacga atgaattagg acggttggac aatatcgagt cttggaagat 1380
tactgaattc taataaaaaa aaaagaaaag caagaagcga tttttttctt ttgtgttttt 1440
atttcatttt tattttcttt ccaagtctgt gactagtttt ttggactttt ttttggattt 1500
tttttttctt ctacgtcagg tgctttcata cggagatttg ctctttcctt gatgatcagt 1560
tttgatttca tctttacctt attctatatc acgtctcctt ccccttctgc taggcggtga 1620
ttgtatgctt gacttcattc tctacatcat tcaggtgacg ggtttcgctt tcaagtcgtt 1680
aagttaaatt tggcggatgc gcaagtgtat cttttttttc attctttttg tgcgaaattc 1740
cttttttttt tctttttttt ttcttttttc tatcatcttg tctctctgtt atcttggttt 1800
agttcaagag tacggatgcg gatagatcag tgtcaagaat ttggaagcaa atgtgttggc 1860
acatttccag acgtaaaacc aaacgactag agatctttaa ttagttattt ttctaataat 1920
acccatatct cttgattgat tccgtttgtc gccgtctgtt caaataatgc gttttaaagt 1980
atgtttg 1987
<210>6
<211>103
<212>DNA
<213>人工合成
<400>6
ctccaaacca caagataaac aattgtctat tccagtgttt gaaagcattg ttaggatact 60
gttgacatgt aaagcaacat ccgctgcagg tcgacggatc ccc 103
<210>7
<21l>107
<212>DNA
<213>人工合成
<400>7
atcgatgtta atcccacatt gggtgaagga gggtaataga gtttccgcac ctgggcctaa 60
ataataaatg gattttgaaa gtggccgcat aggccactag tggatct 107
<210>8
<211>104
<212>DNA
<213>人工合成
<400>8
actttcttac catttcaaaa attatacaaa aatatccttt caaacatcat ttacatttgg 60
gtacaataat tgaagattca tacgctgcag gtcgacggat cccc 104
<210>9
<211>105
<212>DNA
<213>人工合成
<400>9
caaaattact ggatgcaaag aaatgcgtgt atgaacaaaa acaatcaata cgtttgtttc 60
ccccaatttt ctgtaaattt ggccgcatag gccactagtg gatct 105