技术领域
本发明涉及基因技术领域,具体地说是一种双基因共表达重组载体及其构建方法和在丝状真菌三孢布拉霉中的应用。
背景技术
常规转基因多是利用单个目的基因改良生物的个别性状,但单个目的基因的转化不能满足生物改良的需要,尤其是对一些代谢途径或数量性状的遗传修饰。随着基因工程和分子生物学研究的深入,多基因转化研究应运而生,并迅速发展。
生物遗传转化多基因共表达系统通常包括多质粒共转化系统和单个载体表达多个基因表达盒系统。在多质粒共转化系统中,是将多个外源基因分别克隆至不同的抗性载体中,共转化后同时添加多种抗生素实现多基因的共表达,由于受到抗性标记种类及组合方式的限制,这种系统仅能实现少数几个基因的共表达。此外,共表达时,还需要考虑多个表达质粒的相容性,操作起来也比较麻烦,且转化效率不高。可见,单个载体表达多个基因表达盒系统更具研究和应用价值。
基因表达载体是指实施了目的基因,并且保证目的基因到达受体细胞能够表达的运载体,基因表达载体的构成是在运载体的基础上构建的,基因表达载体所必须具备的组成是启动子+目的基因+终止子+标记基因。多基因表达载体即可用于多个基因插入,能让多个目的基因到达受体细胞并表达的载体。
基因表达载体的构建是基因工程的核心,是将目的基因与运载体结合的过程,实际上是不同来源的DNA重新组合的过程。通常是以分子遗传学为理论基础,以分子生物学和微生物学的现代方法为手段,将不同来源的基因按预先设计的蓝图,在体外构建杂种DNA分子,然后导入活细胞,以改变生物原有的遗传特性、获得新品种、生产新产品。该过程如果以质粒作为运载体,首先要用一定的限制酶切割质粒,使质粒出现一个缺口,露出黏性末端;然后用同一种限制酶切断目的基因,使其产生相同的黏性末端(部分限制性内切酶可切割出平末端,拥有相同效果);将切下的目的基因的片段插入质粒的切口处,首先碱基互补配对结合,两个黏性末端吻合在一起,碱基之间形成氢键,再加入适量DNA连接酶,催化两条DNA链之间形成磷酸二酯键,从而将相邻的脱氧核糖核酸连接起来,形成一个重组DNA分子。如人的胰岛素 基因就是通过这种方法与大肠杆菌中的质粒DNA分子结合,形成重组DNA分子(也叫重组质粒)的。
目前,基因工程领域内所构建的表达载体多为原核和植物表达载体,如PUC-T为经常用到的原核表达载体,但是不适合真核生物,而且常用的植物表达载体如PBI121、PBI221等在真菌中使用也受到一定的局限性。此外,技术人员通常想要外源基因表达时需选择合适的酶切位点借助酶切连接进行外源基因的插入使其转化宿主得以表达。而现有技术中,本领域对于丝状真菌表达载体构建的研究较少,尤其专门针对于三孢布拉霉基因表达载体的构建更是鲜有报道。
三孢布拉霉属于霜霉目、白锈科,拉丁名是Blakeslea trispora,是目前大规模工业化生产天然β-胡萝卜素的主要菌种。该菌在使用过程中常需要对其进行遗传修饰,其过程基本为:(1)扩增所需插入片段,(2)做T载体克隆进行酶切,(3)通过酶切连接进行载体的构建。如,对三孢布拉霉进行修饰时常用的载体中有PCAMBIAI1303,所用启动子为CaMV35S promoter,由于质粒上仅含有一个多克隆位点,其不能将PCR产物直接用于连接。又如,李继刚等研究了丝状真菌转化载体的改进(河南农业科学,2013年05期),报道了pATZ、pTBZ的构建过程,通过酶切连接所改进的载体含有抗性标记和多克隆位点,但是,如果想要实现外源基因的表达,也需通过酶切连接的方式加上启动子,终止子和相应的目的基因,而且在插入目标基因时,很难找到合适的酶切位点,而且有些酶活性较低,会给操作带来很大麻烦。再如,CN1759174A公开了遗传修饰布拉霉属生物的方法、相应的生物及其用途,利用pBinA载体构建了pBinAHygR载体,该载体含有潮霉素抗性和一个介于启动子和终止子之间的多克隆位点,选择合适的酶切位点利用酶切连接的方式可在多克隆位点处插入任意一个基因,构建好要表达的载体,然后运用农杆菌介导的方式,转化三孢布拉霉中的至少一个细胞,通过诱变等方式进行同核转变,使一个或多个细胞都获得一样的遗传性状,以使其得到稳定遗传,但是,其仅限于加入单个基因,如果想表达多个基因还需加入多个启动子,则需多次借助外源载体进行连接,或通过共转化才能得以实现,其不仅操作过程繁琐复杂,而且容易导致基因表达量不一致、反义失活以及遗传不稳定;此外,对插入含有多个酶切位点的长片段目标基因也造成一定困难。
发明内容
本发明的目的就是提供一种双基因共表达重组载体及其构建方法和在三孢布拉霉中的应用,以解决现有的表达载体所存在表达两个以上基因时需要进行多次外源基因的整合,操作繁琐,以及基因表达量不一致、反义失活以及遗传不稳定等问题。
本发明的目的是通过以下技术方案实现的:
一种双基因共表达重组载体,以初始载体为骨架携带有完整的基因表达框序列syn,所述序列syn含有:终止子序列(Ter)—多克隆位点(MCS)—双向启动子序列PCarB—TA克隆制备序列—终止子序列(Ter),该基因syn的核苷酸序列如SEQ ID NO:1所示;
其中终止子(Ter)、多克隆位点(MCS)、双向启动子PCarB、TA克隆位点、终止子(Ter)各自的分子量大小依次为559bp、43bp、610bp、28bp、559bp,在核苷酸序列SEQ.ID.NO:1上从前到后依次排列。
所述初始载体为pATZ、pPZP100、pPZP101、pPZP102、pPZP111、pPZP112、pPZP121、pPZP122、pPZP200、pPZP201、pPZP202、pPZP211、pPZP212、pPZP221或pPZP222中的任意一种;优选为pATZ。
本发明构建了一种丝状真菌表达一个或同时表达两个外源基因的重组载体,通过在双向启动子一侧加入多克隆位点,另一侧加入TA克隆,使外源基因的导入操作更方便快捷;通过在丝状真菌三孢布拉霉的应用实验证明,在重组载体上同时添加上两个目标基因,并通过农杆菌介导可以整合到三孢布拉霉基因组中,以单拷贝插入,稳定遗传。
本发明提供的双基因共表达重组载体在所述载体中还携带有潮霉素抗性基因hygR,可作为重组子筛选的标记基因,所述潮霉素抗性基因hygR的核苷酸序列如SEQ.ID.NO:2所示。
本发明还提供了一种双基因共表达重组载体pPMPT,以初始载体pATZ为骨架携带有基因表达框序列syn,并以潮霉素抗性基因hygR作为筛选标记基因,所述基因表达框序列syn含有:终止子序列(Ter)—多克隆位点(MCS)—双向启动子序列PCarB—TA克隆制备序列—终止子序列(Ter),其核苷酸序列如SEQ ID NO:1所示;所述潮霉素抗性基因hygR的核苷酸序列如SEQ.ID.NO:2所示;其质粒图谱为:
所述重组载体pPMPT的核苷酸序列如SEQ ID NO:3所示。
本发明提供的双基因共表达重组载体pPMPT的构建方法,包括以下步骤:
(a)按照如SEQ ID NO:1所示的核苷酸序列人工合成完整的基因表达框序列syn,并克隆于载体pMD19-T中,得质粒pMD19-T-syn;
(b)扩增潮霉素抗性基因hygR,将其克隆于载体pMD19-T中,得质粒pMD19-T-hygR;
(c)将所述质粒pMD19-T-hygR和质粒pMD19-T-syn分别以SalⅠ限制性内切酶进行酶切,回收酶切产物pMD19-T-hygR和syn两片段,16℃连接过夜,得pMD19-T-hygR-syn;
(d)将pMD19-T-hygR-syn和初始载体pATZ分别以BssHⅡ和HindⅢ限制性内切酶双酶切,回收酶切产物hygR-syn片段和质粒pATZ酶切后剩余的含有T-DNA的部分,将回收的两个片段在16℃下连接过夜,连接产物转化大肠杆菌DH5α,得到质粒pATZ-hygR-syn,命名为重组载体pPMPT。
构建过程如图15所示。
本发明公开的重组载体pPMPT中完整的基因表达框序列syn为人工合成的一段序列,其包括:终止子序列(Ter)—多克隆位点(MCS)—双向启动子序列PCarB—TA克隆制备序列(AhdⅠ,SpeⅠ,AhdⅠ)—终止子序列(Ter),合成该序列时上游引物5'端添加SalⅠ酶切位点,下游引物3'端依次添加HindⅢ和SalⅠ酶切位点。
其始末两个终止子序列均来自构巢曲霉中的trpC terminator,在丝状真菌和植物中具有终止功能,其大小为559bp,位于基因表达框序列syn中的始端和末端。在最终构建好的载体序列SEQ ID NO:3中的信息为:
Ter 9034-9592 559 misc feature
Ter 10274-10832 559 misc feature
其多克隆位点(MCS)所含有的限制性内切酶依次为XbaⅠ,BstEⅡ,SacⅠ,KpnⅠ,SmaⅠ,MfeⅠ,BglⅡ,可通过酶切连接的方式根据需要加入要表达的外源基因片段,由于前后两端含有相应的启动子和终止子,故若插入为正向则可直接表达;克隆位点(MCS)大小为43bp,在完整的基因表达框序列syn中的第560位到第602位,在最终构建好的载体中序列信息为:
MCS 9593-9635 43 misc feature
其双向启动子PCarB序列来源为三孢布拉霉中启动八氢番茄红素脱氢酶基因(carB)和番茄红素环化酶基因(carRA)的启动子序列。该启动子具有双向启动功能,可启动其上游和下游基因序列的表达,其分子量大小为610bp,在基因syn中的第603位到第1212位,在最终构建好的载体中序列信息:
PCarB 9636-10245 610 misc feature
其TA克隆制备序列,本载体中TA克隆的制备时采用酶切的方式直接制备,其分子量大小为28bp,在基因syn中的第1213位到1240位,在最终构建好的载体中序列信息:
TA 克隆 10246-10273 28 misc feature
将以上碱基片段人工合成,命名为基因表达框序列syn,本发明中该人工片段由金唯智生物科技有限公司合成,且由puc57载体携带,即质粒puc57-syn。
本发明步骤(d)中初始载体pATZ的构建方法见“丝状真菌转化载体的改进”(李继刚等,《河南农业学报》,2013,42(5):110-113)。
本发明对构建的重组载体pPMPT在三孢布拉霉中的适用性进行了验证。通过BglⅡ和XbaⅠ将外源基因neoR导入质粒pPMPT的多克隆位点(MCS),通过TA克隆将外源基因crtZ导入质粒pPMPT的TA克隆位点,将所构建质粒以农杆菌介导的方法转化三孢布拉霉进行验证外源基因整合到基因组中是否能够正常表达及稳定遗传。将转化子在潮霉素抗性板上进行4-5 次传代,挑取最终抗性板上生长的三孢布拉霉进行DNA提取,扩增潮霉素抗性基因以及插入的外源基因neoR和crtZ,验证外源基因是否整合到了三孢布拉霉的基因组中,进而通过新霉素抗性试验以检测外源基因新霉素抗性基因(neoR)是否表达;通过发酵三孢布拉霉并提取发酵产物中的色素物质进行HPLC分析以检测外源基因crtZ是否表达。crtZ基因能表达β-胡萝卜素羟化酶,可将三孢布拉霉的终产物β-胡萝卜素进一步转变为玉米黄质。经HPLC分析,三孢布拉霉转化子的发酵产物中检测到了玉米黄质的存在。因此,我们得到了抗新霉素且积累玉米黄质的三孢布拉霉工程菌株,并可通过无性孢子稳定遗传下去,证明了该重组载体将两个目标基因转入三孢布拉霉实现外源基因共表达的目的和用途。
本发明构建的载体是在一个双元Ti载体pATZ的基础上进行的改造,对载体pATZ的序列进行分析,首先人工合成一段完整的基因表达框序列syn,这段合成的序列包含终止子序列(Ter)—多克隆位点(MCS)—双向启动子序列PCarB—TA克隆制备序列—终止子序列(Ter),利用酶切连接的方法,将syn序列和潮霉素抗性表达盒插入两个T-DNA区之间,最终构建了重组载体pPMPT。该载体由于含有双向启动子,并在双向启动子两侧分别加入TA克隆和多克隆位点,这样不管在TA克隆处还是多克隆位点处都可以添加外源表达基因片段,而且该载体中转化丝状真菌尤其是三孢布拉霉进行同核转变后,可比较轻松地实现单个外源基因或两个相关或不相关的外源基因同时在丝状真菌中的表达,也省去了寻找适当启动子并进行添加的过程。同时本发明还具有以下优点:
1、本发明所构建的重组载体克服了在真核基因中实现双基因共表达时需要加入特定位点或在第二个基因前再加上一个启动子等繁琐工作的缺点;
2、能够避免因相似启动子同时加入导致同源重组引起的基因反式失活现象的发生;
3、该重组载体含有多克隆位点,可借助酶切连接对不同基因片段进行插入,使表达盒的组装非常便捷;
4、该载体可以通过AhdⅠ内切酶的酶切消化,载体可产生TA克隆位点,故可对PCR产物直接进行连接,特别是对于一些含有较多限制性内切酶位点的外源基因片段,在进行酶切连接时经常找不到合适的酶切位点,这种含T的载体便显得更重要,操作更方便;
5、该载体含有两个T-DNA边界,可使用农杆菌介导的方法进行转化,提高转化效率,含有的潮霉素抗性可用于筛选阳性克隆子。
通过实验证明,本发明构建的重组载体通过插入neoR基因和crtZ基因的编码区序列,转入三孢布拉霉后,得到了具有新霉素抗性并能表达玉米黄质的三孢布拉霉工程菌株,而且其遗传的稳定性良好,证明了重组载体pPMPT对三孢布拉霉进行外源基因的导入具有非常好的适 用性,同时,此载体在其他丝状真菌中也具有应用潜力。
附图说明
图1为人工合成的完整基因表达框序列syn的酶切回收图谱;图中M为500bp DNA Ladder(北京溪洋汇智),1为syn。
图2为潮霉素抗性基因hygR表达盒的扩增电泳图谱;图中M1为DL5,000DNA Maker(大连宝生物),6为hygR的整个表达盒。
图3为潮霉素抗性基因hygR表达盒的阳性克隆扩增检测验证;图中M2为500bp DNA Ladder(北京溪洋汇智),3为hygR的整个表达盒。
图4为扩增验证的正向连接的pMD19-T-hygR-syn的电泳图谱;图中M3为DL5,000DNA Maker(大连宝生物),4和5均为hygR-syn片段。
图5为扩增验证的阳性克隆pATZ-hygR-syn的电泳图谱;图中M4为DL5,000DNA Maker(大连宝生物),7为hygR-syn片段。
图6为新霉素抗性基因neoR扩增的凝胶电泳图谱;图中M5为DL5,000DNA Maker(大连宝生物),8和9为不含启动子的新霉素抗性基因neoR,长度为816bp。
图7为pPMPT质粒和含新霉素抗性基因neoR的T载体用BglⅡ和XbaⅠ进行双酶切酶切回收检测的电泳图谱;图中M6为500bp DNA Ladder(北京溪洋汇智),10为pPMPT酶切回收所得片段,长度为11161bp,11为neoR片段,长度为816bp。
图8为pPMPT-neoR中新霉素抗性基因neoR阳性扩增验证电泳图;图中M7为DL5,000DNA Maker(大连宝生物),12和13均为neoR,长度为816bp。
图9为噬夏孢欧文氏菌中crtZ基因扩增电泳图;图中M8为DL5,000DNA Maker(大连宝生物),14和15均为crtZ基因,长度为528bp。
图10为pPMPT-neoR-crtZ中crtZ基因的连接扩增验证电泳图;图中M9为DL5,000DNA Maker(大连宝生物),16为crtZ基因,长度为528bp。
图11为用验证引物扩增pPMPT-neoR-crtZ中的正向连接片段的扩增验证图;图中M10为DL5,000DNA Maker(大连宝生物),17、18和19均为正向连接,长度为1971bp。
图12为转化后DNA扩增验证电泳图;图中M11为DL5,000DNA Maker(大连宝生物),20为阳性转化,长度为1971bp。
图13为玉米黄质标准品高效液相色谱图。
图14为玉米黄质待测样品高效液相色谱图。
图15为双基因共表达重组载体的构建流程图。
具体实施方式
下面实施例用于进一步详细说明本发明,但不以任何形式限制本发明。
本发明中的专业术语:
载体:指用于将外源DNA导入并根据需要在细胞中增殖所述外源DNA的DNA分子(也见Rompp Lexikon chemie CD ROM2.0版本,Stuttgart/New York:Georg Thieme Verlag 1999中的“载体”)在本申请中也意指包括质粒、粘粒等相同用途的分子。
双元Ti载体:指含有两个T-DNA独立区域并能在大肠杆菌和农杆菌中复制的穿梭质粒。
表达:是指转移从DNA到RNA到基因产物(这里优指类胡萝卜素)的遗传信息。
遗传信息:优指导入三孢布拉霉并导致三孢布拉霉遗传修饰的核酸,即,列如导致与起始生物相比增高或降低酶活性的核酸。
野生型:指相应的未经遗传修饰的三孢布拉霉起始生物。
生物:是指三孢布拉霉起始生物(野生型)和三孢布拉霉的经遗传修饰生物或两者兼指。插入:是指将外源核酸加入到载体中。
反式失活:指反式失活主要是由于拥有同源序列的沉默位点和其它位点的DNA的相互作用而引起的基因沉默,Vaucheret等的研究表明:启动子区域只要有90bp的序列同源,即可使两个基因间产生反式失活。
整合:指两个非同源基因连接起来,如加入到载体中的外源片段随机插入到受体的基因组中。
实施例1构建双基因共表达载体
(1)人工合成基因表达框序列syn:终止子序列(Ter)—多克隆位点(MCS)—双向启动子序列PCarB—TA克隆制备序列—终止子序列(Ter),合成该序列时上游添加SalⅠ酶切位点,下游添加HindⅢ和SalⅠ酶切位点。
其始末两个终止子(Ter)序列均来自构巢曲霉中的trpC terminator,在丝状真菌和植物中具有终止功能,其大小均为559bp,位于序列syn中的始端和末端。在最终构建好的载体序列SEQ ID NO:3中的信息为:
Ter 9034-9592 559 misc feature
Ter 10274-10832 559 misc feature
其多克隆位点(MCS)所含有的限制性内切酶依次为XbaⅠ,BstEⅡ,SacⅠ,KpnⅠ,SmaⅠ,MfeⅠ,BglⅡ,可通过酶切连接的方式根据需要加入要表达的片段,由于前后两端含有相应的启动子和终止子,故若插入为正向则可直接表达;其大小为43bp,在序列syn中的第560位到第602位,在最终构建好的载体中序列信息为:
MCS 9593-9635 43 misc feature
其双向启动子(PCarB)序列来源为三孢布拉霉中启动八氢番茄红素脱氢酶基因(carB)和番茄红素环化酶基因(carRA)的启动子序列。该启动子具有双向启动功能,可启动其上游和下游基因序列的表达,其分子量大小为610bp,在序列syn中的第603位到第1212位,在最终构建好的载体中序列信息:
双向启动子PCarB 9636-10245 610 misc feature
其TA克隆制备序列,本载体中TA克隆的制备时采用酶切的方式直接制备,该序列中包括两个AhdⅠ酶切位点,两个AhdⅠ位点之间引入SpeⅠ酶切位点,其引入SpeⅠ酶切位点的好处:①经SpeⅠ酶切后可以防止载体中的AhdⅠ位点不完全酶切造成的环化。②两个AhdⅠ酶切位点之间,提供保护碱基,便于AhdⅠ的酶切,从而形成效率高的T末端。质粒经AhdⅠ酶切后可以产生T末端,可将带有polyA的PCR产物直接加入,其分子量大小为28bp,在基因syn中的第1213位到1240位,在最终构建好的载体中序列信息:
TA克隆位点 10246-10273 28 misc feature
将以上碱基片段人工合成序列syn,本发明中该人工片段由金唯智生物科技有限公司合成,且由pMD19-T载体携带,即质粒pMD19-T-syn。
将合成的质粒pMD19-T-syn用SalⅠ酶切后,合成序列酶切回收检测图谱如图1所示。
(2)以构建好的Ti载体pATZ扩增得到潮霉素抗性基因:设计引物(F1,R1)扩增含有潮霉素的表达盒,潮霉素引物分别含有酶切位点BssHⅡ和酶切位点SalⅠ,扩增出的大小为2120bp的潮霉素抗性基因hygR,电泳图谱如图2所示,序列见SEQ ID NO:2。
其中Ti载体pATZ构建方法见《丝状真菌转化载体的改进》(李继刚.2013年)一文记载。
设计引物序列为:
F1:GTCGACGTCTTCTACTATAACTTCCTC
R1:GCGCGCTTTCTTCCTAATGGAGAT
潮霉素抗性基因(hygR)扩增体系如下:
扩增条件:94℃预变性5min;94℃变性30s;57℃退火30s;72℃延伸3min,30个循环;72℃后延伸5min。PCR产物用1.5%的琼脂糖凝胶电泳检测。扩增出的产物包含TtrpC、HygR、PtrpC,其序列见SEQ ID NO:2。
该段序列在最终构建好的载体中的序列信息为:
TtrpC 6908-7466 559 misc feature
HygR 7641-8666 1026 misc feature
/gene =aph(4)-Ia
/product =aminoglycoside phosphotransferase from E.Coli
/note =confers resistance to hygR romycin
/translation
=MKKPELTATSVEKFLIEKFDSVSDLMQLSEGEESRAFSFDVGGRGYVLRVNSCADGFYKDRYVYRHFASAALPIPEVLDIGEFSESLTYCISRRAQGVTLQDLPETELPAVLQPVAEAMDAIAAADLSQTSGFGPFGPQGIGQYTTWRDFICAIADPHVYHWQTVMDDTVSASVAQALDELMLWAEDCPEVRHLVHADFGSNNVLTDNGRITAVIDWSEAMFGDSQYEVANIFFWRPWLACMEQQTRYFERRHPELAGSPRLRAYMLRIGLDQLYQSLVDGNFDDAAWAQGRCDAIVRSGAGTVGRTQIARRSAAVWTDGCVEVLADSGNRRPSTRPRAKE
341amino acids=38.0kDa
PtrpC 8671-9028 358 misc feature
(3)将步骤(2)中扩增的潮霉素抗性基因hygR与pMD-19-T(simple)载体在16℃恒温金属浴中连接过夜;筛选阳性克隆。用M13引物扩增验证阳性克隆子,得pMD19-T-hygR,其扩增电泳图谱如图3所示。
(4)将步骤(3)中筛选的阳性克隆质粒pMD19-T-hygR和步骤(1)中的质粒pMD19-T-syn分别以SalⅠ限制性内切酶进行酶切,回收酶切产物pMD19-T-hygR和syn两片段,再将pMD19-T-hygR和syn在16℃下连接过夜;并设计引物(F3,R3)扩增验证选择正向连接的克隆,如图4所示,得pMD19-T-hygR-syn。
引物序列为:
F3:GCACTCTTTGCTGCTTGGA
R3:GCTACTTACACACAGGACATC
正向连接扩增体系如下:
扩增条件:94℃预变性5min;94℃变性30s;57℃退火30s;72℃延伸4min,30个循环;72℃后延伸5min。PCR产物用1.5%的琼脂糖凝胶电泳检测。
(5)将pATZ质粒和步骤(4)得到的正向连接的克隆pMD19-T-hygR-syn分别用BssHⅡ和HindⅢ双酶切,酶切产物回收hygR-syn、质粒pATZ酶切后剩余的含有T-DNA的部分,将回收的两个片段16℃连接过夜,用步骤(4)中的引物(F3、R3)进行扩增验证是否正确连接,筛选阳性克隆,得到阳性克隆质粒pATZ-hygR-syn即为双基因共表达重组载体pPMPT。其筛选阳性克隆的扩增程序如步骤(4),扩增电泳结果如图5所示。
实施例2重组载体的应用
本实施例中将实施例1中构建的载体pPMPT插入两个基因:基因neoR(见SEQ ID NO:4)和基因crtZ(见SEQ ID NO:5);转化后进行验证是否转化成功并可以稳定遗传,可以将其在新霉素抗性(neoR)板上进行4-5次传代,挑取最终抗性板上生长的三孢布拉霉进行DNA提取,扩增质粒pPMPT中含有的潮霉素抗性基因以及插入的neoR基因和crtZ基因进行验证。
分别在pet-28a质粒和噬夏孢欧文氏菌中扩增一个带有自主复制子但缺失自身启动子的新霉素抗性基因neoR和crtZ基因,crtZ基因能表达β-胡萝卜素羟化酶,将三孢布拉霉的终产物β-胡萝卜素转变为玉米黄质,将这两段基因插入到已构建质粒pPMPT中,得到pPMPT-neoR-crtZ质粒,通过农杆菌介导法转化,对再新霉素抗性平板上生长的三孢布拉霉进行色素的提取,经HPLC检测,发现表达玉米黄质,即得到了抗新霉素且表达玉米黄质的三孢布拉霉菌株,并表现稳定,可通过孢子无性繁殖稳定遗传下去,证明了该质粒的功能。
具体过程如下:
(1)抑制农杆菌生长所需头孢噻肟钠的浓度确定
吸取100μL培养过夜的农杆菌,涂布在浓度梯度为0、50、100、150、200μg/mL的头孢噻肟钠抗性平板上,每个梯度做三个平行,培养三天发现,随头孢噻肟钠浓度的提高,农杆菌生长也变得微弱,当达到50μg/mL时,农杆菌基本不长。
(2)三孢布拉霉对新霉素和头孢噻肟钠抗性筛选浓度的确定
将三孢布拉霉制成孢子悬液,取200μL涂布在不同浓度梯度的新霉素和头孢噻肟钠抗性平板上,新霉素和头孢噻肟钠浓度梯度均设为0、50、100、150、200μg/mL,观察三孢布拉霉生长状况,发现新霉素浓度达到200μg/mL时,三孢布拉霉彻底生长,头孢噻肟钠浓度达到200μg/mL时,仍生长良好,所以确定的最终的新霉素筛选浓度为200μg/mL,头孢噻肟钠浓度为100μg/mL。
(3)构建pPMPT-neoR质粒
首先,从pet-28a中扩增新霉素抗性基因,扩增图谱如图6所示。
设计引物时分别在上游和下游两端加上限制性酶切位点BglⅡ和XbaⅠ,扩增引物序列为:
F4:AGATCTATGAGCCATATTCAACGGG
R4:TCTAGATTAGAAAAACTCATCGAGCA
新霉素抗性基因(neoR)扩增体系如下:
扩增条件:94℃预变性5min;94℃变性30s;58℃退火30s;72℃延伸1min,30个循环;72℃后延伸5min。PCR产物用1.5%的琼脂糖凝胶电泳检测。
将扩增的新霉素抗性基因按一定比例和T载体连接过夜,转化大肠杆菌,挑取克隆子进行验证。
对阳性克隆子进行培养过夜,提取质粒,做酶切,分别将该质粒和pPMPT质粒用bglⅡ和XbaⅠ进行双酶切。酶切回收图谱如图7所示。
按照一定比例将回收产物进行连接过夜,用氯霉素作为抗性筛选标记,挑取阳性克隆子,用新霉素引物进行扩增验证。
新霉素抗性基因(neoR)扩增体系如下:
扩增条件:94℃预变性5min;94℃变性30s;57℃~60℃退火30s;72℃延伸1min,30个循环;72℃后延伸5min。PCR产物用1.5%的琼脂糖凝胶电泳检测。扩增图谱如图8所示。
(4)构建pPMPT-neoR-crtZ质粒
直接扩增crtZ序列,设计引物序列如下:
F5:5’-AAGCTTATGTTGTGGATTTGG-3’
R5:5’-AAGCTTAGGATCCTTACTTCCCG-3’
crtZ基因的扩增体系如下:
扩增条件:94℃预变性5min;94℃变性30s;57℃~60℃退火30s;72℃延伸1min,30个循环;72℃后延伸5min。PCR产物用1.5%的琼脂糖凝胶电泳检测。扩增图谱如图9所示。
对(3)中所构建的pPMPT-neoR质粒用AhdⅠ酶切,使其形成线性T末端,直接与crtZ基因的扩增产物连接过夜,转化大肠杆菌,用氯霉素作为抗性筛选标记,得到pPMPT-neoR-crtZ质粒,用引物(F5和R5)扩增检测筛选阳性克隆子。
crtZ基因(crtZ)扩增体系和扩增程序如上。其检测图谱如图10所示。
用neoR下游引物和crtZ基因的下游引物,对阳性克隆子进行扩增,验证和筛选crtZ基因连接正反向。扩增检测图谱如图11所示。
正向连接扩增体系如下:
扩增条件:94℃预变性5min;94℃变性30s;57℃~60℃退火30s;72℃延伸2min,30个循环;72℃后延伸5min。PCR产物用1.5%的琼脂糖凝胶电泳检测。
将构建好的pPMPT-neoR-crtZ质粒转化至农杆菌,用农杆菌介导的方法转化三孢布拉霉,在转化时用到的抗性筛选标记是新霉素抗性筛选标记,挑取在抗性平板上生长的阳性转化子,进行DNA的提取,扩增新霉素抗性基因,检测是否转化成功。
扩增检测图谱如图12所示。
对转化后的三孢布拉霉进行发酵,发酵大概7天,对发酵产物进行冷冻干燥、研磨、抽提等一系列处理,得到所要的色素,经HPLC检测,发现了玉米黄质的存在。
玉米黄质标准品及待测样品高效液相色谱图如图13和图14所示。
以上所插入的neoR和crtZ基因分别都可以替换成任意想要表达的基因,来得到目的产物,从而来实现该质粒的功能。由此可见,本发明可以同时表达两个以上的基因,且无需添加启动子以及进行多次外源基因的整合,操作工艺简单,基因表达量一致,未发生反义失活等问题,遗传较为稳定。
本发明中的TA克隆位点处在改造不同的载体时两个AhdⅠ酶切位点选择性的同时换成XcmⅠ,BciⅥ,BmrⅠ,HphⅠ,Hpy188Ⅰ,HpyCH4Ⅲ,MboⅡ,MnlⅠ酶切位点均可制备T末端,来用于PCR产物的直接连接。
SEQUENCE LISTING
<110> 河北大学
<120> 一种双基因共表达重组载体及其构建方法和应用
<130>
<160> 5
<170> PatentIn version 3.3
<210> 1
<211> 1799
<212> DNA
<213> 基因表达框序列syn
<400> 1
aaagaaggat tacctctaaa caagtgtacc tgtgcattct gggtaaacga ctcataggag 60
agttgtaaaa aagtttcggc cggcgtattg ggtgttacgg agcattcact aggcaaccat 120
ggttactatt gtataccatc ttagtaggaa tgatttcgag gtttatacct acgatgaatg 180
tgtgtcctgt aggcttgaga gttcaaggaa gaaacatgca attatctttg cgaacccagg 240
gctggtgacg gaattttcat agtcaagcta tcagagtaaa gaagaggagc atgtcaaagt 300
acaattagag acaaatatat agtcgcgtgg agccaagagc ggattcctca gtctcgtagg 360
tctcttgacg accgttgatc tgcttgatct cgtctcccga aaatgaaaat agctctgcta 420
agctattctt ctcttcgccg gagcctgaag gcgttactag gttgcagtca atgcattaat 480
gcattgcaga tgagctgtat ctggaagagg taaacccgaa aacgcgtttt attcttgttg 540
acatggagct attaaatcat ctagaggtca ccgagctcgg tacccccggg caattgagat 600
ctgagattaa aatagataag gaaaagaaag tgaaaagaaa ttcggaagca tggcacattc 660
ttctttttat aaatacatgc ctgactttct ttttccatcg atatgatata tgcatatgat 720
agatatacaa gcaatcttct tcaaggagtt tgaaattttg tcctccagga gcaaaaaaaa 780
gttttttttt atacatgttt gtacacaaga atagttacca atttgctttg gtcttacgtg 840
ctgcaagttt atatcgtttt caatttcttt gtctttacat tttctttgtc ctttatcttt 900
cctcatttag tctttgggag aattaggaaa agggagcgga aaggtaagaa atgcttgcgt 960
attttactaa ttcggcaaac atccaatttg gcaaacagca gcctgtgcaa cgctctcgag 1020
atgacagtat ctttgattac actctaaatc tcgatgaccc gaccaaaaag agcgaacaaa 1080
gaaataatct tgtgcattcg aatatgatgg aagatttttt cccccttatt ctaaatgttg 1140
acatagcgtg tatgttatat aaacaaaaag aaattgtaca aactttcttt tcttctcttt 1200
ttattttatc tcgactctgg gtcactagtg acccagagtc actaaattat cgaggtacag 1260
ttgttcttat tttgcgcaaa agcccaaatg gagaaggtct atgtcgagta gacgttacgt 1320
aattacgtaa ctgacgttgg atcattgcgg aagtccgagg ccgcttctct tcttatcgaa 1380
tcgtctcgat aaaagtaaaa gccctctgct ctagttcgtc tagttgccag cagttctctg 1440
gatgctctga ctccttaggc gagaaccgag gtgcgctgat atataaacag agattaacat 1500
gaaactgtac gaggagaaga aatgagacta tcgaactgat acttttaagg cagtggtcgg 1560
gacccaagcg tttctattaa cgtacaaaga aggaacttga gagttcggat gtcctgtgtg 1620
taagtagcat ccatatttgg agctttagta aggatgattc taccatatgt tatcattggt 1680
accaacggat cacttacgag gcattgtggg ttatgcggcc ggctttgaaa aaatgttgag 1740
aggatactca gcaaatgggt cttacgtgtc catgtgaaca aatctccatt aggaagaaa 1799
<210> 2
<211> 2120
<212> DNA
<213> 潮霉素抗性基因hygR
<400> 2
cgcgcaaaga aggattacct ctaaacaagt gtacctgtgc attctgggta aacgactcat 60
aggagagttg taaaaaagtt tcggccggcg tattgggtgt tacggagcat tcactaggca 120
accatggtta ctattgtata ccatcttagt aggaatgatt tcgaggttta tacctacgat 180
gaatgtgtgt cctgtaggct tgagagttca aggaagaaac atgcaattat ctttgcgaac 240
ccagggctgg tgacggaatt ttcatagtca agctatcaga gtaaagaaga ggagcatgtc 300
aaagtacaat tagagacaaa tatatagtcg cgtggagcca agagcggatt cctcagtctc 360
gtaggtctct tgacgaccgt tgatctgctt gatctcgtct cccgaaaatg aaaatagctc 420
tgctaagcta ttcttctctt cgccggagcc tgaaggcgtt actaggttgc agtcaatgca 480
ttaatgcatt gcagatgagc tgtatctgga agaggtaaac ccgaaaacgc gttttattct 540
tgttgacatg gagctattaa atcactagaa ggcactcttt gctgcttgga caaatgaacg 600
tatcttatcg agatcctgaa caccatttgt ctcaactccg gagctgacat cgacaccaac 660
gatcttatat ccagattcgt caagctgttt gatgatttca gtaacgttaa gtggatccgg 720
tcggcatcta ctctattcct ttgccctcgg acgagtgctg gggcgtcggt ttccactatc 780
ggcgagtact tctacacagc catcggtcca gacggccgcg cttctgcggg cgatttgtgt 840
acgcccgaca gtcccggctc cggatcggac gattgcgtcg catcgaccct gcgcccaagc 900
tgcatcatcg aaattgccgt caaccaagct ctgatagagt tggtcaagac caatgcggag 960
catatacgcc cggagccgcg gcgatcctgc aagctccgga tgcctccgct cgaagtagcg 1020
cgtctgctgc tccatacaag ccaaccacgg cctccagaag aagatgttgg cgacctcgta 1080
ttgggaatcc ccgaacatcg cctcgctcca gtcaatgacc gctgttatgc ggccattgtc 1140
cgtcaggaca ttgttggagc cgaaatccgc gtgcacgagg tgccggactt cggggcagtc 1200
ctcggcccaa agcatcagct catcgagagc ctgcgcgacg gacgcactga cggtgtcgtc 1260
catcacagtt tgccagtgat acacatgggg atcagcaatc gcgcatatga aatcacgcca 1320
tgtagtgtat tgaccgattc cttgcggtcc gaatgggccg aacccgctcg tctggctaag 1380
atcggccgca gcgatcgcat ccatggcctc cgcgaccggc tgcagaacag cgggcagttc 1440
ggtttcaggc aggtcttgca acgtgacacc ctgtgcacgg cgggagatgc aataggtcag 1500
gctctcgctg aattccccaa tgtcaagcac ttccggaatc gggagcgcgg ccgatgcaaa 1560
gtgccgataa acataacgat ctttgtagaa accatcggcg cagctattta cccgcaggac 1620
atatccacgc cctcctacat cgaagctgaa agcacgagat tcttcgccct ccgagagctg 1680
catcaggtcg gagacgctgt cgaacttttc gatcagaaac ttctcgacag acgtcgcggt 1740
gagttcaggc tttttcatat cgatgcttgg gtagaatagg taagtcagat tgaatctgaa 1800
ataaagggag gaagggcgaa cttaagaagg tatgaccggg tcgttcactt accttgcttg 1860
acaaacgcac aagttatcgt gcaccaagca gcagatgata ataatgtcct cgttcctgtc 1920
tgctaataag agtcacactt cgagcgccgc cgctactgct tacaagtggg ctgatctgac 1980
cagttgccta aatgaaccat cttgtcaaac gacacaaatt ttgtgatccg cctggacgac 2040
taaaccaaaa tagcattgat gtgttgacct ccactagctc cagccaagcc caaaaatgct 2100
ccttcaatat catcttctgg 2120
<210> 3
<211> 11198
<212> DNA
<213> pPMPT
<400> 3
agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 60
ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 120
cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 180
tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 240
cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 300
tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 360
aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 420
gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 480
ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 540
accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 600
gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 660
gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 720
gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 780
gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 840
gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 900
acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 960
ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 1020
gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 1080
gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 1140
cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 1200
tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 1260
cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 1320
cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 1380
gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 1440
ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 1500
gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 1560
cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 1620
cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 1680
gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 1740
tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 1800
atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 1860
agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 1920
acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 1980
atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 2040
ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 2100
cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 2160
aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 2220
aacccccaag cccgaggaat cggcgtgagc ggtcgcaaac catccggccc ggtacaaatc 2280
ggcgcggcgc tgggtgatga cctggtggag aagttgaagg ccgcgcaggc cgcccagcgg 2340
caacgcatcg aggcagaagc acgccccggt gaatcgtggc aagcggccgc tgatcgaatc 2400
cgcaaagaat cccggcaacc gccggcagcc ggtgcgccgt cgattaggaa gccgcccaag 2460
ggcgacgagc aaccagattt tttcgttccg atgctctatg acgtgggcac ccgcgatagt 2520
cgcagcatca tggacgtggc cgttttccgt ctgtcgaagc gtgaccgacg agctggcgag 2580
gtgatccgct acgagcttcc agacgggcac gtagaggttt ccgcagggcc ggccggcatg 2640
gccagtgtgt gggattacga cctggtactg atggcggttt cccatctaac cgaatccatg 2700
aaccgatacc gggaagggaa gggagacaag cccggccgcg tgttccgtcc acacgttgcg 2760
gacgtactca agttctgccg gcgagccgat ggcggaaagc agaaagacga cctggtagaa 2820
acctgcattc ggttaaacac cacgcacgtt gccatgcagc gtacgaagaa ggccaagaac 2880
ggccgcctgg tgacggtatc cgagggtgaa gccttgatta gccgctacaa gatcgtaaag 2940
agcgaaaccg ggcggccgga gtacatcgag atcgagctag ctgattggat gtaccgcgag 3000
atcacagaag gcaagaaccc ggacgtgctg acggttcacc ccgattactt tttgatcgat 3060
cccggcatcg gccgttttct ctaccgcctg gcacgccgcg ccgcaggcaa ggcagaagcc 3120
agatggttgt tcaagacgat ctacgaacgc agtggcagcg ccggagagtt caagaagttc 3180
tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc cggagtacga tttgaaggag 3240
gaggcggggc aggctggccc gatcctagtc atgcgctacc gcaacctgat cgagggcgaa 3300
gcatccgccg gttcctaatg tacggagcag atgctagggc aaattgccct agcaggggaa 3360
aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca ttgggaaccc aaagccgtac 3420
attgggaacc ggaacccgta cattgggaac ccaaagccgt acattgggaa ccggtcacac 3480
atgtaagtga ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa 3540
cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc 3600
gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg 3660
cgtcggccta tcgcggccgc tggccgctca aaaatggctg gcctacggcc aggcaatcta 3720
ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc 3780
ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 3840
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 3900
gggtgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta 3960
tactggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 4020
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg 4080
ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 4140
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 4200
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 4260
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 4320
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 4380
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 4440
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 4500
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 4560
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 4620
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 4680
actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 4740
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 4800
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 4860
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gcatgatata 4920
tctcccaatt tgtgtagggc ttattatgca cgcttaaaaa taataaaagc agacttgacc 4980
tgatagtttg gctgtgagca attatgtgct tagtgcatct aatcgcttga gttaacgccg 5040
gcgaagcggc gtcggcttga acgaatttct agctagagga tcgcaccaat aactgcctta 5100
aaaaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 5160
gccgacatgg aagccatcac aaacggcatg atgaacctga atcgccagcg gcatcagcac 5220
cttgtcgcct tgcgtataat atttgcccat tgtgaaaacg ggggcgaaga agttgtccat 5280
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 5340
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 5400
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 5460
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 5520
cagctcaccg tctttcattg ccatacggaa ctccggatga gcattcatca ggcgggcaag 5580
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 5640
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 5700
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 5760
ctccatgatg tttaactttg ttttagggcg actgccctgc tgcgtaacat cgttgctgct 5820
ccataacatc aaacatcgac ccacggcgta acgcgcttgc tgcttggatg cccgaggcat 5880
agactgtacc ccaaaaaaac atgtcataac aagaagccat gaaaaccgcc actgcgccgt 5940
taccaccgct gcgttcggtc aaggttctgg accagttgcg tgacggcagt tacgctactt 6000
gcattacagc ttacgaaccg aacgaggctt atgtccactg ggttcgtgcc cgaattgatc 6060
acaggcagca acgctctgtc atcgttacaa tcaacatgct accctccgcg agatcatccg 6120
tgtttcaaac ccggcagctt agttgccgtt cttccgaata gcatcggtaa catgagcaaa 6180
gtctgccgcc ttacaacggc tctcccgctg acgccgtccc ggactgatgg gctgcctgta 6240
tcgagtggtg attttgtgcc gagctgccgg tcggggagct gttggctggc tggtggcagg 6300
atatattgtg gtgtaaacaa attgacgctt agacaactta ataacacatt gcggacgttt 6360
ttaatgtact gaattaacgc cgaattaatt cgggggatct atagggactt taggtgatct 6420
ggattttagt actggatttt ggttttagga attagaaatt ttattgatag aagtatttta 6480
caaatacaaa tacatactaa gggtttctta tatgctcaac acgtgagcga aaccctataa 6540
gaaccctaat tcccttatct gggaactact cacacattat tatggagaaa ctcgatgtcg 6600
atcgactcta gctagaggat cgatccgaac cccagagtcc cgctcagaag aactcgtcaa 6660
gaaggcgata gaaggcgatg cgctgcgaat cgggagcggc gataccgtaa agcacgagga 6720
agcggtcagc ccattcgccg ccaagctctt cagcaatatc acgggtagcc aacgctatgt 6780
cctgatagcg gtccgccaca cccagccggc cacagtcgat gaatccagaa aagcggccat 6840
tttccaccat gatattcggc aagcaggcat cgccatgtgt cacgacgaga tcctcgccgt 6900
cgggcatgcg cgcaaagaag gattacctct aaacaagtgt acctgtgcat tctgggtaaa 6960
cgactcatag gagagttgta aaaaagtttc ggccggcgta ttgggtgtta cggagcattc 7020
actaggcaac catggttact attgtatacc atcttagtag gaatgatttc gaggtttata 7080
cctacgatga atgtgtgtcc tgtaggcttg agagttcaag gaagaaacat gcaattatct 7140
ttgcgaaccc agggctggtg acggaatttt catagtcaag ctatcagagt aaagaagagg 7200
agcatgtcaa agtacaatta gagacaaata tatagtcgcg tggagccaag agcggattcc 7260
tcagtctcgt aggtctcttg acgaccgttg atctgcttga tctcgtctcc cgaaaatgaa 7320
aatagctctg ctaagctatt cttctcttcg ccggagcctg aaggcgttac taggttgcag 7380
tcaatgcatt aatgcattgc agatgagctg tatctggaag aggtaaaccc gaaaacgcgt 7440
tttattcttg ttgacatgga gctattaaat cactagaagg cactctttgc tgcttggaca 7500
aatgaacgta tcttatcgag atcctgaaca ccatttgtct caactccgga gctgacatcg 7560
acaccaacga tcttatatcc agattcgtca agctgtttga tgatttcagt aacgttaagt 7620
ggatccggtc ggcatctact ctattccttt gccctcggac gagtgctggg gcgtcggttt 7680
ccactatcgg cgagtacttc tacacagcca tcggtccaga cggccgcgct tctgcgggcg 7740
atttgtgtac gcccgacagt cccggctccg gatcggacga ttgcgtcgca tcgaccctgc 7800
gcccaagctg catcatcgaa attgccgtca accaagctct gatagagttg gtcaagacca 7860
atgcggagca tatacgcccg gagccgcggc gatcctgcaa gctccggatg cctccgctcg 7920
aagtagcgcg tctgctgctc catacaagcc aaccacggcc tccagaagaa gatgttggcg 7980
acctcgtatt gggaatcccc gaacatcgcc tcgctccagt caatgaccgc tgttatgcgg 8040
ccattgtccg tcaggacatt gttggagccg aaatccgcgt gcacgaggtg ccggacttcg 8100
gggcagtcct cggcccaaag catcagctca tcgagagcct gcgcgacgga cgcactgacg 8160
gtgtcgtcca tcacagtttg ccagtgatac acatggggat cagcaatcgc gcatatgaaa 8220
tcacgccatg tagtgtattg accgattcct tgcggtccga atgggccgaa cccgctcgtc 8280
tggctaagat cggccgcagc gatcgcatcc atggcctccg cgaccggctg cagaacagcg 8340
ggcagttcgg tttcaggcag gtcttgcaac gtgacaccct gtgcacggcg ggagatgcaa 8400
taggtcaggc tctcgctgaa ttccccaatg tcaagcactt ccggaatcgg gagcgcggcc 8460
gatgcaaagt gccgataaac ataacgatct ttgtagaaac catcggcgca gctatttacc 8520
cgcaggacat atccacgccc tcctacatcg aagctgaaag cacgagattc ttcgccctcc 8580
gagagctgca tcaggtcgga gacgctgtcg aacttttcga tcagaaactt ctcgacagac 8640
gtcgcggtga gttcaggctt tttcatatcg atgcttgggt agaataggta agtcagattg 8700
aatctgaaat aaagggagga agggcgaact taagaaggta tgaccgggtc gttcacttac 8760
cttgcttgac aaacgcacaa gttatcgtgc accaagcagc agatgataat aatgtcctcg 8820
ttcctgtctg ctaataagag tcacacttcg agcgccgccg ctactgctta caagtgggct 8880
gatctgacca gttgcctaaa tgaaccatct tgtcaaacga cacaaatttt gtgatccgcc 8940
tggacgacta aaccaaaata gcattgatgt gttgacctcc actagctcca gccaagccca 9000
aaaatgctcc ttcaatatca tcttctggtc gacaaagaag gattacctct aaacaagtgt 9060
acctgtgcat tctgggtaaa cgactcatag gagagttgta aaaaagtttc ggccggcgta 9120
ttgggtgtta cggagcattc actaggcaac catggttact attgtatacc atcttagtag 9180
gaatgatttc gaggtttata cctacgatga atgtgtgtcc tgtaggcttg agagttcaag 9240
gaagaaacat gcaattatct ttgcgaaccc agggctggtg acggaatttt catagtcaag 9300
ctatcagagt aaagaagagg agcatgtcaa agtacaatta gagacaaata tatagtcgcg 9360
tggagccaag agcggattcc tcagtctcgt aggtctcttg acgaccgttg atctgcttga 9420
tctcgtctcc cgaaaatgaa aatagctctg ctaagctatt cttctcttcg ccggagcctg 9480
aaggcgttac taggttgcag tcaatgcatt aatgcattgc agatgagctg tatctggaag 9540
aggtaaaccc gaaaacgcgt tttattcttg ttgacatgga gctattaaat catctagagg 9600
tcaccgagct cggtaccccc gggcaattga gatctgagat taaaatagat aaggaaaaga 9660
aagtgaaaag aaattcggaa gcatggcaca ttcttctttt tataaataca tgcctgactt 9720
tctttttcca tcgatatgat atatgcatat gatagatata caagcaatct tcttcaagga 9780
gtttgaaatt ttgtcctcca ggagcaaaaa aaagtttttt tttatacatg tttgtacaca 9840
agaatagtta ccaatttgct ttggtcttac gtgctgcaag tttatatcgt tttcaatttc 9900
tttgtcttta cattttcttt gtcctttatc tttcctcatt tagtctttgg gagaattagg 9960
aaaagggagc ggaaaggtaa gaaatgcttg cgtattttac taattcggca aacatccaat 10020
ttggcaaaca gcagcctgtg caacgctctc gagatgacag tatctttgat tacactctaa 10080
atctcgatga cccgaccaaa aagagcgaac aaagaaataa tcttgtgcat tcgaatatga 10140
tggaagattt tttccccctt attctaaatg ttgacatagc gtgtatgtta tataaacaaa 10200
aagaaattgt acaaactttc ttttcttctc tttttatttt atctcgactc tgggtcacta 10260
gtgacccaga gtcactaaat tatcgaggta cagttgttct tattttgcgc aaaagcccaa 10320
atggagaagg tctatgtcga gtagacgtta cgtaattacg taactgacgt tggatcattg 10380
cggaagtccg aggccgcttc tcttcttatc gaatcgtctc gataaaagta aaagccctct 10440
gctctagttc gtctagttgc cagcagttct ctggatgctc tgactcctta ggcgagaacc 10500
gaggtgcgct gatatataaa cagagattaa catgaaactg tacgaggaga agaaatgaga 10560
ctatcgaact gatactttta aggcagtggt cgggacccaa gcgtttctat taacgtacaa 10620
agaaggaact tgagagttcg gatgtcctgt gtgtaagtag catccatatt tggagcttta 10680
gtaaggatga ttctaccata tgttatcatt ggtaccaacg gatcacttac gaggcattgt 10740
gggttatgcg gccggctttg aaaaaatgtt gagaggatac tcagcaaatg ggtcttacgt 10800
gtccatgtga acaaatctcc attaggaaga aaaagcttgg cactggccgt cgttttacaa 10860
cgtcgtgact gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct 10920
ttcgccagct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc 10980
agcctgaatg gcgaatgcta gagcagcttg agcttggatc agattgtcgt ttcccgcctt 11040
cagtttaaac tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc 11100
gtttattaga ataacggata tttaaaaggg cgtgaaaagg tttatccgtt cgtccatttg 11160
tatgtgcatg ccaaccacag ggttcccctc gggatcaa 11198
<210> 4
<211> 528
<212> DNA
<213> 基因crtZ
<400> 4
atgttgtgga tttggaatgc cctgatcgtt ttcgttaccg tgattggcat ggaagtgatt 60
gctgcactgg cacacaaata catcatgcac ggctggggtt ggggatggca tctttcacat 120
catgaaccgc gtaaaggtgc gtttgaagtt aacgatcttt atgccgtggt ttttgctgca 180
ttatcgatcc tgctgattta tctgggcagt acaggaatgt ggccgctcca gtggattggc 240
gcaggtatga cggcgtatgg attactctat tttatggtgc acgacgggct ggtgcatcaa 300
cgttggccat tccgctatat tccacgcaag ggctacctca aacggttgta tatggcgcac 360
cgtatgcatc acgccgtcag gggcaaagaa ggttgtgttt cttttggctt cctctatgcg 420
ccgcccctgt caaaacttca ggcgacgctc cgggaaagac atggcgctag agcgggcgct 480
gccagagatg cgcagggcgg ggaggatgag cccgcatccg ggaagtaa 528
<210> 5
<211> 816
<212> DNA
<213> 基因neoR
<400> 5
atgagccata ttcaacggga aacgtcttgc tctaggccgc gattaaattc caacatggat 60
gctgatttat atgggtataa atgggctcgc gataatgtcg ggcaatcagg tgcgacaatc 120
tatcgattgt atgggaagcc cgatgcgcca gagttgtttc tgaaacatgg caaaggtagc 180
gttgccaatg atgttacaga tgagatggtc agactaaact ggctgacgga atttatgcct 240
cttccgacca tcaagcattt tatccgtact cctgatgatg catggttact caccactgcg 300
atccccggga aaacagcatt ccaggtatta gaagaatatc ctgattcagg tgaaaatatt 360
gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga ttcctgtttg taattgtcct 420
tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat cacgaatgaa taacggtttg 480
gttgatgcga gtgattttga tgacgagcgt aatggctggc ctgttgaaca agtctggaaa 540
gaaatgcata aacttttgcc attctcaccg gattcagtcg tcactcatgg tgatttctca 600
cttgataacc ttatttttga cgaggggaaa ttaataggtt gtattgatgt tggacgagtc 660
ggaatcgcag accgatacca ggatcttgcc atcctatgga actgcctcgg tgagttttct 720
ccttcattac agaaacggct ttttcaaaaa tatggtattg ataatcctga tatgaataaa 780
ttgcagtttc atttgatgct cgatgagttt ttctaa 816