技术领域
本发明涉及基因工程及分子生物学领域,具体地说,涉及参与西瓜葫芦素E合成的基因簇及其应用。
背景技术
西瓜的苦味是由一类称为葫芦素E的三萜化合物导致的。西瓜果实中积累葫芦素E会严重影响西瓜的口感及品质。前期研究利用基因组学、分子生物学、生物化学等手段揭示了由9个基因参与的黄瓜苦味物质葫芦素C的合成途径,其中包括1个氧化角鲨烯环化酶Bi,7个细胞色素P450基因和1个乙酰基转移酶基因,并利用生物化学方法完全阐明了四步反应,其对于葫芦科植物中其他类型的葫芦素生物合成路径的研究具有重要的指导意义,也为植物中其他三萜化合物的通路解析提供了新思路。葫芦素具有抗虫作用,并且医学研究证明葫芦素能够抑制多种癌细胞生长,目前葫芦素主要从植物中提取获得,不能通过异源生物合成。而西瓜中参与葫芦素E生物合成的基因还没有被克隆,葫芦素E生物合成路径的解析将为开发新型抗癌药物提供基础。
发明内容
本发明的目的是提供参与西瓜葫芦素E合成的基因簇及其应用。
为了实现本发明目的,本发明提供参与西瓜葫芦素E合成的蛋白,包括Cla007077、Cla007078、Cla007079、Cla007080、Cla007081、Cla007082、Cla008354和Cla008355,它们的氨基酸序列分别如SEQIDNo.1-8所示。
本发明还提供参与西瓜葫芦素E合成的基因簇,所述基因簇由以下8个基因组成,Cla007077、Cla007078、Cla007079、Cla007080、Cla007081、Cla007082、Cla008354和Cla008355,它们的核苷酸序列分别如SEQIDNo.10-17所示。
本发明还提供含有所述参与西瓜葫芦素E合成的基因簇的载体、工程菌及宿主细胞。
本发明还提供所述参与西瓜葫芦素E合成的基因簇在调控西瓜苦味合成中的应用。
本发明还提供所述参与西瓜葫芦素E合成的基因簇在调控葫芦素体外合成中的应用。
本发明还提供所述参与西瓜葫芦素E合成的基因簇在无苦味西瓜分子育种中的应用。
前期研究中利用基因组学、分子生物学、生物化学等手段揭示了由9个基因参与的黄瓜苦味物质葫芦素C的合成途径,以此为基础,通过将西瓜中的环化酶基因与黄瓜中的氧化角鲨烯环化酶基因Bi进行进化树分析,找到了一个与黄瓜Bi基因同源性最高的基因Cla007080(Bi),利用酵母表达体系证明了该基因编码葫芦二烯醇合成酶,是葫芦素合成的关键酶。葫芦二烯醇还需要进一步被氧化和乙酰化才能生成葫芦素。为了解析葫芦素E合成的其他步骤,利用比较基因组学方法在西瓜基因组中找到了一个类似于黄瓜葫芦素C合成的基因簇:由6个P450基因(Cla007077、Cla007078、Cla007079、Cla007082、Cla008354和Cla008355)、1个乙酰转移酶基因(Cla007081)和1个Bi基因(Cla007080)组成。这8个基因在西瓜各个组织中的表达状态非常相似,只在根中大量表达。此外,除了基因Cla008354和Cla008355以外,其他基因与Bi基因均位于6号染色体57kb的范围内,形成一个类似基因簇的结构。目前,以基因簇的形式参与重要次生代谢产物合成在高等植物中被广泛发现,因此推测这8个候选基因很可能参与了葫芦素E的合成。
进一步利用酵母表达体系,在酵母中表达这些候选基因,用UPLC-Q-TOF仪分析产物的精确分子量,推测可能发生的氧化反应产物,解析葫芦素E合成中间步骤。首先,在表达Bi、还原酶CPR和Cla008354的酵母中发现了两个特异产物,一个分子量为441.3727[M+H],另一个为457.3676[M+H],经过MS、MS/MS结果分析推测Cla008354为多功能P450,在葫芦二烯醇合成中先羰基化,再羟基化。进一步将该产物从酵母中纯化分离出来,利用核磁共振(NMR)解析其结构,发现葫芦二烯醇的11号碳原子先发生羰基化(C30H48O2),然后在20号碳原子上发生羟基化(C30H48O3),进而证Cla008354可连续氧化葫芦二烯醇,催化葫芦素E合成的第二步和第三步。由于基因Cla008354与Cla008355高度同源,经过相同的方法验证基因Cla008355也具有相同的功能,即也能够催化葫芦二烯醇的11号碳原子先发生羰基化(C30H48O2),然后在20号碳原子上发生羟基化(C30H48O3)。继续利用酵母表达体系,表达更多的候选基因,利用类似的方法,仅在表达Bi、CPR、Cla008354(或Cla008355)和Cla007079的酵母提取物中发现分子量为473.3625[M+H]的特异产物,推测上一步催化产物被Cla007079羟基化,进一步将该产物从酵母中纯化分离出来,利用核磁共振(NMR)解析其结构,发现在2号碳原子上发生了羟基化(C30H48O4),进而证明了Cla007079催化葫芦素E合成的第四步。
本发明首次在西瓜基因组中发现参与葫芦素E合成的基因簇,共由8个基因组成,其中6个基因均位于6号染色体57kb的范围内。利用酵母体系成功解析了葫芦素E合成的第1至第4步反应。本发明进一步揭示了西瓜苦味形成的分子机制,为无苦味西瓜育种提供了理论依据和分子辅助育种目标,可用于大规模筛选育种材料,大大加快高品质西瓜的育种进程;同时还为葫芦素的体外人工合成提供了宝贵经验,本发明可替代传统的从植物材料中提取苦味素(葫芦素)的方法,利用合成生物学从而实现体外合成苦味素。
附图说明
图1为本发明通过比较基因组学以及RNA-Seq数据分析,从西瓜基因组中发现与苦味素(葫芦素E)合成相关的基因簇。
图2为本发明利用UPLC-Q-TOF检测参与苦味素合成第二步和第三步反应的结果;其中,A为UPLC-Q-TOF检测到的Cla008354和Cla008355的特异产物,B为该特异产物的MS/MS检测结果,C为核磁共振NMR结构解析结果。
图3为本发明利用UPLC-Q-TOF检测参与苦味素合成第四步反应的结果;其中,A为UPLC-Q-TOF检测到的Cla007079的特异产物,B为该特异产物的MS/MS检测结果,C为核磁共振NMR结构解析结果。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例均按照常规实验条件,如Sambrook等分子克隆实验手册(SambrookJ&RussellDW,Molecularcloning:alaboratorymanual,2001),或按照制造厂商说明书建议的条件。
实施例1参与西瓜葫芦素E合成的基因簇的挖掘与获得
1、基因簇的挖掘
以黄瓜苦味物质葫芦素C合成基因簇研究为基础,利用比较基因组学方法,在西瓜基因组中找到了一个类似于黄瓜葫芦素C合成的基因簇,共找到8个基因,包括1个葫芦二烯醇合成酶基因Bi(Cla007080)、6个P450基因(Cla007077、Cla007078、Cla007079、Cla007082、Cla008354和Cla008355)和1个乙酰转移酶基因(Cla007081),除了Cla008354和Cla008355基因,其他基因均位于6号染色体57kb的范围内,形成一个类似基因簇的结构,并且这8个基因在西瓜根中特异共表达,与葫芦素E在个组织中含量呈正相关(图1),由此认为该基因簇参与葫芦素E的合成。
2、西瓜Cla007077、Cla007078、Cla007079、Cla007080、Cla007081、Cla007082、Cla008354和Cla008355基因的获得
首先提取西瓜根中总mRNA,并反转录成cDNA,然后利用正向引物和反向引物进行PCR扩增(引物序列见表1)。
表1引物序列(5′-3′)
Cla007077-TVector-F GCTGCAGAAGAATGCTTCACCAAAA Cla007077-TVector-R GCAGCTTGGTTGCAATTTCTCTTGC Cla007078-TVector-F GGATGGTTGGCTAACAGCGCTCC Cla007078-TVector-R ACAAGCCTTGGAGACAAGTAAGCA Cla007079-TVector-F TGGAGACCACCACCTATTTTCCATTT Cla007079-TVector-R TGGGACGAGCTCTACACAATGCC Cla007080-TVector-F AGTTGGGGCCGAGAGCGTTG Cla007080-TVector-R ACCCGATGGAAATACTCTCCAAGAGCC Cla007081-TVector-F TCCATTCCAACGCCTCAAACCCA Cla007081-TVector-R TGTTGGAGCTGAAGAACATTGGGA Cla007082-TVector-F CGCCGGGATTAGCCATCGCC Cla007082-TVector-R AGCTTTTGCTGAGAAGCTGACATGA Cla008354-TVector-F GGACAATCTTGCTCGGTTTGGCG Cla008354-TVector-R CACATGTAGCCCATCTTCAAACCTCA Cla008355-TVector-F CTTTCTCGGTTTCGTGACGCTGACA Cla008355-TVector-R TGAAGTTCACATGTAGCCCATCAACA
PCR反应体系以20μl计为:10-20ng/μl模板1μl,10pmol/μl正、反向引物各1μl,10mmol/LdNTPmix0.4μl,0.5U/μL高保真TaqDNA聚合酶1μl,10×PCR反应缓冲液2μl,余量为水。
PCR反应条件为:94℃5分钟;94℃20秒,55℃20秒,72℃2分30秒,35个循环;72℃10分钟。
将扩增得到的片段与T-载体(TAKARA)连接,测序确认没有突变。西瓜Cla007077、Cla007078、Cla007079、Cla007080、Cla007081、Cla007082、Cla008354和Cla008355基因的核苷酸序列分别如SEQIDNo.10-17所示。
实施例2利用酵母表达系统验证葫芦素E合成候选基因的功能
将Cla007077、Cla007078、Cla007079、Cla007080、Cla007081、Cla007082、Cla008354和Cla008355基因以及还原酶CPR基因分别构建到表达载体pYES2(Invitrogen)上,并转化酵母菌。诱导酵母表达蛋白,收集酵母。裂解后用石油醚抽提化合物。样品制备好后用UPLC-Q-TOF进行检测。结果分别如图2、图3所示。
图2为利用UPLC-Q-TOF检测参与苦味素合成第二步和第三步反应的结果;其中,A为UPLC-Q-TOF检测到的Cla008354和Cla008355的特异产物,B为该特异产物的MS/MS检测结果,C为核磁共振NMR结构解析结果。
图3为利用UPLC-Q-TOF检测参与苦味素合成第四步反应的结果;其中,A为UPLC-Q-TOF检测到的Cla007079的特异产物,B为该特异产物的MS/MS检测结果,C为核磁共振NMR结构解析结果。
Cla018830基因编码还原酶CPR(SEQIDNo.9),是P450基因在氧化底物时的一个还原酶基因,加入CPR有利于提高氧化反应效率。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列说明:
SEQIDNo.1-9分别为Cla007077、Cla007078、Cla007079、Cla007080、Cla007081、Cla007082、Cla008354、Cla008355和CPR蛋白的氨基酸序列。
SEQIDNo.10-18分别为基因Cla007077、Cla007078、Cla007079、Cla007080、Cla007081、Cla007082、Cla008354、Cla008355和CPR的核酸序列。
参考文献:
1.SekiH,etal.(2008)Licoriceβ-amyrin11-oxidase,acytochromeP450withakeyroleinthebiosynthesisofthetriterpenesweetenerglycyrrhizin.ProceedingsoftheNationalAcademyofSciences105(37):14204.
2.vanHerpenTWJM,etal.(2010)NicotianabenthamianaasaProductionPlatformforArtemisininPrecursors.PLoSOne5(12):e14222.
3.YiShang,etal.(2014)Biosynthesis,regulation,anddomesticationofbitternessincucumber,Science,346(6213):1084-1088。