发明领域
本发明涉及新的萜烯合酶。本发明还涉及编码萜烯合酶的核酸、用于制备变体萜烯合酶的方法和表达本发明多肽的宿主生物体。本发明还包括用于制备萜烯合酶的方法和用于制备萜类化合物(如萜烯)的方法。
背景技术
以下技术背景的讨论仅为了便于理解本发明。该讨论并非确认或承认,截至本申请的优先权日,其所涉及的任何材料是或曾是普通常识的一部分。
檀香(印度檀香Santalumalbum)(檀香科Santalaceae)是具有巨大的经济价值的小型半寄生热带树木,其被发现生长于印度南部、斯里兰卡、印尼东部和澳大利亚北部。由于其细粒性、高密度和出色的雕刻特性,檀香木材受到高度追捧。檀香木材含有树脂和精油,尤其是檀香醇、檀香烯以及数十种其他微量倍半萜。这些化学物质提供了独特的檀香香味。香木通常被磨碎并蒸汽蒸馏,其挥发油用作许多高端香水的固定剂。
几个世纪的过度开采已导致檀香天然林消亡。正在整个澳大利亚北部建立大型种植园,以满足需求并保护剩余的储备。檀香心材中含有高达6%(干重)的倍半萜油,主要是α-和β-檀香醇,α-反式-香柠檬醇和表-β-檀香醇,以及倍半萜烯烃α-和β-檀香烯,α-香柠檬烯和表-β-檀香烯,β-红没药烯,α-、β-和γ-姜黄烯。即使是在近乎相同的生长条件下,产于树的心材油的量相差很大。这种产量差异的原因还不是很清楚,但可能是遗传和环境因素两者的结果。
关于檀香中倍半萜类化合物(如倍半萜)的生物合成或其精油产生如何调控所知甚少。
本发明解决了本领域对用于产生萜烯的方法的需要,所述萜烯与檀香所产生的萜烯类似。
发明概述
在一个实施方案中,本发明提供了分离的核酸分子,其编码萜烯合酶并且选自:
a)包含SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示的核苷酸序列的核酸分子;
b)核酸分子,其为(a)的片段;
c)核酸分子,其包含与(a)或(b)互补的核苷酸序列;和
d)核酸分子,其编码萜烯合酶并与(a)-(c)中任一核酸分子具有至少或至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%的相同性;
其中所述核酸分子编码萜烯合酶。
其它的实施方案包括:本发明的核酸所编码的多肽;包含本发明核酸的宿主细胞;非人生物体,其被修改以含有本发明的核酸;以及产生多肽的方法,其包括培养本发明的宿主细胞。
在一个实施方案中,本发明提供了制备至少一种萜烯合酶的方法,其包括在有助于产生所述至少一种萜烯合酶的条件下培养宿主细胞,所述宿主细胞被修改以含有至少一种核酸序列。
本发明还提供分离的萜烯合酶,其中所述萜烯合酶为檀香属(Santalum)萜烯合酶;并且所述萜烯合酶催化檀香烯的产生。
在另一个实施方案中,本发明提供分离的萜烯合酶,其包括:
a)SEQIDNO:2、SEQIDNO:4或SEQIDNO:6所示的氨基酸序列;
b)由权利要求1-5中任一项的核酸分子所编码的氨基酸序列;
c)氨基酸序列,其与SEQIDNO:2所示的氨基酸序列具有至少或至少约60%、65%、70%、75%、80%、85%、90%、95%或更高相同性;或
d)(a)、(b)或(c)的片段;
其中所述萜烯合酶催化萜烯产生。
本发明还提供萜烯合酶,其中所述萜烯合酶同时催化α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯和β-檀香烯的产生。
本发明还提供用于检测样品中萜烯合酶多肽或核酸的存在的方法。
在另外的实施方案中,本发明提供了产生萜烯合酶的方法,所述方法包括以下步骤:
a)选择宿主生物体和/或细胞,其不表达具有SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示序列的核酸分子;
b)用具有SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示序列的核酸分子转化所述生物体;和
c)在有助于所述核酸编码的萜烯合酶产生的条件下培养所述生物体。
在另外的实施方案中,本发明提供了产生萜烯合酶的方法,所述方法包括以下步骤:
a)选择宿主生物体和/或细胞,其不表达具有SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示序列的核酸分子;
b)用SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示序列的核酸分子以较高的量转化所述生物体;和
c)在有助于所述核酸编码的萜烯合酶产生的条件下培养所述生物体。
本发明还提供了制备萜烯的方法,包括:
a)使无环焦磷酸萜烯前体与本发明的萜烯合酶接触,和,
b)任选地,分离在步骤(a)中产生的萜烯。
优选地,所述方法实施于在细胞中异源表达的萜烯合酶上;其中无环焦磷酸萜烯前体与所述萜烯合酶在同一细胞中表达;并且接触无环焦磷酸萜烯前体的步骤发生于所述细胞中。更优选地,所述至少一种萜烯选自(+)-表-β-檀香烯、(-)-β-檀香烯、(+)-β-檀香烯、(+)-α-檀香烯、(-)-α-檀香烯、顺式-α-香柠檬烯、反式-α-香柠檬烯,反式-β-香柠檬烯和顺式-β-香柠檬烯。
本发明的萜烯合酶产生的萜烯可进一步加工为醇,优选为α-檀香醇,β-檀香醇,α-反式-香柠檬醇和/或表-β-檀香醇。
附图简述
图1:印度檀香(S.album)天然檀香油的色谱图。4个主峰是α-檀香烯、E-α-香柠檬烯、表-β-檀香烯和β-檀香烯。
图2:与FPP温育后的SaSSy产物谱的GC图谱(trace),以及用GC-MS检测的来自与FPP温育后的SaSSy产物谱的α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯和β-檀香烯的质谱数据。
图3:与FPP温育后的SaSSy、SauSSy和SspiSSy产物谱的叠加GC图谱,以及用GC-MS检测的来自与FPP温育后的SaSSy产物谱的α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯和β-檀香烯、顺式-β-金合欢烯和反式-β-金合欢烯的质谱数据。
图4:本发明的SaSSy萜烯合酶的核酸序列。
图5:本发明的SaSSy萜烯合酶的氨基酸序列。
图6A和6B:萜烯合酶的Clustal比对:FB299123-125-香根草(Vetiveriazizanoides)萜烯合酶(WO2006134523)、AF484125-烟草(Nicotianaattenuata)5-表-马兜铃烯(aristolochene)合酶、AB438045-柠檬香桃(Backhousiacitriodora)芳樟醇合酶、Santalene-本发明的来自檀香的SaSSy檀香烯合酶。
图7:图6中比对的蛋白质的系统发生树。
图8:28种不同的萜烯合酶基因的UPGMA比对树。参考代码如下:1SaSSy[印度檀香(Santalumalbum)];2SauSSy[新克里多尼亚檀香(Santalumaustrocaledonicum)];3SspiSSy[澳洲檀香(Santalumspicatum)];4ACF24767.1单萜合酶[印度檀香];5SauMonoTPS1[新克里多尼亚檀香];6SspiMonoTPS1[澳洲檀香];7ACF24768.1SaSesquiTPS1[印度檀香];8SausSesquiTPS1[新克里多尼亚檀香];9SspiSesquiTPS1[澳洲檀香];10AAS79351.1(-)-a-松油醇合酶[葡萄(Vitisvinifera)];11BAG82825.1芳樟醇合酶[柠檬香桃(Backhousiacitriodora)];12AAV63788.1α-姜烯合酶[罗勒(Ocimumbasilicum)];13AAR99061.1(-)-大根香叶烯D合酶[毛果杨(Populustrichocarpa)×美洲黑杨(Populusdeltoides)];14CAA06614.15-表-马兜铃烯[辣椒原变种(Capsicumannuumvar.annuum)];15CAA77191.1(+)-δ-杜松烯合酶[亚洲棉(Gossypiumarboreum)];16AAO73863.1(+)-3-蒈烯合酶[欧洲云杉(Piceaabies)];17AAC05727.1d-芹子烯合酶[大冷杉(Abiesgrandis)];18AAF61453.1β-水芹烯合酶[大冷杉];19AAC05728.1γ-蛇麻烯合酶[大冷杉];20AAS47691.1LAS[欧洲云杉];21AAC39443.1ent-贝壳杉烯合酶[拟南芥(Arabidopsisthaliana)];22ADB55710.1(-)-ent-贝壳杉烯合酶[北美云杉(Piceasitchensis)];23AAM53944.1AF514287_1(+)-柠檬烯合酶1[ 柠檬 (Citruslimon)] ; 24AAA86337.1vetispiradiene 合酶 [ 纯天仙子 (Hyoscyamusmuticus)] ; 25AAF61439.1 紫穗槐 -4,11- 二烯合酶 [ 青蒿 (Artemisiaannua)] ; 26BAF02832.1 单萜合酶 [ 蓝桉 (Eucalyptusglobulus)] ; 27 桉叶素合酶 [ 希腊鼠尾草 (Salviafruticosa)] ; 28 香桧烯合酶 [Salviapomifera]
图9:28种不同的萜烯合酶基因的Neighberjoining比对树。参考代码如下:1SaSSy:SaSSy[印度檀香];2SauSSy:SauSSy[新克里多尼亚檀香];3SspiSSy:SspiSSy[澳洲檀香];4SaMono:ACF24767.1单萜合酶[印度檀香];5SauMono:SauMonoTPS1[新克里多尼亚檀香];6SspiMono:SspiMonoTPS1[澳洲檀香];7SaSequiTPS1:ACF24768.1SaSesquiTPS1[印度檀香];8SausSesquiTPS:SausSesquiTPS1[新克里多尼亚檀香];9SspiSesquiTPS:SspiSesquiTPS1[澳洲檀香];10VVterp:AAS79351.1(-)-a-松油醇合酶[葡萄];11BcitLiNS:BAG82825.1芳樟醇合酶[柠檬香桃];12ObasAZS:AAV63788.1α-姜烯合酶[罗勒];13PtriGDS:AAR99061.1(-)-大根香叶烯D合酶[毛果杨×美洲黑杨];14CannEAS:CAA06614.15-epi-马兜铃烯[辣椒原变种];15GarbCDSCAA77191.1(+)-δ-杜松烯合酶[亚洲棉];16PabiCRS:AAO73863.1(+)-3-蒈烯合酶[欧洲云杉];17AgradSELS:AAC05727.1d-芹子烯合酶[大冷杉];18Argaphel:AAF61453.1β-水芹烯合酶[大冷杉];19AgragHUMS:AAC05728.1γ-蛇麻烯合酶[大冷杉];20PabiLAS:AAS47691.1LAS[欧洲云杉];21AthaEKS:AAC39443.1ent-贝壳杉烯合酶[拟南芥];22PsitEKS:ADB55710.1(-)-ent-贝壳杉烯合酶[北美云杉];23ClimLIS:AAM53944.1AF514287_1(+)-柠檬烯合酶1[柠檬];24HmutVTS:AAA86337.1vetispiradiene合酶[纯天仙子];25AannADS:AAF61439.1紫穗槐-4,11-二烯合酶[青蒿];26EgloTPS:BAF02832.1单萜合酶[蓝桉];27DQ785794.1:桉叶素合酶[希腊鼠尾草];28DQ785793:香桧烯合酶]。
图10a-10g:新克里多尼亚檀香、澳洲檀香和印度檀香的萜烯合酶核酸序列的比对。
图11a-c:新克里多尼亚檀香、澳洲檀香和印度檀香的萜烯合酶蛋白质氨基酸序列的比对。
图12a-d:新克里多尼亚檀香、澳洲檀香和印度檀香的萜烯合酶蛋白质氨基酸序列的比对,其与DQ785793.1-希腊鼠尾草桉叶素合酶和DQ785794.1-Salviapomifera香桧烯合酶的氨基酸序列相比较。
详述
发明详述
根据本发明,发现了来自印度檀香的新的萜烯合酶基因SaSSy。还发现了来自其它两个不同系统发生的物种的直系同源基因(来自澳洲檀香的SspiSSy和来自新克里多尼亚檀香的SauSSy)。新基因由SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示的DNA序列表征。
在 SEQIDNO:1 中公开的新基因以下一般称作 SaSSy ,在 SEQIDNO:3 中公开的新基因以下一般称作SauSSy,而在SEQIDNO:5中公开的新基因以下一般称作SspiSSy。SaSSy、SauSSy和SspiSSy的DNA和蛋白质序列是非常高度保守的,在ORF的氨基酸上具有94-98%的相同性。该基因的关键结构域是非常高度保守的(见图4和5)。
新的萜烯合酶催化由FPP产生萜类化合物,优选为萜烯,更优选为选自以下的倍半萜:α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯和β-檀香烯。
更具体地,SaSSy、SauSSy和SspiSSy为倍半萜合酶,并且最具体地,为檀香烯合酶。如本文中所用,“萜烯合酶”是催化由底物产生一或多种萜类化合物,或更优选地产生一或多种萜烯的酶;“倍半萜合酶”是催化合成倍半萜类化合物,或更优选地合成倍半萜烯的酶,而“檀香烯合酶”是催化檀香烯合成的酶。由底物形成萜类化合物和/或萜烯可使用本领域已知的任何方法评估,包括但不限于,下述实施例6和7中描述的酶测定和质谱法。
萜类化合物在本文定义为通过萜烯合酶活性和可能的其它酶的后续修饰而衍生自异戊二烯基二磷酸底物的化合物。包含在术语萜类化合物中的是非氧化的萜类烯烃(萜烯)、氧化的萜烯和其它衍生物如萜醇。
如本文中所用,萜烯为基于异戊二烯单元(C5H8)的不饱和烃,并且具有C10H16的通式。萜烯可以为无环的、单环的或多环的。萜烯包括,但不限于,单萜,其含有10个碳原子;倍半萜,其含有15个碳原子;二萜,其含有20个碳原子;和三萜,其含有30个碳原子。提及萜烯时包括所述萜烯的立体异构体。
本发明中提及檀香烯时包括α-檀香烯和β-檀香烯,以及其任何立体异构体,包括,例如,(+)-表-β-檀香烯、(-)-β-檀香烯、(+)-β-檀香烯、(+)-α-檀香烯和(-)-α-檀香烯。
这些新萜烯合酶基因的分离将使得可以合成与天然油相似的檀香油。迄今为止,使用其它来源的倍半萜合酶合成一些倍半萜是可能的,但是其组分倍半萜的范围和每个组分的终比例与天然檀香油并不相似。
优选地,本发明的萜烯合酶基因分离自檀香属的成员。更优选地,其分离自印度檀香(IndianSandalwood、白檀、Chandana)、澳洲檀香(AustralianSandalwood)或新克里多尼亚檀香。然而,所述基因还可分离自选自以下的植物:密花澳洲檀香(S.acuminatum)(DesertQuandong,SweetQuandong,NativePeach);滨海夏威夷檀香(S.ellipticum)(滨海檀香);智利檀香(S.femandezianum);垂枝夏威夷檀香(S.freycinetianum);榄绿夏威夷檀香(S.haleakalae);大花澳洲檀香(S.lanceolatum)(北澳檀香);巴布亚檀香(S.macgregorii);钩叶澳洲檀香(S.murrayanum)(苦Quandong);伞花澳洲檀香(S.obtusifolium);亮叶夏威夷檀香(S.paniculatum);柳叶檀香(S.salicifolium)(柳叶檀香);或斐济檀香(S.yasi)。
因此,提供了分离的萜烯合酶,其中所述萜烯合酶为檀香属萜烯合酶;并且所述萜烯合酶催化檀香烯产生。
优选地,这样的萜烯合酶包括:
a)选自SEQIDNO:2、SEQIDNO:4或SEQIDNO:6所示序列的氨基酸序列;或
b)氨基酸序列,其与SEQIDNO:2所示序列具有至少或至少约60%、65%、70%、75%、80%、85%、90%、95%或更高的相同性;或
c)a)或b)的片段;
其中所述萜烯合酶催化檀香烯产生。
在另一个实施方案中,本发明提供了分离的萜烯合酶,其包括:
a)SEQIDNO:2、SEQIDNO:4或SEQIDNO:6所示的氨基酸序列;
b)由权利要求1-5中任一项的核酸分子所编码的氨基酸序列;
c)氨基酸序列,其与SEQIDNO:2所示的氨基酸序列具有至少或至少约60%、65%、70%、75%、80%、85%、90%、95%或更高的相同性;或
d)(a)、(b)或(c)的片段;
其中所述萜烯合酶催化萜烯产生。
优选地,这样的萜烯合酶包含选自对应于SEQIDNO:2的32-42、221-425、321-325、314-315和423-426位氨基酸的氨基酸。
更优选地,所述萜烯合酶催化萜烯的产生,所述萜烯选自单环倍半萜、双环倍半萜和三环倍半萜,特别地,其中所述萜烯是从无环焦磷酸萜烯前体如焦磷酸金合欢酯(FPP)合成。
SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的核苷酸序列涵盖单一ORF。本发明提供了分离的DNA核苷酸序列,其对应于SEQIDNO:1所示的萜烯合酶基因SaSSy的核苷酸序列、SEQIDNO:3所示的萜烯合酶SauSSy的核苷酸序列或SEQIDNO:5所示的SspiSSy的核苷酸序列,或与SEQIDNO:1、SEQIDNO:3或SEQIDNO:5基本同源的序列,或它们的片段。本发明还提供了DNA序列,其包含以下序列的互补序列:SEQIDNO:1、SEQIDNO:3或SEQIDNO:5,或与SEQIDNO:1、SEQIDNO:3或SEQIDNO:5基本上同源的序列,或它们的片段。
因此本发明提供了编码萜烯合酶的分离的核酸分子,其选自:
a)包含SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示的核苷酸序列的核酸分子;
b)核酸分子,其为(a)的片段;
c)核酸分子,其包含与(a)或(b)互补的核苷酸序列;和
d)核酸分子,其编码萜烯合酶并与(a)-(c)中任一核酸分子具有至少或至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%的相同性;
其中所述核酸分子编码萜烯合酶。
分离的核酸分子编码优选地与(a)-(d)中任一核酸分子所编码的萜烯合酶具有至少或至少约61%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%相同性的萜烯合酶,其中序列中的差异为氨基酸取代。
SaSSy、SauSSy和SspiSSy的核苷酸序列是非常高度保守的(见图4)。
SEQIDNO:1所示的SaSSy核苷酸序列编码在第143位氨基酸具有脯氨酸的多肽(SEQIDNO:2)。然而,所编码的多肽在第143位还可具有丝氨酸(SEQIDNO:7和SEQIDNO:8)。两种变体序列为基本同源的,尤其由于这两个残基都是极性的,并且随后的测试已表明,这两种蛋白质在测定时具有基本相同的活性,并以基本相同的比例产生各种化合物。一般地,两种变体蛋白具有相同的活性并以相同的比例产生各种化合物。
所述DNA序列还可对应于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的片段。优选地,所述片段选自SEQIDNO:1的下列位置:961-975位(通常对应于DDxxD基序),94-126位(通常对应于R(R/P)X8W基序)。不受任何特定理论的约束,相信DDxxD基序负责螯合二价金属离子(例如,镁离子),并且如果被去除,可能造成该蛋白质完全无功能。在蛋白质起始处的R(R/P)X8W基序也被相信是萜烯合酶独有的,并且被认为涉及非手性FPP或GPP分别特定地电离为手性的橙花叔醇二磷酸和橙花基二磷酸。
通过Kampranis等人(2007)的工作推断,其它对本发明的三种檀香烯合酶的特定功能来说可能是必不可少的区域是氨基酸位置314和315(核苷酸位置940-945)。用具有相似极性的较大或较小的残基取代这些残基可能会改变活性中心的大小,并因此改变催化产生的产物。如Kampranis等人所证实的,所述檀香烯合酶的第422-426位氨基酸残基(核苷酸1264-1278)还可能负责终产物谱。在α19螺旋起始处的脯氨酸残基的重要性是紧紧把握底物,而去除该脯氨酸可能引起功能性缺失。氨基酸位置221-426定义了涵盖许多优选保留的更重要区域的较大的区域。因此,在这些位置的残基优选为保守的(完整功能),或有稍微变化(改变的功能)。因此,DNA序列还可能优选对应于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的片段,其选自SEQIDNO:1的如下位置:940-945、661-1278或1264-1278位。
同源核酸分子是指预先确定的相同或同源的核苷酸数目。同源性包括不改变所编码氨基酸的取代(即“沉默取代”)和相同的残基。基本同源的核酸分子通常以中度严格性或高度严格性与感兴趣的核酸分子的全长或至少约70%、80%或90%的全长杂交。也考虑这样的核酸分子,其含有替换杂交核酸分子中的密码子的简并密码子。
可用已知的计算机算法来确定任何两个核酸分子是否具有至少80%、85%、90%、95%、96%、97%、98%或99%的“相同性”,例如“FASTA”程序,其使用如Pearson等人,Proc.Natl.Acad.Sci.USA85:2444(1988)所述的默认参数(其它的程序包括GCG程序包(Devereux,J.等人,NucleicAcidsResearch12(I):387(1984))、BLASTP、BLASTN、FASTA(Atschul,S.F.等人,J.Molec.Biol.215:403(1990);GuidetoHugeComputers,MartinJ.Bishop,ed.,AcademicPress,SanDiego(1994)和Carillo等人,SIAMJAppliedMath48:1073(1988))。其它的商业或公开可用的程序包括DNAStar的“MegAlign”程序(Madison,WI)和威斯康星大学遗传学计算机组(UWG)的“Gap”程序(MadisonWI))。例如,核酸分子同源性或相同性的百分比可通过使用GAP计算机程序(例如,Needleman等人,J.Mol.Biol.48:443(1970),如Smith和Watermand所修改的(Adv.Appl.Math.2:482(1981))来比较序列信息而确定。简言之,GAP程序将相似性定义为相似的比对符号(即核苷酸)的数目除以两条序列中较短那条的符号总数。GAP程序的默认参数可包括:(1)一元比较矩阵(对与相同性,值为1;和对于非相同性,值为0)和加权比较矩阵,Gribskov等人,Nucl.AcidsRes.14:6745(1986),如Schwartz和Dayhoff,eds.,AtlasofProteinSequenceandStructure,NationalBiomedicalResearchFoundation,pp.353-358(1979)中所描述的;(2)对每个缺口3.0的罚分和每个缺口中每个字符0.10的额外罚分;和(3)对末端缺口不罚分。
当本发明的多核苷酸序列或其片段特异性地与另一SaSSy、SauSSy或SspiSSy多核苷酸(或其互补链)在选择性的杂交条件下杂交时,则存在基本上的同源性或相同性。如本文中所用,“特异性杂交”是指核酸分子(如,寡核苷酸)与靶核酸分子通过互补的碱基配对退火。本领域技术人员熟悉影响特异性杂交的体外和体内参数(如特定分子的长度和组成)。与体外杂交特别相关的参数进一步包括退火和洗涤温度、缓冲液组成和盐浓度。去除非特异性结合的核酸分子的示范性洗涤条件在高度严格性下为0.1×SSPE,0.1%SDS,65℃,而在中度严格性为0.2×SSPE,0.1%SDS,50℃。等效的严格性条件是本领域已知的。技术人员可轻易地调整这些参数,以在低、中或高度严格性条件下实现核酸分子与靶核酸分子(适合于特定应用的)的特异性杂交。
一般地,当至少约14个核苷酸的片段存在至少约55%,优选至少约65%,更优选至少约75%,最优选至少约90%相同性时,选择性杂交将会发生。同源性长度比较,如所描述的,可在更长的片段上进行并且在某些实施方案中经常会在至少约9个核苷酸、通常至少约20个核苷酸、更通常至少约24个核苷酸、一般至少约28个核苷酸、更通常至少约32个核苷酸并且优选至少约36个或更多核苷酸的片段上进行。
因此,本发明的多核苷酸序列优选与本文中的序列表所示的序列具有至少75%、更优选至少85%、更优选至少90%的同源性。更优选具有至少95%、更优选至少98%的同源性。核苷酸同源性比较可如下描述的用于多肽的比对进行。优选的序列比较程序是GCGWisconsinBestfit程序。
在本发明中,同源性序列包括在核酸水平上与相应的SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示的核苷酸序列在至少20、50、100、200、300、500、1000、1500或1710个核苷酸上具有至少60、70、80或90%相同性,优选至少95%或98%相同性的核苷酸序列。尤其是,同源性一般应考虑编码已知对萜烯合酶基因功能是必不可少的连续氨基酸序列的核酸序列区域,而不是非必要的邻近序列。例如,编码氨基酸位置32-42(核苷酸94-126)和/或氨基酸位置321-325(核苷酸961-975)的核酸序列,和/或可选地编码氨基酸位置221-426(核苷酸661-1278),位置314-315(核苷酸940-945)和/或位置422-426(核苷酸1264-1278)的核酸序列。
本发明的SaSSy、SauSSy或SspiSSy多核苷酸序列片段将优选为至少15个核苷酸的长度,更优选至少20、30、40、50、100或200个核苷酸的长度。一般地,多核苷酸序列的长度越短,获得选择性杂交所要求的同源性越高。因此,当本发明的多核苷酸序列由少于约30个核苷酸组成时,与本文中序列表所列出的多核苷酸序列相比,应优选相同性的百分比高于75%,优选高于90%或95%。相反地,当本发明的多核苷酸序列由例如多于50或100个核苷酸组成时,与本文中序列表所列出的多核苷酸序列相比,相同性的百分比可较低,例如高于50%,优选高于60%或75%。
本发明的与SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示序列同源的核酸序列可根据本领域已知的任何技术表征并分离,如通过序列特异性的引物扩增、在较高或较低严格性条件下与序列特异性的探针杂交、血清学筛查方法或通过LiPA分型系统。
SaSSy的基因组DNA序列在SEQIDNO:9中提供。
还提供了SaSSy、SauSSy和SspiSSy基因的RNA。RNA序列优选源自以上描述并提供于SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的DNA序列。
本发明还提供了可与SaSSy、SauSSy或SspiSSy基因组DNA杂交的RNA片段。所述RNA或RNA片段序列还可源自SaSSy、SauSSy或SspiSSy或其片段的cDNA序列。
本发明还提供了包含一些不会实质上改变其与SaSSy、SauSSy或SspiSSy杂交能力的缺失或突变的核酸序列和片段。这样的变体被认为形成了上述DNA、RNA或片段的显而易见的等效物。
本发明其它优选的变体核酸序列包括与任何上述给定的本发明的核酸序列相比冗余的序列,冗余由遗传密码简并性导致。这些变体核酸序列会因此与其所来源的核酸序列一样编码相同的氨基酸序列。优选地,这些变体的DNA、RNA或cDNA可与SaSSy、SauSSy或SspiSSy基因序列相应的部分杂交。
本发明还包括SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的DNA序列或相应的RNA序列或其片段的序列变体,其包含一或多个核苷酸的缺失和/或插入,尤其是一或多个密码子的插入或缺失。
还包括一些非必须核苷酸由其它核苷酸(包括修饰的核苷酸和/或肌苷)的取代。
本发明特别优选的变体多核苷酸还包括在严格性条件下与任何本发明的核酸序列杂交的序列。因此,优选与如上描述的本发明的任何序列显示有高程度同源性(相似性)的序列。尤其优选的是与所述本发明的核酸序列具有至少80%、85%、90%、95%或更高同源性的序列。优选地,所述序列将具有所述核酸序列原始核苷酸的少于20%、15%、10%或5%的变异。
还提供了引物和探针,其可从本发明的任何DNA或RNA序列或序列片段出发来制备。优选地,这样的探针或引物长约5至50核苷酸,更优选约10至25核苷酸。优选地,探针或引物寡核苷酸包含来自萜烯合酶核酸分子的至少或至少约15、20、25、30、35、40、45、50、60个或更多的连续的核苷酸。本发明的探针和引物可用于PCR、测序反应、杂交反应和技术人员已知的其它应用。优选地,探针和/或引物会从易于由技术人员确定的高G和C含量的区域生成。
本发明还涉及寡核苷酸引物,其包含SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的部分,所述引物能够作为特异性扩增SaSSy、SauSSy或SspiSSy核酸的引物。优选地,所述引物是单链DNA寡核苷酸序列,其能够作为引物延伸产物的合成起始点,所述引物延伸产物与待复制的核酸链是互补的。所用引物的具体长度和序列取决于所需的DNA或RNA靶的复杂度以及引物使用的条件,如温度和离子强度。扩增引物不是必须与对应的模板序列准确匹配以保证正确的扩增的事实在文献(Kwok等人,1990)中充分记录。
所用扩增方法可为聚合酶链式反应(PCR;Saiki等人,1988)、连接酶链式反应(LCR;Langdren等人,1988;Wu和Wallace,1989;Barany,1991)、基于核酸序列的扩增(NASBA;Guatelli等人,1990;Compton,1991)、基于转录的扩增系统(TAS;Kwoh等人,1989)、链置换扩增(SDA;Duck,1990;Walker等人,1992)或通过Qβ复制酶的扩增(Lizardi等人,1988;Lomeli等人,1989)或任何其它合适的使用引物延伸扩增核酸分子的方法。在扩增期间,扩增产物可通过使用标记的引物或掺入标记的核苷酸被方便地标记。标记可能为同位素的(32P、35S等)或非同位素的(生物素、地高辛等)。扩增反应重复20-70次,最好25-45次。
本发明还涉及寡核苷酸探针,其包含SEQIDNO:1、SEQIDNO:3或SEQIDNO:5的部分,所述探针能够作为SaSSy、SauSSy或SspiSSy基因的杂交探针。优选地,所述探针为单链的序列特异性寡核苷酸序列,其具有与待测定的SaSSy、SauSSy或SspiSSy基因的靶序列互补的序列。
本领域技术人员会认可杂交的严格性会由这样的条件所影响:盐浓度、温度或有机溶剂,还有碱基组成、互补链长度和杂交核酸间错配核苷酸碱基的数目。严格性温度条件一般会包括超过30℃的温度,通常超过37℃,并且优选超过45℃。严格性盐条件通常会低于1000mM,一般低于500mM,并且优选低于200mM。然而,参数的组合比任何单个的参数更重要。严格性杂交条件的一个实例是65℃、0.1×SSC(1×SSC=0.15MNaCl,0.015M柠檬酸钠,pH7.0)。
任选地,本发明的探针被标记和/或连接至固体基质。固体基质指寡核苷酸探针可偶联的任何基质,条件是所述寡核苷酸探针保持杂交特性并使杂交背景保持低水平。固体基质通常是微量滴定板、膜(如尼龙膜或硝酸纤维素膜)或微球(珠)。在施加至膜或固定之前,可方便地修饰核酸探针以促进固定或改进杂交效率。这样的修饰可涵盖同聚物加尾、偶联不同的活性基团(如脂肪基团、NH2基团、SH基团、羧基基团)或偶联生物素或半抗原。
本发明的探针还包括连接至标记或报告分子的分离的多核苷酸并且可用于通过标准方法分离其它具有序列相似性的多核苷酸序列。用于制备和标记探针的技术见,如Sambrook和Russell(2001)或Ausubel等人,(2001)。
本发明的用作引物或探针的寡核苷酸还可能含有或由核苷酸类似物(如硫代磷酸酯(Matsukura等人,1987)、烷基磷酸酯(alkylphosphoriate)(Miller等人,1979)或肽核酸(Nielsen等人,1991;Nielsen等人,1993))组成,或可能包含插层剂(Asseline等人,1984)。为了积极地影响如杂交动力学、杂交物形成的可逆性、寡核苷酸分子的生物学稳定性等等性状,引入这些修饰可能是有益的。
本发明还提供了含有SaSSy、SauSSy或SspiSSy基因DNA序列片段的重组DNA,并且其可能用作,例如,探针。优选地,用于产生重组DNA的质粒是在原核或真核细胞中可扩增的并携带所述片段的质粒。例如,使用含有SaSSy基因DNA片段的克隆的DNA作为分子杂交探针,通过放射性核苷酸或荧光试剂标记,例如在檀香树的不同组织中,该基因可被直接检测。
SaSSy、SauSSy或SspiSSy多核苷酸序列(优选以探针的形式)还可被固定到固相支持物上来检测SaSSy基因。在本发明可选的形式中,SaSSy、SauSSy或SspiSSy多核苷酸序列与其他多核苷酸序列(如来自其他萜烯合酶基因)一起可以这样的方式被固定于固相支持物,即其允许确定结合固相支持物的适当萜烯合酶基因和/或任何其他多核苷酸序列在材料(如树样品)中的存在。
在本领域中已经描述了用于产生DNA分子的固定化文库的技术。一般地,多数现有技术方法描述了单链核酸分子文库的合成,例如使用屏蔽技术在固体基质上的不同的离散位置建立不同的序列排列(permutation)。美国专利号5,837,832描述了用于产生固定于硅基质上的DNA阵列的基于非常大规模的整合技术的改进方法。特别地,美国专利号5,837,832描述了叫做“覆瓦(tiling)”的用于在基质上空间限定的位置合成特定探针组的策略,其可用于产生本发明的固定化DNA文库。美国专利号5,837,832还提供了关于可使用的早期技术的参考文献。因此多核苷酸序列探针可在基质表面原位合成。
另外,单链分子可不在固体基质上合成而将每个预先形成的序列施加至固体基质上的离散位置。例如,多核苷酸序列可用配备了针脚或压电器件的机械设备直接印于基质上。
文库序列一般固定于固体基质的离散区域上或离散区域内。基质可以是多孔的(以允许在基质内的固定)或基本上非多孔的(在该情况下文库序列通常固定于基质表面)。固体基质可由多肽可直接地或间接地结合的任何材料制成。适当的固体基质的实例包括平板玻璃、硅片、云母、陶瓷和有机聚合物(如塑料,包括聚苯乙烯和聚甲基丙烯酸酯)。也还可能使用半透膜(如广泛可获得的硝酸纤维素或尼龙膜)。所述半透膜可安装于更坚硬的固体表面如玻璃上。其表面可任选地涂有金属层,如金、铂或其它过渡族金属。合适的固体基质的具体实例是商业可得的BiaCoreTM芯片(PharmaciaBiosensors)。
优选地,固体基质通常为具有刚性或半刚性表面的材料。在优选的实施方案中,所述基质的至少一个表面为基本平的,不过在一些实施方案中,可能需要用例如凸起区域或蚀刻坑道为不同聚合物进行物理上的分区。所述固体基质还优选为适合于在一般为50至100μm的离散区域以高密度施加DNA序列,给出10000至40000点/cm-2的密度。
所述固体基质可方便地分为区段(section)。这可通过例如光蚀刻技术,或通过应用疏水性油墨,例如基于聚四氟乙烯的油墨(Cel-line,USA)来实现。
多核苷酸序列与基质的连接可通过共价或非共价的方法。所述多核苷酸序列可通过文库序列所结合的一层分子连接于基质。例如,多核苷酸序列可标记有生物素并且基质用抗生物素蛋白和/或链霉亲和素包被。使用生物素化多核苷酸序列的一个便利的特点是可容易地测定偶联至固体基质的效率。由于多核苷酸序列可能与一些固体基质仅很差地结合,因此通常有必要在固体基质(例如玻璃)与核酸序列之间提供化学界面。适当的化学界面的实例包括六乙二醇。另一个实例是使用聚赖氨酸包被的玻璃,然后使用标准方法化学修饰聚赖氨酸来引入亲和配体。其它的通过使用偶联剂将分子连接到固体基质表面的方法是本领域已知的,见例如WO98/49557。
互补多核苷酸序列与被固定的核酸文库的结合可用各种方法测定,如结合的多核苷酸序列的光学特征的变化(即通过使用溴化乙锭)或通过使用标记的核酸如用荧光团标记的多核苷酸。其它不需要使用标记的检测技术包括光学技术如光声学、反射法、椭圆偏光法和表面等离子共振(见WO97/49989)。
因此,本发明提供了固体基质,其具有固定于其上的至少一种本发明的多核苷酸,优选两或多种不同的本发明的多核苷酸序列。在优选的实施方案中固体基质还含有源自除SaSSy、SauSSy或SspiSSy多核苷酸序列以外的基因的多核苷酸序列。
优选地,SaSSy、SauSSy或SspiSSy基因的转录被上调或促进(例如在人工系统如宿主细胞或重组植物中),其可导致提高的油产量。这种上调或提高可由极多方法完成,如插入额外的或可选的调控序列至考虑中的基因的上游和/或下游,或产生已存在的调控序列的突变体,所述突变体能够由于例如其调控元件结合的提高而提高转录。
本发明还覆盖了由上述RNA和DNA核苷酸序列及其片段所编码的多肽。本发明还提供了如SEQIDNO:2、SEQIDNO:4或SEQIDNO:6所示的分离的SaSSy、SauSSy或SspiSSy氨基酸序列及其片段。更合乎需要地,所述SaSSy、SauSSy或SspiSSy氨基酸序列以基本上纯化的形式提供。也提供多肽片段,其具有更低分子量并具有与SEQIDNO:2、SEQIDNO:4或SEQIDNO:6所示那些一样的肽序列或片段。
如本文中所用,“氨基酸”为含有氨基基团和羧酸基团的有机化合物。多肽含有两个或多个氨基酸。为了本文中的目的,氨基酸包括20种天然存在的氨基酸、非天然氨基酸和氨基酸类似物(即其中的α碳具有侧链的氨基酸)。
为了符合在J.Biol.Chem.,243:3552-3559(1969)中描述的和37C.F.R..§§1.821-1.822所采用的标准多肽命名法,氨基酸残基的缩写示于下列的对应表中:
应当指出,本文中由式表示的所有氨基酸残基序列自左至右为常规的氨基端至羧基端的方向。此外,短语“氨基酸残基”被广泛地定义为包括对应表中列出的氨基酸和修饰的和不常见的氨基酸,如在37C.F.R.§§1.821-1.822中提及并通过引用并入本文的那些。此外,应指出,在氨基酸残基序列开头和结尾处的横线表示与另外的一或多个氨基酸残基序列、氨基端基团如NH2或羧基端基团如COOH相结合的肽键。
如本文中所用,“天然存在的氨基酸”是指在多肽中存在的20种L-氨基酸,而“非天然氨基酸”是指含有氨基基团和羧基基团的有机化合物,其并非对应表中列出的天然存在的氨基酸。因此,非天然存在的氨基酸包括,例如,20个天然存在氨基酸之外的氨基酸或氨基酸类似物,包括但不限于,D-立体异构体(isostereomer)氨基酸。非天然存在的氨基酸可并入本文中提供的萜烯合酶及其变体。
术语“分离的”用于描述本发明的氨基酸序列,其已从其天然状态所伴随的组分中分离出来。另外,当至少约60至75%的样品展现出单一SaSSy氨基酸序列时,本发明的氨基酸序列为“基本上纯化的”。基本上纯化的SaSSy、SauSSy或SspiSSy氨基酸序列一般会包含样品的约60至90%W/W,更通常约95%,并优选将超过约99%纯。蛋白质纯度或同质性可通过本领域已知的大量方法表明,如蛋白质样品的聚丙烯酰胺凝胶电泳,随后在染色的胶上观察单一的氨基酸序列条带。出于某些目的,通过使用HPLC或其它本领域熟知的方法(其已被用于应用)可提供更高的分辨率。
本发明还考虑了SaSSy、SauSSy或SspiSSy氨基酸序列的片段。根据本发明这方面的氨基酸序列片段为至少约5-7个连续氨基酸的一段氨基酸残基,通常为至少约7-9个连续的氨基酸,一般至少约9-13个连续的氨基酸,并且最优选地,至少约20-30个或更多的连续的氨基酸。
在本发明高度优选的形式中,所述片段展现SaSSy、SauSSy或SspiSSy氨基酸序列的配体结合、免疫学活性和/或其它生物学活性性状。更优选地,所述片段具有与天然SaSSy、SauSSy和SspiSSy氨基酸序列上存在的免疫学表位相一致的免疫学表位。
如本文中所用,“表位”指多肽的抗原决定簇。表位可包含表位独特的空间构象的3个氨基酸。一般地,表位至少由5个氨基酸组成,更通常由至少8-10个氨基酸组成。测定这样的氨基酸的空间构象的方法是本领域已知的。
本发明优选的SaSSy、SauSSy或SspiSSy氨基酸序列将具有天然全长氨基酸序列的一或多个生物学特性(如体内、体外或免疫学特性)。另外,SaSSy、SauSSy或SspiSSy全长氨基酸序列的片段可能具有一或多个编码全长氨基酸序列的基因的生物学特性。
针对SaSSy、SauSSy或SspiSSy基因特定区域的抗体可由本领域技术人员确定,例如使用在G.W.Turner和R.Croteau,OrganizationofmonoterpenebiosynthesisinMentha.Immunocytochemicallocalizationsofgeranyldiphosphatesynthase,limonene-6-hydroxylase,isopiperitenoldehydrogenase,andpulegonereductase.PlantPhysiology136(2004)4215-4227中记载的技术。
SaSSy、SauSSy或SspiSSy基因的氨基酸序列,包括类似物、片段和衍生物,可合成制备(如,使用众所周知的固相或液相肽合成技术)。优选地,采用固相合成技术。另外,本发明的SaSSy、SauSSy或SspiSSy氨基酸序列可使用众所周知的基因工程技术制备,如下文描述。在另一个实施方案中,氨基酸序列可从生物学材料(如树木心材、树液等)中纯化(如通过免疫亲和纯化)。
针对SaSSy、SauSSy或SspiSSy基因特定区域的氨基酸序列和衍生的肽生物标记物可由本领域技术人员确定,例如,使用ZulakKG,LippertDN,KuzykM,DomanskiD,ChouT,BorchersCHandJBohlmann(2009)Targetedproteomicsusingselectedreactionmonitoring(SRM)revealstheinductionofspecificterpenesynthasesinamulti-levelstudyofmethyljasmonatetreatedNorwayspruce(Piceaabies).ThePlantJournal60:1015-1030中所记载的方法。
SaSSy、SauSSy或SspiSSy氨基酸序列类似物优选包括那些其中一或多个氨基酸被另一种氨基酸取代的氨基酸序列,所述取代基本上不改变该分子的生物学活性。
本发明的SaSSy、SauSSy或SspiSSy萜烯合酶的变体可用于实现所需的酶活性提高或降低、修饰的区域选择性化学或立体化学、或改变的底物利用或产物分布。变体或定点突变体可由本领域已知的任何方法制备。天然多肽的变体和衍生物可通过分离其它或相同植物株系或物种中天然存在的变体或变体的核苷酸序列来获取,或通过人工编程编码天然檀香多肽的核苷酸序列的突变来获取。
就本发明上下文中,同源性序列包括在至少20、50、100、200或570个氨基酸与SEQIDNO:2、SEQIDNO:4或SEQIDNO:6所示氨基酸序列在氨基酸水平上具有至少60、70、80或90%同源性,优选至少95%或98%同源性的SaSSy、SauSSy或SspiSSy氨基酸序列。尤其是,同源性一般应考虑编码已知对萜烯合酶基因功能是必不可少的连续氨基酸序列的序列区域,而不是非必要的邻近序列。例如,32-42位氨基酸和/或321-325位氨基酸,或可选地221-425位、314-315位和/或422-426位氨基酸。
虽然同源性可认为是依据相似性(即具有相似化学特性/功能的氨基酸残基),就本发明上下文中,优选依据序列相同性来表示同源性。当涉及SaSSy氨基酸序列时,术语“基本上同源”或“基本上相同”表明,考虑中的氨基酸序列展现出和天然存在的SaSSy、SauSSy或SspiSSy完整氨基酸序列或其部分至少约70%的相同性,通常至少约80%的相同性并且优选至少约90%或95%的相同性。
如本文中所用,“序列相同性”是指在测试和参考多肽或多核苷酸之间的比较中相同氨基酸(或核苷酸碱基)的数目。同源多肽是指预先确定的相同或同源氨基酸残基数。同源性包括保守氨基酸取代和相同的残基。序列相同性可通过使用由各个供应商建立的默认缺口罚分的标准比对算法程序确定。
为了确定蛋白质同源性,可比对保守氨基酸以及相同的氨基酸;在该情况下,相同性百分比和同源性百分比不同。可用已知的计算机算法来确定任何两个氨基酸序列是否具有至少80%、85%、90%、95%、96%、97%、98%或99%的“相同性”,例如“FASTA”程序,其使用如Pearson等人,Proc.Natl.Acad.Sci.USA85:2444(1988)所述的默认参数(其它的程序包括GCG程序包(Devereux,J.等人,NucleicAcidsResearch12(I):387(1984))、BLASTP、BLASTN、FASTA(Atschul,S.F.等人,J.Molec.Biol.215:403(1990);GuidetoHugeComputers,MartinJ.Bishop,ed.,AcademicPress,SanDiego(1994)和Carillo等人,SIAMJAppliedMath48:1073(1988))。例如,国家生物技术信息中心数据库的BLAST功能可用于确定相同性。其它的商业或公开可用的程序包括DNAStar的“MegAlign”程序(Madison,WI)和威斯康星大学遗传学计算机组(UWG)的“Gap”程序(MadisonWI))。
例如,蛋白质和/或核酸分子同源性或相同性的百分比可通过使用GAP计算机程序(例如,Needleman等人,J.Mol.Biol.48:443(1970),如Smith和Watermand所修改的(Adv.Appl.Math.2:482(1981))比较序列信息而测定。简言之,GAP程序将相似性定义为比对的相似符号(即核苷酸或氨基酸)的数目除以两条序列中较短那条的符号总数。GAP程序的默认参数可包括:(1)一元比较矩阵(包含相同性的值为1和非相同性的值为0)和加权比较矩阵,Gribskov等人,Nucl.AcidsRes.14:6745(1986),如Schwartz和Dayhoff,eds.,AtlasofProteinSequenceandStructure,NationalBiomedicalResearchFoundation,pp.353-358(1979)中所描述的;(2)对每个缺口3.0的罚分和每个缺口中每个符号0.10的额外罚分;和(3)对末端缺口不罚分。
因此,如本文中所用,术语“相同性”表示在测试和参考多肽或多核苷酸之间的比较。在一个非限制性的实例中,“至少90%相同”指相对于参考多肽,相同性百分比为90至100%。90%或更高水平的相同性表明,假设(为了例证的目的)长度100个氨基酸的测试和参考多核苷酸进行比较,在测试多肽中不超过10%(即100个中的10个)的氨基酸与参考多肽中的不同。这样的差异可由在整个氨基酸序列长度上随机分布的点突变所代表,或它们可聚集于不同长度上(多至所允许的最大值)的一或多个位点,如10/100氨基酸差异(大约90%相同性)。差异定义为氨基酸取代、插入或缺失。在超过约85-90%同源性或相同性的水平上,结果应不依赖于程序和缺口参数设定;这样高水平的相同性可容易地被评估,通常不依靠于软件。
在本发明高度优选的形式中,SaSSy、SauSSy或SspiSSy氨基酸序列类似物与SEQIDNO:2、SEQIDNO:4或SEQIDNO:6中列出的SaSSy、SauSSy或SspiSSy氨基酸序列将具有80%或更高的氨基酸序列相同性。在本发明范围内这样的氨基酸序列类似物的实例包括SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸序列,其中:(a)一或多个天冬氨酸残基由谷氨酸取代;(b)一或多个异亮氨酸残基由亮氨酸取代;(c)一或多个甘氨酸或缬氨酸残基由丙氨酸取代;(d)一或多个精氨酸残基由组氨酸取代;(e)一或多个酪氨酸或苯丙氨酸残基由色氨酸取代;或(f)一或多个脯氨酸残基由丝氨酸残基取代。
本发明还涵盖天然存在的肽变体。这样的变体的实例为由mRNA可变剪切事件或本文中描述的多肽的蛋白水解裂解得到的蛋白质。例如,归因于蛋白质水解的变异包括例如在不同类型宿主细胞中表达的N-或C-末端差异,其由于蛋白质水解从由本发明的序列所编码的多肽上去除一或多个末端氨基酸。
本发明还提供了SaSSy、SauSSy或SspiSSy氨基酸序列衍生物,其包括在一级结构上为基本上同源但包含化学和/或生物化学修饰或非常见氨基酸的氨基酸序列、类似物或其片段。例如,这样的修饰包括乙酰化、羧基化、磷酸化、糖基化、羟基化、硫酸化、泛素化、标记(如,用放射性核苷酸)和多种酶修饰,其将容易地由本领域熟练技术人员鉴别。
本发明的萜烯合酶还可能以“嵌合蛋白”或“融合蛋白”的形式提供。这样的蛋白质为可操作地连接于不同多肽的多肽。本文中所提供的嵌合或融合蛋白可包括一或多种萜烯合酶多肽或其部分,以及用于以下一或多种的一或多种其它多肽:转录/翻译控制信号、信号序列、用于定位的标签、用于纯化的标签、免疫球蛋白G的结构域的一部分,和/或靶向剂。这些嵌合或融合蛋白包括通过重组方法产生的融合蛋白质、通过化学方法如化学偶联(例如,偶联于巯基基团)产生的,和通过任何其它方法产生的,据此至少有一种多肽(如萜烯合酶)或其部分通过接头直接或间接地连接于另一多肽上。
SaSSy、SauSSy或SspiSSy氨基酸序列以标记的形式提供时,多种用于标记氨基酸序列的方法为本领域众所周知的,其包括放射性同位素如3H或14C、结合于标记的抗配体(如抗体)的配体、荧光团、化学发光剂、酶和可作为标记的配体的特异性结合对成员的抗配体。标记的选择取决于所需的灵敏度、稳定性要求和可用的仪器。标记氨基酸序列的方法是本领域众所周知的[见,如Sambrook等人,MolecularCloning:ALaboratoryManual,SecondEdition,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork(1989);和Ausubel,F.,Brent,R.,Kingston,R.E.,Moore,D.D.,Seidman,J.G.,Smith,J.A.,Struhl,K.Currentprotocolsinmolecularbiology.GreenePublishingAssociates/WileyIntersciences,NewYork(2001)]。
本发明的SaSSy、SauSSy和SspiSSy氨基酸序列,如果可溶,可偶联于固相支持物,如,硝酸纤维素、尼龙、柱填充材料(如,Sepharose珠)、磁珠、玻璃棉、塑料、金属、聚合物凝胶、细胞或其它基质。这样的支持物可采取例如珠、孔、试纸或膜的形式。
本发明还提供融合多肽,其包含SaSSy、SauSSy或SspiSSy氨基酸序列和片段。因此,SaSSy、SauSSy或SspiSSy氨基酸序列可能为两或多个本发明的氨基酸序列间的融合物或为来自SaSSy、SauSSy或SspiSSy和相关蛋白质的氨基酸序列之间的融合物。同样,可构造异源融合物,其将展现出来源蛋白质的性质或活性的组合。例如,配体结合或其它结构域可能在不同的融合多肽或片段间“交换”。例如,这样的同源或异源融合多肽可能表现出改变的结合强度或特异性。融合配对物(partner)包括免疫球蛋白、细菌β-半乳糖苷酶、trpE、蛋白A、β-内酰胺酶、α-淀粉酶、乙醇脱氢酶和酵母α-交配因子。
可使用常规技术合成或通过修饰的多核苷酸序列编码并使用重组核酸方法产生修饰的SaSSy、SauSSy或SspiSSy氨基酸序列。修饰的多核苷酸序列还可通过常规技术制备。融合蛋白一般会通过重组核酸方法制备或可化学合成。
本发明的萜烯合酶的变体可用于实现所需的酶活性提高或降低、修饰的区域选择性化学或立体化学、或改变的底物利用或产物分布。此外,可制备至少具有一种修饰的特性的变体,例如对底物提高的亲和力、用于产生一或多种所需化合物的改进的特异性、不同的产物分布、不同的酶活性、提高的酶反应速度、在特定环境(pH、温度、溶剂等)中更高的活性或稳定性或在所需的表达系统中改进的表达水平。变体或定点突变体可由本领域已知的任何方法制备。
如上所述,本发明提供重组和非重组的、分离的和纯化的多肽。天然多肽的变体和衍生物可通过分离其它或相同植物株系或物种中天然存在的变体或变体的核苷酸序列来获取,或通过编码天然檀香多肽的核苷酸序列的人工编程突变来获取。天然氨基酸序列的改变可通过许多常规方法中的任何一个完成。
由本发明多肽的氨基和羧基末端上额外的肽序列的融合导致的多肽变体可用于在所需的环境或表达系统中提高该多肽的表达、帮助纯化该蛋白质或改进该酶活性。例如,这种额外的多肽序列可以是信号肽。因此,本发明涵盖本发明多肽的变体,如通过与其它寡肽或多肽融合所获取的变体和/或连接于信号肽的多肽。
因此,在一个实施方案中,本发明提供用于制备具有所需萜烯合酶活性的变体多肽的方法,所述方法包括步骤:
a)选择由如上描述的SEQIDNO:1、SEQIDNO:3或SEQIDNO:5,其片段或变体组成的组中的任一核酸;
b)修饰所选的核酸以获取至少一种突变核酸;
c)用所述突变核酸序列转化宿主细胞以表达由所述突变核酸序列编码的多肽;
d)在所述多肽中筛选具有至少一种修饰的特性的功能多肽。
e)任选地,如果所述多肽不具有所需的变体萜烯合酶活性,重复处理步骤(a)至(d)直至获取具有所需变体萜烯合酶活性的多肽(即DNA改组)。
在步骤(b)中,可创建大量的突变核酸序列,例如通过随机诱变、定点突变或DNA改组。基因改组的详细步骤可在Stemmer,W.P.(1994)DNAshufflingbyrandomfragmentationandreassembly:invitrorecombinationformolecularevolution.ProcNatlAcadSciUSA.91(22):10747-1075中发现。简言之,DNA改组是指体外随机重组已知序列的过程,其涉及至少2种选择用于重组的核酸。例如,突变可通过合成包含突变序列的寡核苷酸(两侧为限制性位点以使其能连接至天然序列的片段)引入至特定的位点。连接后,所得的重建序列编码具有所需氨基酸插入、取代或缺失的类似物。另外,可采用寡核苷酸定向的定点突变步骤以提供改变的基因,其中预先确定的密码子可通过取代、缺失或插入而改变。
因此,SEQIDNO:1、SEQIDNO:3或SEQIDNO:5,其片段和变体的任何一个可能与选自SEQIDNO:1、SEQIDNO:3或SEQIDNO:5,其片段和变体的不同序列和/或与其它的(例如,分离自除印度檀香、新克里多尼亚檀香或澳洲檀香之外的生物的)萜烯合酶编码核酸重组。因此,可能获取并分离突变核酸,其可用于根据标准程序转化宿主细胞。
在步骤(d)中,对获取于步骤(e)的多肽筛选修饰的特性(例如,所需的修饰的酶活性)。可能对所表达的多肽筛选的所需酶活性的实例包括提高或降低的酶活性(通过KM或Vmax值衡量),例如,修饰的区域选择性化学或空间化学、改变的底物利用或产物分布。酶活性的筛选可根据技术人员熟悉的步骤进行。测定动力学数据的方法和分析萜烯产物的方法,例如,在实施例13和14中给出。
步骤(e)提供处理步骤(a)-(d)的重复,优选地,其可平行地实施。因此,通过创建大量的突变核酸,许多宿主细胞可同时用不同的突变核酸转化,使得可以随后筛选更大量的多肽。因此根据技术人员的判断,获取所需变体多肽的机会可被提高。
在一个实施方案中,本发明提供了用于制备编码具有萜烯合酶活性的变体多肽的核酸的方法,所述方法包括上述公开的步骤(a)-(e)并且进一步包括步骤:(f)如果鉴定了具有所需变异萜烯活性的多肽,获得步骤(c)中获取的突变核酸,其用于在步骤(c)和(d)之后转化宿主细胞以表达变体萜烯合酶。
优选地,本发明的萜烯合酶多肽催化单、双和/或三环倍半萜产生。优选地,所述萜烯合酶由无环焦磷酸萜烯前体底物产生或合成倍半萜。无环焦磷酸萜烯前体是任何无环的焦磷酸化合物,其是至少一种萜烯的产生的前体,包括但不限于,焦磷酸香叶酯(GPP)、焦磷酸金合欢酯(FPP)和焦磷酸香叶基香叶酯(GGPP)。一般来说,GPP是单萜的前体、FPP是倍半萜的前体并且GGPP是二萜的前体。优选地,所述前体是FPP。
如本文中所用,“催化萜烯产生”或“催化檀香烯产生”是指萜烯合酶从底物(如无环萜烯前体)分别产生萜烯或其混合物,或具体地檀香烯或其混合物的能力。萜烯(如檀香烯)通过萜烯合酶由底物的形成可使用本领域已知的任何方法评估,包括但不限于,下述实施例6和7中描述的酶测定和质谱方法。
通常,“催化萜烯产生”的多肽从特定的底物以总萜烯的至少或至少约1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更多的量(按重量计算)产生萜烯或其混合物,其使用体外测定(如在实施例6、7、13和14中描述的测定)来测量,其中所述萜烯合酶(如檀香烯合酶)与底物(如FPP)在Mg2+存在下混合。由所述合酶产生的檀香烯可包括α-檀香烯和/或β-檀香烯,包括(+)-表-β-檀香烯、(-)-β-檀香烯、(+)-β-檀香烯、(+)-α-檀香烯、和(-)-α-檀香烯。例如,在本文中提供的萜烯合酶包括檀香属物种的萜烯合酶,其催化由FPP产生α-檀香烯,其中由FPP所产生的α-檀香烯的量至少为或至少约为产生自FPP的总萜烯(按重量计算)的1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更多。在另外的实施例中,萜烯合酶催化由FPP产生β-檀香烯,其中由FPP所产生的β-檀香烯的量至少为或至少约为产生自FPP的总萜烯(按重量计算)的1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更多。
优选地,本发明分离的多肽能够由FPP形成红没药阳离子(bisabolylcation)并且能够进一步在FPP的C3和C7碳原子之间形成键以产生包含C3-C7键的双环或三环倍半萜。相似地,本发明的多肽能够由FPP形成红没药阳离子并且能够进一步在FPP的C2和C7碳原子之间形成键以产生包含C2-C7键的双环或三环倍半萜。
术语“能够合成”化合物(如特定的倍半萜)和术语“萜烯合酶活性”,优选“倍半萜合酶活性”,是指本发明的多肽和编码这些多肽的核酸,其能够由至少一种起始化合物(其优选为无环焦磷酸萜烯前体)合成萜烯,优选倍半萜,更优选檀香烯和最优选本文中提及的倍半萜和/或檀香烯化合物。优选地,所述无环萜烯前体为FPP,其以倍半萜碳骨架的标准编号在下述的式(I)中给出。OPP是指焦磷酸。
优选地,所述分离的萜烯合酶多肽能够合成至少一种倍半萜,更优选至少一种具有檀香烯或香柠檬烯的碳骨架的倍半萜。在优选的实施方案中,所述多肽能够由FPP形成红没药阳离子并且能够进一步在FPP的C3或C2碳原子与C7碳原子之间形成化学键以产生一或若干种双环和/或三环倍半萜。
术语“键”是指单一的共价键。
本发明涉及编码能够合成至少一种包含C3-C7键的双环和/或三环倍半萜的多肽的核酸和所述多肽本身。优选地,包含C3-C7键的倍半萜构成了所述萜烯合酶所合成的倍半萜产物总量至少约1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%或更多,其为具有C3-C7键的倍半萜。为了本发明的目的,萜烯合酶的定量倍半萜产物分布可以通过采用实施例7中详述的步骤或通过使用本领域技术人员熟知的技术测定组分百分比来确定。
因此,本发明涉及分离的多肽,其能够形成具有下式(II)和/或(III)的具有C3-C7键的化合物
其中R1、R2、R3、R4相互独立地是线性或分支的C1-C20的烷基或烯基基团,并且其中R1及R2和/或R3及R4可形成双键而不是两个单独的单键。
优选地,R1、R2、R3、R4相互独立地是线性或分支的C1-C15,更优选C1-C10,最优选C1-C8的烷基或烯基基团。
特别地,本发明的多肽能够形成下式(IV)、(V)和/或(VI)的化合物
其中R1、R2、R3、R4如上述定义。
优选地,在式(IV)和/或(VI)中,R1或R2一个为C1-C5烷基而另一个是C2-C8烯基。此外,式(VI)中的R3优选为C1-C5烷基,更优选为C1-C3烷基。优选地,在式(V)中,R3和R4如上R1和R2在式(IV)中的定义。最优选地,化合物VI的R3是甲基基团并且R1和R2可选地为甲基和C6线性烷基基团。
优选地,所述倍半萜为檀香烯,更优选为α-檀香烯或β-檀香烯。所述檀香烯可为选自(+)-表-β-檀香烯、(-)-β-檀香烯、(+)-β-檀香烯、(+)-α-檀香烯和(-)-α-檀香烯的立体异构体。
优选地,所述萜烯合酶催化α-檀香烯的产生,并且所产生的α-檀香烯的量至少或至少约为所产生的萜烯总量的1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%或更多。
本发明涉及编码能够形成至少一种包括C2-C7键的倍半萜的多肽的核酸和所述多肽本身。根据优选的实施方案,包括C2-C7键的倍半萜构成了所述萜烯合酶所合成的倍半萜产物总量的至少约1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%或更多,其为具有C2-C7键的倍半萜。
所述倍半萜可为香柠檬烯、檀香烯和/或这些化合物的异构体的一种,优选立体异构体。优选地,所述产物主要为一种立体异构体,不过其还可包含较少量的其它立体异构体或对映异构体。
根据一个实施方案,本发明涉及分离的多肽,其能够形成具有下式(VII)和/或(VIII)的含C2-C7键的化合物
其中R5和R6如上R1和R2的述定义。优选地,R5为甲基并且R6为C2-C10烯基,或相反。
优选地,可能存在于在上述R1、R2、R3、R4、R5或R6残基之一中的至少一个烯基为4-甲基-3-戊烯基,而另一个连接于同一碳原子的残基为甲基。
能够合成上式(II)、(III)、(IV)、(V)、(VI)、(VII)和/或(VIII)中化合物的多肽优选为具有SEQIDNO:2、SEQIDNO:4或SEQIDNO:6的氨基酸序列的多肽,或其多肽变体。
优选地,具有C2-C7键的倍半萜为香柠檬烯,包括其立体异构体,尤其是,例如顺式-α-香柠檬烯、反式-α-香柠檬烯、反式-β-香柠檬烯和顺式-β-香柠檬烯。
优选地,所述萜烯合酶催化香柠檬烯产生,并且所产生的香柠檬烯的量至少为或至少约为所产生的萜烯总量的1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%或更多。
另一方面,本发明提供了分离的多肽,其能够合成檀香烯和/或香柠檬烯。在优选的实施方案中,本发明提供了分离的多肽,其能够合成以下的一或多种:α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯、β-檀香烯和反式-反式-金合欢醇。优选地,分离的多肽至少能够合成β-檀香烯。
最优选地,本发明的SaSSy、SauSSy和SspiSSy萜烯合酶能够合成至少两种或多种萜烯,优选选自(+)-表-β-檀香烯、(-)-β-檀香烯、(+)-β-檀香烯、(+)-α-檀香烯和(-)-α-檀香烯、E-α-香柠檬烯、γ-姜黄烯、β-红没药烯、β-姜黄烯、α-姜黄烯、反式-反式-金合欢醇、α-蒎烯、莰烯、柠檬烯和α-异松油烯、更优选α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯和β-檀香烯中的萜烯。最优选地,所述萜烯合酶可同时合成两种或多种上述化合物。
所述酶可优选为能在同一反应混合物中、相同的反应条件下合成至少4种上述列出的化合物。因此,所述酶优选为能在单一的一组条件下将FFP转换为至少4种所列出的萜烯;不需要另外加入不同的起始化合物、不同的附加因子或改变反应条件来获取一或多种萜烯。
另一方面,本发明提供包含本发明核酸的载体。
如本文中所用的“载体”包括原核载体、病毒载体、或真核载体和/或任何重组载体,包括但不限于,噬菌体和质粒。所述载体还可为表达载体。表达载体包括能够表达可操作地连接于调控序列的DNA的载体,所述调控序列,如启动子区域,能够影响这种DNA片段的表达。这样的附加片段可包括启动子和终止子序列,并且任选地可包括一或多个复制原点、一或多个可选择标记、增强子、多腺苷酸信号等等。表达载体一般源自质粒或病毒DNA,或可包含两者的元件。因此,表达载体是指重组DNA或RNA构建体,如质粒、噬菌体、重组病毒或其它载体,其在引入至适当的宿主细胞后可导致克隆的DNA表达。适当的表达载体对本领域技术人员是众所周知的,包括那些在真核细胞和/或原核细胞中为可复制的以及那些保持游离的或那些整合入宿主细胞基因组的表达载体。病毒载体为可操作地连接于外源基因以将外源基因转运(如运载或穿梭)入细胞中的工程化病毒。
技术人员能够根据表达系统选择适当的载体。在一个实施方案中,表达载体包含可操作地连接于调控序列的编码多肽的cDNA序列,所述调控序列如转录启动子、操纵子或增强子、mRNA核糖体结合位点和控制转录和翻译(例如起始及终止)的适当的序列。
当调控序列与本发明的cDNA序列有功能地相关时,核苷酸序列即为“可操作的连接”。可操作的或可操作地连接DNA区段意指排列所述区段从而使其按预期的目的发挥功能,例如转录在启动子起始并通过编码区段继续进行至终止子。
本发明的载体可用于制备遗传学修饰的宿主生物体和/或细胞的方法中,用于含有本发明的核酸的宿主生物体和/或细胞中,并且可用于产生或制备萜烯合酶的方法中,其如下述进一步展示。因此,本发明提供了包含本发明载体的细胞。
一方面,本发明提供了用于制备萜烯合酶的方法,其包括步骤:在使所述编码的萜烯合酶表达的条件下培养被修饰以含有至少一种核酸序列的宿主生物体和/或细胞,其中所述至少一种核酸为本发明的核酸。然后可任选地纯化所述萜烯合酶。这种产生方法的实例在例如实施例4、5和12中提供。
例如,产生萜烯合酶的方法可包括以下步骤:
a)选择宿主生物体和/或细胞,其不表达具有SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示序列的核酸;
b)用具有SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示序列的核酸分子转化所述生物体;和
c)在有助于所述核酸编码的萜烯合酶产生的条件下培养所述生物体。
本发明还提供了产生萜烯合酶的方法,所述方法包括以下步骤:
a)选择宿主生物体和/或细胞,其表达具有SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示序列的核酸分子;
b)用具有SEQIDNO:1、SEQIDNO:3或SEQIDNO:5所示序列的核酸分子以较高的量转化所述生物体;和
c)在有助于所述核酸编码的萜烯合酶产生的条件下培养所述生物体。
还提供了制备萜烯的方法,包括使无环焦磷酸萜烯前体与本发明的萜烯合酶相接触,其中所述萜烯合酶在细胞中异源表达;所述无环焦磷酸萜烯前体与所述萜烯合酶表达于同一细胞中;与无环焦磷酸前体接触的步骤发生在所述细胞中。
还提供了制备至少一种萜烯的方法,包括:在有助于萜烯产生的条件下培养细胞,其中所述细胞异源表达本发明的萜烯合酶;以及所述细胞表达无环焦磷酸萜烯前体。
如此产生的萜烯合酶可任选地被进一步分离。
无环焦磷酸萜烯前体可选自焦磷酸香叶酯(GPP)、焦磷酸金合欢酯(FPP)和焦磷酸香叶基香叶酯(GGPP)。
另外,所述萜烯优选选自倍半萜、二萜和单萜,更优选选自二环或三环倍半萜,并且最优选地,所述萜烯选自α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯、β-檀香烯、γ-姜黄烯、β-红没药烯、β-姜黄烯、α-姜黄烯、反式-反式-金合欢醇、α-蒎烯、莰烯、柠檬烯和α-异松油烯。
所述萜烯可优选地选自(+)-表-β-檀香烯、(-)-β-檀香烯、(+)-β-檀香烯、(+)-α-檀香烯和(-)-α-檀香烯。
另一方面,可产生两种或多种萜烯。
当所述萜烯为α-檀香烯时,所产生的α-檀香烯的量优选至少或至少约为所产生的萜烯总量的1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%或更多。
当所述萜烯为β-檀香烯时,所产生的β-檀香烯的量优选至少或至少约为所产生的萜烯总量的1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%或更多。
最优选地,至少产生4种萜烯;这四种萜烯包括α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯和β-檀香烯;并且α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯和β-檀香烯以下述彼此之间的比例产生:α-檀香烯(38.0%)、α-反式-香柠檬烯(12.1%)、表-β-檀香烯(4.7%)和β-檀香烯(45.2%)。
如此产生的萜烯可转换为醇,例如选自α-檀香醇、β-檀香醇、α-反式-香柠檬醇和表-β-檀香醇的醇。在进一步处理后,这样的醇可具有下述彼此之间的比例:α-檀香醇(25-65%)、α-反式-香柠檬醇(1-20%)、表-β-檀香醇(1-15%)和β-檀香醇(20-50%);或更优选地,α-檀香醇(59.28%)、α-反式-香柠檬醇(7.32%)、表-β-檀香醇(3.45%)和β-檀香醇(29.0%)。
另一方面,本发明提供了重组宿主生物体和/或细胞,其被转化以含有本发明的核酸。所述宿主生物体可为单细胞或多细胞(但非人的)生物体。例如,宿主可为多细胞生物体的细胞。优选地,所述宿主生物体异源地包含本发明的核酸。因此,本发明的宿主细胞可为原核细胞、细菌细胞或真核细胞(例如酵母细胞或植物细胞)。
如本文中所用,异源核酸为表达其的细胞正常不体内产生的核酸,或正常地产生于所述细胞但在不同基因座或差异地表达的核酸,或介导或编码改变内源核酸(如DNA)表达(通过影响转录、翻译或其他可调控的生化过程)的中间体(mediator)的核酸。异源核酸对其所引入的细胞通常为非内源的,但已从另一细胞获取或合成制备。异源核酸还可以是内源的表达于不同基因座或其表达被改变的核酸。一般地,虽然并非必须的,这样的核酸编码了通常不由所述细胞产生,或不以与其所表达的细胞中相同的方式而表达的RNA和蛋白质。异源核酸,如DNA,还可以指外来核酸,如DNA。因此,异源核酸或外来核酸包括不像发现于基因组的对应核酸分子(如DNA)一样存在于确切的方向或位置的核酸分子。它还可指来自另一生物体或物种的核酸分子(即外源的)。
异源表达是指在宿主细胞中表达由异源核酸编码的多肽,所述异源核酸通过如转化、电转化、转导或任何其他方法引入至所述宿主细胞中。
优选地,所述宿主生物体为细菌,例如大肠杆菌。
其它优选的宿主生物体包括真菌,优选酵母,最优选酿酒酵母(Sacharomycescerevisiae)。其它合适的宿主细胞包括在US6,531,303中描述的BTR酵母株系。
用于表达本发明多肽的适当的宿主生物体可另外为高等真核细胞,优选为植物或植物细胞。优选地,所述植物为属于茄科(Solaniaceae)或唇形科(Lamiaceae),更优选为烟草(Nicotiana)属的物种;或另外为长春花(Catharanthus)属的成员,如长春花(Catharanthusvinca)。所述宿主生物体可另外为檀香属的物种,如印度檀香或澳洲檀香。
一方面,本发明提供了表达本发明多肽的重组宿主生物体或细胞。优选地,所述宿主生物体被转化以比在未如此转化的相同的生物体中更高量地表达所述多肽。
术语“转化的”是指所述宿主被遗传改造以包含本发明的任何核酸的一、二或多个拷贝。优选地,所述宿主异源地表达本发明的核酸和/或多肽。
因此,在一个实施方案中,本发明提供了转化的生物体,其中本发明的多肽以比在未如此转化的相同生物体中更高的量表达。
本领域已知若干创建转基因、重组宿主生物体或细胞(如植物、酵母、细菌或高等真核生物体细胞培养物)的方法。例如,用于细菌、真菌、酵母和哺乳动物细胞宿主的适当的克隆和表达载体描述于,例如,Pouwels等人,CloningVectors:ALaboratoryManual,Elsevier,NewYork,(1985)和上述引用的Sambrook等人。技术人员尤其可获得用于高等植物和/或植物细胞的克隆和表达载体,例如见Schardl等人,(1987)Gene61:1-11。
用于转化宿主生物体,例如,产生转基因植物,修饰宿主生物体或细胞以含有转基因核酸(如本发明的那些)的方法是技术人员所熟悉的。例如,对制备转基因植物来说,目前的方法包括:植物原生质体电穿孔技术、脂质体介导的转化、农杆菌介导的转化、聚乙二醇介导的转化、颗粒轰击、植物细胞显微注射和使用病毒的转化。
在一个实施方案中,转化的DNA整合入非人宿主生物体和/或细胞的染色体中,使得获得稳定的重组系统。本发明的实践中可以使用本领域已知的任何染色体整合方法,包括但不限于,重组酶介导的盒交换(RMCE)、病毒位点特异性染色体插入、腺病毒、通过宿主介导加工的同源重组和前核注射。
本发明的宿主细胞优选可天然产生萜烯合酶的FPP底物。另外,如果宿主细胞不能天然产生所述化合物,可用例如异源FPP基因转化改造来产生FPP。另外,宿主细胞可被改造以产生更多(其天然会产生的)FPP,从而提供大量的为本发明的萜烯合酶所用的底物(见,例如US6,531,303或WO2009109597)。
可预计,本发明的酶的倍半萜产物可进一步被处理,其通过在C12位置羟基化以形成檀香醇和香柠檬醇。例如,α-檀香烯会进一步被处理以产生α-檀香醇,α-反式-香柠檬烯会产生α-反式-香柠檬醇,表-β-檀香烯会产生表-β-檀香醇并且β-檀香烯会产生β-檀香醇。本发明的SaSSy、SauSSy或SspiSSy萜烯合酶优选能够合成α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯和β-檀香,它们彼此之间的比例使得在进一步将化合物处理为等量醇时,檀香醇和香柠檬醇的产量会与例如印度檀香天然油的产量相似。
一般地,来自印度檀香的檀香油以给出的比例包含表1中所示的化合物。
表1.天然檀香油(来自印度檀香)的组分示例
化合物 通过GC的组分% a-檀香烯 1.26 b-檀香烯 0.22 E-a-香柠檬烯 1.28 表-b-檀香烯 1.81 g-姜黄烯 0.049 b-红没药烯 0.029 b-姜黄烯 0.226 a-姜黄烯 0.180 a-红没药醇 0.01 Z-a-檀香醇 51.48 Z-a-反式-香柠檬醇 6.36
Z-表-b-檀香醇 3.80 Z-b-檀香醇 25.0 E-b-檀香醇 0.211 Z-澳白檀醇 1.76 Z-坚果醇 1.30
由上述表1可确定,α-檀香醇、α-反式-香柠檬醇、表-β-檀香醇和β-檀香醇彼此之间(除去其它的油组分)的比例为:α-檀香醇(59.28%)、α-反式-香柠檬醇(7.32%)、表-β-檀香醇(4.35%)和β-檀香醇(29.0%)。
本发明的萜烯合酶优选合成α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯和β-檀香烯,使得在进一步处理后,所述化合物以下述彼此之间的比例产生各种醇:α-檀香醇(25-65%)、α-反式-香柠檬醇(1-20%)、表-β-檀香醇(1-15%)和β-檀香醇(20-50%)。
最优选地,本发明的萜烯合酶合成倍半萜化合物,使得进一步处理时,所述化合物以下述彼此之间的比例产生各种醇:α-檀香醇(34.7%)、α-反式-香柠檬醇(1.1%)、表-β-檀香醇(4.3%)和β-檀香醇(41.3%)。剩余的8.6%的化合物一般由一系列其它少量化合物组成。如果将其余少量化合物的比例消除,剩余的4种主要化合物,进一步处理以产生各自的醇时,优选以下述彼此之间的比例生成:α-檀香烯(38.0%)、α-反式-香柠檬烯(12.1%)、表-β-檀香烯(4.7%)和β-檀香烯(45.2%)。
用分离的SaSSy萜烯合酶产生的油中4种主要组分以及其转化为各自的醇的相对比例由GC-MS和GC-FID测定。已知GC-MS往往由于易于电离而偏向一些化合物。然而,两种方法都表明,本发明萜烯合酶产物的相对组成反映了檀香油中各自的醇的组成(表2)。
表2
可通过技术人员已知的任何方法进一步的处理以产生正确的顺式醇,如利用合适的细胞色素P450酶,或化学反应如碱金属化、硼化(borylation)和氧化。细胞色素P450技术是为其它倍半萜(最著名为青蒿素)的产生而建立的。
本发明的核酸探针可用于选择涉及印度檀香或檀香属其它成员的合适的树,用于育种方案或株系改进方案。已知并非所有新克里多尼亚檀香、澳洲檀香和印度檀香树都以相同的量产生檀香油,并且油中萜烯的相对比例可能是树之间差异的主体,特别是涉及SaSSy、SauSSy或SspiSSy基因核酸的控制、表达转录和/或翻译。
因此,本发明的核酸探针可用于使用本文中描述的和/或技术人员熟知的方法确定给定的一组树中哪些高水平地表达SaSSy、SauSSy或SspiSSy。另外,可测定SaSSy、SauSSy或SspiSSy氨基酸表达的水平以评估哪些树产生大量的所需萜烯。优选地,探针可用于检测表达萜烯合酶基因的树,所述萜烯合酶生成一或多种下列萜烯:α-檀香烯、α-反式-香柠檬烯、表-β-檀香烯、β-檀香烯和反式-反式-金合欢醇。
另外,本发明的多肽或多肽片段可用于产生针对SaSSy、SauSSy或SspiSSy基因特定区域的抗体。这些抗体然后可用于筛选来自树的样品以确定哪些树表达所述合酶基因,以及表达的水平。同样,这样的检测方法可用于选择大量产生所需萜烯或产生所需比例的不同萜烯的树。
因此,本发明提供用于检测样品中萜烯合酶存在的方法,包括以下步骤:
a)使令可能含有本发明的萜烯合酶的样品与特异性结合所述萜烯合酶的抗体在使得包含所述抗体和萜烯合酶的反应复合物形成的条件下相接触;和
b)检测样品中包含所述抗体和萜烯合酶的反应复合物的形成,其中检测到所述反应复合物的形成表明样品中存在萜烯合酶氨基酸序列。
所述方法可包含可选的评估所形成的反应复合物的量的步骤,从而确定所述生物学样品中萜烯合酶的量。
优选地,这些方法中所使用的抗体源自亲和纯化的多克隆抗体,并且更优选为mAb。另外,本文中所用的抗体分子优选Fab、Fab′、F(ab′)2或F(v)部分的形式或完整抗体分子。
特别优选的用于检测本发明萜烯合酶基因(根据以上方法)的方法包括酶联免疫吸附测定、放射性免疫测定、免疫放射测定和免疫酶测定,包括使用单克隆和/或多克隆抗体的竞争和夹心测定。
在每个例子中,本发明的氨基酸序列形成含有一或多个抗体或结合配对物的复合物,并且复合物的一个成员标记有可检测的标记。复合物的形成和(如果需要的话)其量可由已知的可应用于检测标记的方法确定。
最通常被这类研究所采用的标记为放射性元素、酶、暴露于紫外线时发荧光的化学物和其它。
许多荧光材料是已知的并可利用作标记。这些材料包括,例如,荧光素、罗丹明和金胺。特定的检测材料是在山羊中制备的抗兔抗体,其通过异硫氰酸酯缀合于荧光素。
SaSSy、SauSSy或SspiSSy氨基酸序列或其它结合配对物还可标记有放射性元素或酶。放射性标记可用任何现有可用的计数方法检测。
酶标记也是同样有用的,并可用任何目前利用的比色法、分光光度法、荧光分光光度法、安培计或气体定量技术检测。所述酶通过与桥接分子如碳二亚胺、二异氰酸酯、戊二醛等等反应而缀合于所选择的颗粒。已知有许多可用于这些方法的酶可被利用。优选的酶是过氧化物酶、β-葡萄糖醛酸酶、β-D-葡萄糖苷酶、β-D-半乳糖苷酶、脲酶、葡萄糖氧化酶加过氧化物酶和碱性磷酸酶。美国专利号3,654,090、3,850,752和4,016,043通过例举其公开的可选的标记材料和方法而引用。
根据以上方法,其它优选的用于检测本发明萜烯合酶基因和蛋白质的方法包括选择性反应监测或多重反应监测,如在ZulakKG,LippertDN,KuzykM,DomanskiD,ChouT,BorchersCHandJBohlmann(2009)Targetedproteomicsusingselectedreactionmonitoring(SRM)revealstheinductionofspecificterpenesynthasesinamulti-levelstudyofmethyljasmonatetreatedNorwayspruce(Piceaabies).ThePlantJournal60:1015-1030中所讨论的。
本发明还提供了检测生物学样品中萜烯合酶核酸分子存在的方法,其包括如下步骤:
a)在合适的杂交条件下使生物学样品与包含本发明萜烯合酶多核苷酸的多核苷酸探针或引物相接触;和
b)检测所述探针或引物与样品中的核酸序列间形成的任何双链体。
根据本发明的一个实施方案,SaSSy、SauSSy或SspiSSy基因的检测可通过使用已知技术从生物学样品直接扩增萜烯合酶多核苷酸序列,然后检测SaSSy、SauSSy或SspiSSy多核苷酸序列的存在来完成。
因此,本发明还涉及用于检测生物学样品中的萜烯合酶的方法,包括:
a)用至少一种上述定义的引物或寡核苷酸扩增所述核酸分子,b)检测所述扩增的核酸分子。
优选地,在扩增前提取和/或纯化(如从组织样品中)所述核酸。
本发明还涉及检测存在于生物学样品中的SaSSy、SauSSy或SspiSSy核酸的方法,包括:
a)在合适的条件下,使所述生物学样品的核酸与如上述定义的一或多个探针杂交,
b)在合适的条件下洗涤,和
c)检测形成的杂交体。
优选地,杂交条件为变性条件。
优选地,在杂交前提取和/或纯化(如从组织样品中)所述核酸。更优选地,在提取后,或至少在杂交前,用至少一种如上述定义的引物扩增核酸样品。优选地,所述探针连接于固体基质,或在液相中用光度法或荧光检测或其它可视化方法如琼脂糖凝胶电泳来检测。
本发明还涉及如上述定义的方法,其中在扩增期间或之后标记所述核酸。
为了本发明的目的,用于检测在寡核苷酸探针和样品的核酸序列之间形成的杂交体的合适的测定方法可包括本领域已知的任何测定形式,如常规的点印迹形式、夹心杂交或反向杂交。例如,检测可使用点印迹形式完成,未标记的扩增样品结合于膜,在适当的杂交和洗涤条件下,向所述膜加入至少一种标记的探针,并且监测存在的结合探针。
可选的和优选的方法是“反向”点印迹形式,其中扩增的序列包含标记。在此形式中,未标记的寡核苷酸探针结合于固体支持物并在适当的严格性杂交和随后的洗涤条件下暴露于标记的样品。应该理解,可使用任何其它基于样品核酸与本发明的寡核苷酸探针间杂交体的形成的测定方法。
本发明的一种形式中,靶核酸序列通过PCR扩增,然后用任何上述提及的特定方法检测。其它有用的用于检测SaSSy、SauSSy或SspiSSy多核苷酸序列存在的诊断技术包括但不限于:1)等位基因特异性PCR;2)单链构象分析;3)变性梯度凝胶电泳;4)RNA酶保护测定;5)使用识别核酸错配的蛋白质,如大肠杆菌mutS蛋白;6)等位基因特异性寡核苷酸;和7)荧光原位杂交。
除上述方法之外,还可使用常规探针技术检测SaSSy、SauSSy或SspiSSy多核苷酸序列。当探针用于检测SaSSy、SauSSy或SspiSSy多核苷酸序列存在时,如果需要的话,可处理待分析的生物学样品(如木质组织,特别是心材组织)以提取核酸。所述样品多核苷酸序列可能以多种便于检测靶序列的方法制备;如变性、限制性酶消化、电泳或点印迹。样品多核苷酸序列的被靶向区域通常必须至少部分为单链的,以与探针的靶向序列形成杂交体。靶序列的变性将可能是必须的并且可通过多种本领域已知的技术实现。
样品多核苷酸序列和探针在可促进探针中靶序列与样品中假定的SaSSy、SauSSy或SspiSSy多核苷酸序列形成稳定杂交体的条件下温育。优选地,使用高严格性的条件以防止假阳性。
得到的杂交体(如果有的话)的检测通常通过使用标记的探针来完成。另外,探针可以是未标记的,但可通过与标记的配体(直接地或间接地)结合而被检测。用于标记探针和配体的合适的标记和方法是本领域已知的,并包括,例如,可通过已知方法(如缺口平移、随机引物或激酶激活)并入的放射性标记、生物素、荧光基团、化学发光基团(如二恶二酮,尤其是触发的二恶二酮)、酶、抗体等等。所述基本方案的变化是本领域已知的,并包括那些便于将待检测的杂交体从无关材料中分离的和/或那些放大标记基团的信号的变化。
优选地,探针是标记的。更优选地,探针是放射性标记的或荧光-或酶-标记的。
一旦确定合适的树,它们可用于选择性育种方案,或仅确定为可收获用于产生檀香油的树。
在另一方面,本发明提供用于制备萜类化合物的工艺和/或方法。
因此,本发明提供了制备至少一种萜类化合物的方法,包括:
a)使至少一种无环焦磷酸萜烯前体与至少一种本发明的或由本发明的任何核酸编码的多肽相接触,和,
b)任选地,分离步骤(a)中产生的至少一种萜类化合物。
此外,本发明提供了制备至少一种萜类化合物的方法,包括:
a)在有助于萜类化合物产生的条件下,培养被转化以表达或提高表达本发明多肽的非人生物体,和,
b)任选地,从所述非人生物体分离至少一种萜类化合物。
根据优选的实施方案,所述方法还包括如下步骤:在步骤(a)之前,用重组核酸转化非人生物体以表达或提高表达本发明的多肽。
优选地,所述至少一种萜类化合物选自:α-檀香烯,α-反式-香柠檬烯,表-β-檀香烯和β-檀香烯。
制备至少一种萜类化合物的方法包括使至少一种无环焦磷酸萜烯前体与至少一种本发明的多肽相接触的步骤。例如,可使用在用于产生萜烯合酶的上述方法中获取的多肽。这样的多肽可从表达本发明核酸的宿主生物体中根据标准蛋白质或酶提取技术来提取。如果宿主生物体是可将本发明的多肽释放入培养基中的单细胞生物体或细胞,所述多肽可从培养基中收集,例如,通过离心,任选地随后通过洗涤步骤和重悬于适当的缓冲液溶液中。
如果所述宿主生物体是将本发明的多肽积累于细胞中的植物或单细胞生物体或细胞,所述多肽可通过破坏或裂解细胞并从细胞裂解物中提取多肽而获取。
分离的多肽然后可在最优的pH和温度下悬浮于缓冲溶液中。如果需要,可加入盐、BSA和其它种类的酶辅助因子以优化酶活性。
可将萜烯前体加入至多肽悬浮液或溶液中,随后在最优温度如30℃温育。温育后,优选在从溶液中除去多肽后,可用标准分离步骤(如溶剂萃取和蒸馏)将萜类化合物从温育溶液中分离。
在制备至少一种萜类化合物的方法的步骤中,在有助于产生萜类化合物的条件下培养宿主生物体或细胞。因此,如果宿主是转基因植物,提供最优的生长条件,例如最优的光照、水分和营养条件。如果宿主是单细胞生物体,有助于产生所述萜类化合物的条件可能包括向宿主培养基中添加适当的辅助因子。另外,可选择已证明能最大化萜类化合物合成的培养基。外部因子,如最优的pH和温度通常也可在给定的表达系统中有助于萜类化合物产生。
其它因子如激发子也可用于上调某些基因的转录,尤其是萜烯,其可涉及植物防御机制。因此在檀香或其它宿主生物体(包括宿主树)中,激发子可用于上调本发明的萜烯合酶基因。一系列的激发子对本领域的技术人员是众所周知的,并且易于购买。优选地,所选的激发子是在所提供的特定环境中能上调本发明的萜烯合酶基因表达的激发子。适当的激发子的实例包括茉莉酮酸甲酯和水杨酸。所述萜烯合酶基因还可提供评估在用激发子处理如檀香树后是否存在转录上调的方法。这样的评估还可包括,在所述树中测量油的水平以确定施用的激发子是否具有上调的效果。
在本发明另外的实施方案中,可制备试剂盒以确定在檀香树中SaSSy、SauSSy或SspiSSy基因存在或不存在和/或确定所述基因的活性。
根据上文讨论的测试技术,用于检测SaSSy、SauSSy或SspiSSy蛋白质的一类所述试剂盒将至少包含标记的SaSSy、SauSSy或SspiSSy氨基酸序列结合配对物(例如特异性的抗体)和基于所选方法(如“竞争性”、“夹心”、“DASP”等等)的说明书。所述试剂盒还可包含周边试剂如缓冲液、稳定剂等。
因此,可制备用于证明SaSSy、SauSSy或SspiSSy酶存在的测试试剂盒,其包括:
a)预定量的至少一种标记的免疫化学反应性组分,其通过SaSSy、SauSSy和SspiSSy氨基酸序列特异性结合配对物直接或间接连接至可检测的标记而获得;
b)其它试剂;和
c)使用所述试剂盒的说明书。
所述标记的结合配对物(如抗体)通常可结合于固相。
本发明还提供用于检测SaSSy、SauSSy或SspiSSy核酸序列的试剂盒。
因此,本发明还提供用于证明SaSSy、SauSSy或SspiSSy核酸序列存在的试剂盒,其包括:
a)预定量的至少一种标记的核酸序列,其来源于SaSSy、SauSSy或SspiSSy基因序列;
b)其它试剂;和
c)使用所述试剂盒的说明书。
例如,所述多核苷酸序列可以是一或多种如上文例举的引物,并且使用说明书可为对来自对象的组织样品中提取的RNA或DNR实施PCR的说明。
另一方面,本发明提供了用于证明萜烯合酶存在的试剂盒,包括:
a)预定量的至少一种结合本发明萜烯合酶的配体,其中所述配体包含可检测的标记;
b)其它试剂;和
c)使用所述试剂盒的说明书。
另一方面,提供了用于证明编码萜烯合酶的核酸分子存在的试剂盒,包括:
a)预定量的至少一种标记的本发明的核酸分子或引物;
b)其它试剂;和
c)使用所述试剂盒的说明书。
上述试剂盒可使用来自檀香树的样品。可在来自两种不同檀香树的至少两个样品上实施所述方法;并且确定每个样品中的萜烯合酶或编码萜烯合酶的核酸的量;然后选择含有最高量萜烯合酶或编码萜烯合酶的核酸的样品所来源的檀香树;对所选择的檀香树进行选择性育种或进行收获来获取檀香油。
一般原则
本领域技术人员应明白,本文中描述的发明除了那些明确描述的之外的变化和修改是容许的。应理解,本发明包括所有的这些变化和修改。本发明还包括所有在说明书中单独地或共同地提及或表明的步骤、特征、组合物和化合物,以及任意的和所有的组合,或者任何两或多个所述步骤或特征。
本发明不被本文中描述的具体实施方案(仅为了示范性目的)限定范围。功能上等同的产品、组合物和方法明确地在本文中所描述的本发明的范围内。
所有出版物(包括专利、专利申请、期刊文章、实验室手册、书籍或其它文档)的完整公开通过引用并入本文。不承认任何所述文献构成现有技术或为本发明相关领域的工作人员普通常识知识的一部分。
如本文中所用,术语“来源”和“来源于”应视为表明了特定的对象可能获取自特定来源,虽然并非必须直接来自所述来源。
如本文中所用,单数形式“a”、“an”和“the”也包括复数指代,除非上下文另有明确定义。因此,例如,催化萜烯形成的萜烯合酶的指代包括催化一或多种萜烯合成的合酶。
在本说明书中,除非上下文另有要求,单词“包括”,或变体如“包括”或“包括”将理解为暗示了包括对象或一组对象的表述,但不排除任何其它的对象或对象组。
除实施例或另有说明外,在本说明书和权利要求书中所使用的所有表达成分量、反应条件等的数字在所有情况下应被理解为被术语“大约”所修饰。因此,除非有相反表示,说明书和权利要求书中表述的数字参数均为近似值,其可能有所不同,取决于本发明试图获取的所需特性。因此“约80%”意指“约80%”和“80%”。至少,每一数字参数应考虑到有效位数字与普通取整方法。
虽然,表述了本发明广泛范围的数字范围和参数是近似值,在具体实例中,仍尽可能准确地报告所表述的数字值。但是,任何数字值都内在地包含某些必然的误差,其由在其各自检验分析中发现的标准差所引起。
本文中所用其它所选术语的定义可在发明详述发现并可应用于全文。除非另有定义,本文中所用的所有其它科学和技术术语具有如本发明所属领域的普通技术人员通常所理解的同样的含义。
下述的实施例用于更完整地说明使用以上描述的发明的方式,和表述设想的实施本发明各方面的最好的模式。应理解这些方法不以任何方式用于限定本发明的真正范围,而只是用于说明的目的。
实施例
所有的试剂、溶剂、抗生素和前体化学品从商业来源购买。二磷酸金合欢酯和二磷酸香叶酯来自Sigma公司(St.Louis,MO,USA)。限制性内切酶和T4DNA连接酶来自NewEnglandBiolabs(Ipswich,MA)。
实施例1
植物材料收集和RNA提取
在种植于FPCKununurra植物园,Kununurra,WA的成熟印度檀香树上钻若干个洞。收集木质部过渡区的刨花并立即冷冻于液氮中运至UWA,Perth。
使用修改的方案提取RNA[KolosovaN.等人,Isolationofhigh-qualityRNAfromgymnospermandangiospermtrees.BioTechniques36(2004)821-824]。刨花(50g)放置于液氮中并加入RNA提取缓冲液(200mMTris-HCl,pH值8.5,1.5%十二烷基磺酸锂,300mMLiCl,10mMEDTA,1%w/v脱氧胆酸钠,1%w/vTergitolNonidetP-40)。使用前加入5mM硫脲、1mM金黄三羧酸、10mM二硫苏糖醇和2%(w/v)聚乙烯聚吡咯烷酮(PVPP)。所有溶液由DEPC处理的和/或高压灭菌的水制备。在TE/NaCl重悬步骤可合并若干管以浓缩RNA样品。沉淀后,RNA储存于-80℃直至运至UBCVancouver,加拿大,建立cDNA文库。
实施例2
cDNA合成和文库构建
1.4μg的印度檀香木质部总RNA用SuperScriptIII反转录酶(Invitrogen)在42℃反转录1小时,其使用Clontech公司的寡dT引物和SMART5′oligo。cDNA用试剂盒中提供的M1引物扩增。
扩增的cDNA然后用限制性内切酶SfiI(NewEnglandBiolabs)消化。获得的混合物通过Chromaspin尺寸排阻色谱,首先洗脱最大的片段。cDNA以200ml等分收集并且合并具有所需高分子量范围的cDNA并在QiagenMinElute离心柱洗脱。
消化后的cDNA片段然后被克隆进预先切割的pDNR-LIB载体并用电穿孔转化入25μl噬菌体耐受的大肠杆菌电感受态细胞中。在与甘油混合并储存于-80℃前,所述细胞在SOC培养基中于37℃振荡1小时。分装物涂布于含30mgml-1氯霉素的琼脂上。cDNA文库滴定至每毫升大约3×106的菌落形成单位。该文库被送往GenomeScienceCentre,Vancouver加拿大,进行5′和3′测序。
实施例3
从印度檀香木质部EST文库鉴定萜烯合酶基因
使用CAP3程序的默认设置组装短片段(read)。用BLAST比较EST文库检索与NCBI数据库之前发表的萜烯合酶(TPS)和细胞色素P450基因序列同源的基因。鉴定了若干候选基因,包括一个与蓖麻(Ricinuscommunis)柠檬烯合酶和柠檬香桃(Backhousiacitriodora)芳樟醇合酶具有中度相同性的全长基因。还发现了约12个假定的细胞色素P450氧化酶,其中有些是全长的。
实施例4
细菌表达
将产生已知萜烯合酶(TPS)基因的阳性命中的菌落纯化质粒以产生pDNR-LIB结合的全长cDNA。选择出一个标记为SaSSy的基因。SaSSy推导出的氨基酸序列与其它被子植物基因的比对示于图6,并且推导出的SaSSy、SauSSy和SspiSSy氨基酸序列与其它被子植物萜烯合酶基因的比对示于图12。
定位了两个版本的SaSSy基因,其仅在位置143不同,克隆P143在143位具有脯氨酸残基而克隆S143在所述位置具有丝氨酸残基。产生于这些克隆的两种蛋白质之后被发现具有相同的活性,暗示了在143位将一个极性残基替换为另一个对催化活性几乎没有影响。
SaSSy的单萜合酶基因TPS-b亚家族[J.Bohlmann,J.等人,Plantterpenoidsynthases:Molecularbiologyandphylogeneticanalysis.Proc.Natl.Acad.Sci.USA95(1998)4126-4133]典型特征基序包括天冬氨酸富集的DDxxD金属离子结合位点(位置321-325)和RRX8W基序(位置32-42),所述基序涉及二磷酸基团迁移[Williams,D.C.等人,Truncationoflinmonenesythasepreproteinprovidesafullyactive′pseudomature′formofthismonoterpenecyclaseandrevealsthefunctionoftheamino-terminalargininepair.Biochemistry37(1998)12213-12220]。
上述实施例4中定位的两个全长SaSSy基因序列(P143和S143)被克隆入带有C末端组氨酸标记的pET28b(+)表达载体(Novagen,SanDiegoCA)。用NcoI和XhoI切开所述载体以产生适合于连接进相同酶切cDNA的突出末端。含有与镍亲和标签(His6)符合读框的倍半萜合酶基因的环状质粒首先被转化入化学感受态细胞并在含卡那霉素(50μgml-1)的LB平板上生长。
转化子在选择性LB平板(50μgml-1卡那霉素)上生长,并且通过质粒制备(Invitrogen)提取DNA。包含插入的pET28b(+)载体被测序验证并且转化入化学感受态C41大肠杆菌细胞中(Avidis,Saint-Beauzire,France),其包含分离自Rosetta2感受态细胞(Novagen)的pRARE2质粒。菌落生长于含卡那霉素和氯霉素(50μgml-1)的LB平板上。
挑取独立的菌落并在5ml含同样抗生素的LB中于37℃在振荡器中过夜生长。2ml该培养物加入到4批100ml含卡那霉素和氯霉素的TB中。细胞悬液在37℃振荡生长4小时,直至OD600=0.8。加入异丙基-β-D型-硫代半乳糖苷(IPTG)至终浓度0.2mM并且该混合物于16℃振荡过夜。通过4℃离心收获细胞悬液并且将细胞沉淀冷冻于-80℃以备将来使用。
细胞沉淀(~7g)重悬于5ml裂解液中(25mg溶菌酶,0.25mgDNA酶,0.25mgRNA酶,19.3mgDTT,5μl鸡尾酒蛋白质酶抑制剂[PMSF和硫脲]和250μl100mMMgCl2)。放置于冰上时,混合物用玻璃棒充分搅拌30分钟。随后裂解物用Bronson超声探头冰上超声至半透明。混合物于4℃2000×g离心30分钟。倒出上清并冰上储存。
实施例5
蛋白质纯化
澄清的裂解物上清液(~3ml)依次装上HisTrapSpin柱(GEHealthcare)并于4℃1000rpm旋转2分钟。用新鲜的结合缓冲液洗涤后,蛋白质用300μl洗脱缓冲液(20mMHEPESpH7.5,150mMNaCl和350mM咪唑)洗脱两次,至终体积600μl。
两种SaSSy萜烯合酶变体(P143和S143)中每种的洗脱液在2ml葡聚糖凝胶脱盐柱(BioRad,HerculesCA,USA)上脱盐入无咪唑的洗脱缓冲液中。
洗脱液用分光光度法分析以确定近似的蛋白质浓度。终浓度为~8mgml-1。这些溶液用于测定。纯化后的蛋白质分装与80%甘油混合(1∶1)并于液氮中冷冻。其被储存于-80℃直至使用。用SDS-PAGE、免疫印迹和免疫标记用His6抗体(Sigma)分析蛋白质。抗体通过NBT/BCIP法可视化(Roche,USA)。P143和S143各自的重组蛋白证实为~66kDa的预期大小。
实施例6
酶测定
重组同工酶蛋白质P143和S143的酶活性测定一式两份地使用GC小瓶完成,如O′MailleP.E.等人,[Asingle-vialanalyticalandquantitativegaschromatography-massspectrometryassayforterpenesynthases.Anal.Biochem.335(2004)210-217]。对每一测定,20μl蛋白质(8mgml-1)加入至560μl含25mMHEPES,10%甘油,5mMDTT和10mMMg2+的反应缓冲液中。加入20μl底物FPP和GPP(~1mgml-1)并且轻轻振荡混合。酶终浓度为0.3mgml-1。小瓶由500μl正戊烷覆盖以捕捉挥发性产物并且在30℃温育2小时。
实施例7
GC-MS分析和产物鉴定
SaSSy酶的产物混合物在带有使用氦气做气体载体的5937MSD的Agilent6890GC上分析。使用HP5-MS毛细管柱(30m,0.25mmID,0.25mm薄膜厚度)完成峰鉴定。进样器温度为240℃,检测器温度设定在250℃,进样体积为1μl并且柱流速为1mlmin-1。柱箱温度程序如下:在40℃保持1分钟,然后以7.5℃每分钟升至250℃并保持。所有的质谱在70eV,多重离子扫描模式下检测。
SaSSy温育产物的身份通过与可靠的檀香油的质谱保留时间(NIST2005库,Adams,R.P.出版[Identificationofessentialoilcomponentsbygaschromatography/massspectrometry,AlluredPublishingCorporation,CarolStream,Illinois,1995]和MassFinder(www.massfinder.com))比较而确认。
使用重组SaSSy酶以GPP作为底物在Mn2+存在下的酶活测定产生了α-蒎烯、莰烯、柠檬烯和α-异松油烯的混合物,以及其它由GC-MS确定的单萜产物。使用SaSSy以FPP作为底物在包含Mg2+离子的缓冲液中的酶活测定产生了α-檀香烯(34.7%)、α-反式-香柠檬烯(11.1%)、表-β-檀香烯(4.3%)和β-檀香烯(41.3%),以及少量的由GC-MS确定的若干其它化合物(图2)。SaSSy酶产生的4种化合物的质谱(示于图2)与产于檀香树(见用于比较谱的上述引用的Adams(1995))中的天然β-檀香烯是相同的。
FPP与热变性的酶温育得不到可检测的产物,暗示了所述酶对产物的转换是必不可少的。
实施例8
核酸序列比对
萜烯合酶的Clustal多重序列比对[FB299123-125-香根草(Vetiveriazizanoides)萜烯合酶(WO2006134523),AF484125-烟草(Nicotianaattenuata)5-表-aristolochene合酶,AB438045-柠檬香桃(Backhousiacitriodora)芳樟醇合酶,Santalene-本发明的来自印度檀香的SaSSy檀香烯合酶]示于图6。柠檬香桃芳樟醇合酶是最同源的蛋白质,然而,在檀香烯和其它TPS基因间存在普遍的相似性缺失。顶部的单线表明近似的区域(由Back和Chappell(1996)[Proc.Natl.Acad.Sci.USA93]指出)其对特异性产物的形成是重要的,而双线表明TEAS的比率特异性区域。
在氨基酸水平,SaSSy檀香烯合酶与之前发现的单萜烯合酶SamonoTPS1(EU798692.1)具有56%相同性,与假定的蓖麻柠檬烯合酶(EQ973796.1)具有48%相同性,并且与柠檬香桃芳樟醇合酶(BAG82825.1)具有45%相同性。
实施例9
植物材料收集和RNA提取
在种植于由ForestProductsCommissionofWA管理的种植园中的成熟印度檀香、新克里多尼亚檀香和澳洲檀香树上钻若干25mm的洞。心材-边材过渡区的刨花被收集并立即冷冻于液氮中。样品被运至实验室,在那里使用修改的方案提取RNA[N.Kolosova,B.Miller,S.Ralph,B.Ellis,C.Douglas,K.Ritland,J.Bohlmann,BioTechniques36(2004)821-824]。刨花(10g)放置于液氮中并且加入RNA提取缓冲液(200mMTris-HCl,pH值8.5,1.5%十二烷基磺酸锂,300mMLiCl,10mMEDTA,1%w/v脱氧胆酸钠,1%w/vTergitolNonidetP-40)。使用前向缓冲液中加入RNA酶抑制剂(5mM硫脲、1mM金黄三羧酸、10mM二硫苏糖醇和2%聚乙烯聚吡咯烷酮)。所有溶液由DEPC处理的、高压灭菌的水制备。如果可能,来自同一树的样品在TE/NaCl重悬步骤可合并以浓缩RNA样品。LiCl沉淀后,RNA储存于-80℃直至运至UBCVancouver,加拿大,建立cDNA文库。
实施例10
印度檀香cDNA文库构建
1.4μg印度檀香木质部总RNA用于创建cDNA文库,其使用ClontechSMART-Creator文库构建试剂盒。RNA用SuperScriptIII反转录酶(Invitrogen)反转录。cDNA用Phusionhigh-fidelityDNA聚合酶和通用引物(Clontech)来扩增。用SfiI限制性内切酶消化并将其克隆进预先切开的pDNR-LIB载体。混合物被电穿孔转化入25μl噬菌体耐受的电感受态大肠杆菌细胞。确定该文库的滴度并将其送往GenomeScienceCentre,Vancouver,加拿大,进行双向Sanger法DNA测序。使用CAP3程序的默认设置组装短片段。序列(6000独特的短片段)与GenBank数据库进行比对以寻找关键的特定代谢基因,尤其是TPS基因和细胞色素P450。
实施例11
通过RACE发现直系同源TPS基因
以前述相同的方式产生新克里多尼亚檀香和澳洲檀香的cDNA,只不过所述cDNA是直接用作PCR模板。基于每一基因ORF的引物用于扩增(表3)。凡不能扩增产物,5′-和3′-RACE分别用于获得各自的UTR以设计更特异的引物。使用巢式引物方法两轮扩增SesquiTPS1基因的直系同源基因。
表3.引物
开放读码框引物
pET28b(+)克隆引物下划线的为并入的限制性位点
所有的产物首先克隆入高拷贝存储载体(TOPOZeroBlunt,Invitrogen)中以在克隆入表达载体前进行测序。从印度檀香和澳洲檀香的若干基因型中扩增的TPS基因被克隆并测序以检验ORF中潜在的核苷酸多态性。所有三个檀香种的三种TPS基因的基因组序列也被克隆并测序。将与成功的cDNA扩增所用的相同的ORF引物用于基因组DNA上,其提取于与RNA提取所实施的同样个体。这些较大的gDNA片段(3-4kb)被克隆并送去测序(Macrogen,Korea)。
实施例12
细菌表达和蛋白质分离
所有的TPS基因符合读码地克隆入带有多聚组氨酸标签的pET28b(+)表达载体(Novagen,SanDiegoCA)。根据可用的限制性酶切位点,His6标签为N末端的或C末端的。带有适当限制性位点的引物用于扩增每个基因,其然后被消化,凝胶纯化并克隆入pET28b(+)载体(表3)。所有pET28b(+)构建体都在进行重组蛋白质表达之前进行测序验证。
包含TPS基因的表达载体被转化入化学感受态C41大肠杆菌细胞(Avidis,Saint-Beauzire,France),其包含分离自Rosetta2感受态细胞(Novagen)的pRARE2质粒。菌落生长于含卡那霉素和氯霉素(50μgml-1)的LB平板上。挑取三个独立的菌落并在5ml含同样抗生素的LB中于37℃在振荡器中过夜生长。培养物用于接种至400ml选择性Terrific肉汤中。细胞悬液在37℃振荡生长4小时,直至OD600=0.8。加入异丙基-β-D型-硫代半乳糖苷(IPTG)至终浓度0.2mM并且混合物于16℃振荡过夜。通过4℃离心收获细胞悬液并且细胞沉淀(~1g)冷冻于-80℃以备将来使用。
细胞沉淀重悬于5ml含1mgml-1溶菌酶,1mMMgCl2,5mMDTT,0.01mgml-1DNA酶I和RNA酶I,100μl鸡尾酒蛋白质酶抑制剂(Sigma)的裂解缓冲液中并且置于His-trap结合缓冲液(20mMNa2HPO4pH值7.4,500mMNaCl,30mM咪唑,pH值7.4)中。在冰上,细胞重悬液用玻璃棒充分搅拌30分钟。随后裂解物用高压细胞粉碎仪均质化,直至混合物为半透明,并进一步用5ml裂解缓冲液漂洗。在转出前,裂解液于4℃12000×g离心1.25小时。澄清的裂解液(~12ml)用Ni2+亲和层析(GE医疗)法纯化并且用600μl洗脱缓冲液洗脱(20mMNa2HPO4pH值7.4,500mMNaCl,500mM咪唑,pH值7.4)。洗脱的蛋白质在PD-10脱盐柱(GE医疗)上用25mMHEPESpH值7.4,10%甘油和100mMKCl脱盐。收集3.5ml洗脱液组分,其中间部为最浓的。用NanoDrop分光光度计以通过氨基酸组成计算出的消光系数测定蛋白质浓度。用SDS-PAGE可视化纯化的蛋白质。
实施例13
酶功能表征和动力学测定
对所有重组蛋白质的酶测定一式三份地用GC小瓶方法完成,其由O’Maille等人[Anal.Biochem.335(2004)210-2175]描述。对仅需要产物鉴定的酶测定,10μg蛋白质用于终体积500μl的反应缓冲液(25mMHEPES,10%甘油,5mMDTT和10mMMg2+或Mn2+)。加入底物(FPP和GPP)至最终反应浓度100μM。小瓶由500μl正己烷覆盖以捕捉挥发性产物并且在30℃温育2小时。混合物涡旋混合1分钟以萃取所有挥发物,并且离心小瓶以分离有机层。
为了确定稳态酶动力学常数,条件如之前所述,除了酶浓度保持在10nM。底物浓度范围为1μM至100μM,并且反应在30℃温育整整5分钟。加入500μlpH8.0的0.5MEDTA,并且如上述涡旋混匀使反应淬灭。
当FPP用作底物时,三个檀香烯合酶的动力学特性非常相似,每个酶都具有约1.65μM的Km。使用FPP的测定的Vmax范围为,SaSSy0.42μMmin-1至SauSSy0.54μMmin-1。Kcat为SaSSy0.67min-1和SauSSy1.66min-1,与发表的其它合酶的Kcat相似。
实施例14
GC-MS分析和产物鉴定
产物混合物通过扫描模式下的GC-MS分析进行产物鉴定。包含三种檀香烯和α-反式-香柠檬烯的标准样通过将2ml印度檀香纯油在硅柱上快速层析并用正己烷洗脱来制备。25mg的最终产物重悬于EtOAc,并且用GC-FID按以下描述的条件确定纯度。所有的质谱与NIST2005库和文献相比对。使用正烷烃标准样确定了所有化合物的保留指数,并且与文献[R.P.Adams,Identificationofessentialoilcomponentsbygaschromatography/massspectrometry,AlluredPublishingCorporation,CarolStream,Illinois,19956]进行比较。
GC-FID在ShimadzuGC2010上用30m0.25mm的ID、0.25μm膜DB-WAX柱,以He作为气体载体进行。所有分析使用不分流进样(2μl)。条件如下:进样器200℃,检测器250℃,柱流速为1mlmin-1。温度程序:40℃3分钟,然后每分钟8℃至180℃,保持5分钟,然后每分钟10℃至220℃,保持10分钟。针高度调至仅吸取所有样品小瓶中上部的有机层。GC-MS在ShimadzuGC2010上进行,使用同样的DB-WAX柱,并以He作为气体载体。条件如下:进样器200℃,MS界面240℃,离子源200℃。柱箱程序:40℃3分钟,然后每分钟8℃至180℃,保持5分钟,然后每分钟10℃至220℃,保持10分钟。溶剂扣除时间设定为5分钟。对产物鉴定,使用总离子监测,从m/z45扫描至m/z300。对动力学测定,使用倍半萜基本离子m/z91、93和94的单离子监测。同样,监测了单萜烯基本离子(m/z69、71和93)。内部标准样(异丁基苯,30μM)被加入用于覆盖每个反应的正己烷中。检测器响应因子根据更早制备的萜烯标准物来计算,并且用于在动力学分析中确定产物浓度。
表4.镁或锰存在下萜烯合酶由FPP得到的反应产物的GC-FID测定。
根据上述涉及所公开的发明的教导,以上描述的本发明多种实施方案实施模式的修改对本领域技术人员是显而易见的。上述本发明的实施方案仅仅是示范性的并且不应以任何方式被解释为限制性的。