一个棉纤维特异性启动子GhFLA1的鉴定 技术领域:
本发明涉及一个棉纤维特异性启动子。具体是一个纤维特异表达的编码成束蛋白样阿拉伯半乳聚糖蛋白(fasciclin-like arabinogalactan protein)基因GhFLA1的启动子序列的克隆鉴定及其活性分析。
背景技术:
棉纤维是我国纺织工业及其相关工业的重要原材料。随着纺织工业快速发展和人民生活水平不断提高,纺织工业及其相关产业对棉纤维品质的要求愈来愈高。我国棉花产量居世界第一位,但棉纤维品质较差,不能用作一些高附加值高质量纺织产品的生产原料。因此,我国每年需进口优质棉花100多万吨,造成国产原棉的大量积压。棉纤维品质问题已成为制约我国棉花产业可持续发展的主要障碍之一。
棉花遗传改良的最终目标是提高棉纤维的产量和品质。棉纤维产量和品质不仅受环境因素的影响,而且受相关基因特别是纤维特异表达基因的调控。目前,国内外除了利用常规育种手段外,还逐步运用遗传工程对棉纤维品质进行遗传改良。将优良的农艺性状,特别是纤维品质相关的优良性状引入棉花主栽品种,不仅可提高棉花产量和纤维品质,降低生产成本,而且可减轻对环境的不利影响。因此,分离克隆棉纤维发育相关的重要功能基因及其特异性调控元件,具有极其重要的应用价值。为了使外源基因在目标组织中得以充分表达,不同的性状需要不同的启动子。在棉纤维的品质改良中,棉纤维特异性启动子是棉纤维品质改良的遗传操作中不可缺少的顺式调控元件,它决定目标基因的纤维特异性表达调控以及表达强度调控。用于改良棉纤维品质的重要目标基因需要在棉纤维中特异表达,因而必须使用纤维特异性启动子驱动该基因的表达,达到改良纤维品质之目标。而且,外源目标基因的组织特异性表达也可避免外源基因对非目的组织生长发育的不利影响。应用棉纤维特异表达启动子,可在棉纤维发育的特定阶段表达外源基因,加速对纤维品质的重要指标如强度、细度、长度等的改良,还可以给纤维增添新的品质性状抗皱、抗缩、色泽等。已有的研究证明,克隆棉纤维特异表达启动子是遗传工程途径改良棉纤维的先决条件。因此,高特异性、高活性的启动子的克隆鉴定是棉纤维品质改良的遗传工程的重要内容。
阿拉伯半乳聚糖蛋白(arabinogalactan protein,AGP)是植物四大主要的细胞壁结构蛋白之一,是高度糖基化的蛋白,它们参与体胚发育的调控、细胞增殖和细胞的膨胀及伸长,参与细胞壁和细胞骨架的相互作用。成束蛋白样阿拉伯半乳聚糖蛋白(
fasciclin-
like
arabinogalactan protein,FLA)是AGP中的一个亚类,除了具有典型AGP的结构外,还具有一个成束蛋白样结构域(fasciclin-like domain),含有成束蛋白样结构域的蛋白一般都具有分子粘连的功能,且这个结构域对整个蛋白功能的发挥具有重要作用。到目前为止,在多种植物中已经分离鉴定了一些FLA基因。Johnson等从拟南芥中分离了21个FLA蛋白基因,Faik等分离得到22个水稻和34个小麦FLA基因。另外,科学家也从杨树(Populus tremula L.)、火炬松(pinus taeda L.)和百日菊(Zinnia elegans L.)中分离到一些FLA基因。这些分离鉴定的FLA基因在不同的植物组织中表达,涉及到各自的表达调控元件-启动子。
发明内容:
本发明的目的在于提供一个棉纤维特异性调控元件-GhFLA1启动子。分析揭示该启动子表达活性,探索其对纤维发育调控的分子机制,进而应用该调控元件改良棉纤维品质,创造棉花优良品种。
本申请人从本实验室构建的棉花纤维cDNA文库中筛选获得4个GhFLA基因。为了获得更多的棉花FLA,生物信息学和转录组学的技术方法被用于筛选棉花公共EST数据库,最终获得19个棉花FLA基因,命名为GhFLA1-GhFLA19。通过设计这些FLA序列3’端RT引物,本申请人对这些FLA基因的表达做了real-time RT-PCR分析,结果发现有7个GhFLA基因在棉花纤维中高量或者特异表达,且其表达受纤维发育调控(见Huang GQ,Xu WL,GongSY,Li B,Wang XL,Li XB,2008,Characterization of the 19novel cotton FLA genes and theirexpression profiling in fiber development and in response to phytohormones and salt stress.Physiol Plant 134:348-359)。其中的一个棉纤维特异性基因,本申请人命名为GhFLA1,它包含732bp的开放阅读框架,编码一个243氨基酸的蛋白,其分子量为25.62KD,等电点(pI)为9.27,富含Pro(7%),Thr(11.9%),Ser(9.5%),Gln(7.8%),Ara(9.5%),Leu(12.4%),Val(7%)。GhFLA1蛋白含有典型的AGP结构,即N-端的信号肽,中间富含Pro区和C-端的疏水区,除此之外该蛋白还具有一个成束蛋白样结构域。该蛋白与拟南芥中的AtFLA11/12同源性最高,已有研究表明AtFLA11参与拟南芥次生壁的发育,暗示着GhFLA1可能与棉纤维细胞壁发育相关。利用定量RT-PCR技术对该基因在棉花不同组织中的表达谱进行了分析,结果表明GhFLA1基因在棉纤维细胞中特异表达,在棉花其它组织中表达非常弱或几乎检测不到。进一步研究GhFLA1在棉纤维发育不同阶段的表达情况发现,该基因在棉纤维发育早期(开花后2天)开始表达,在开花后10天的棉纤维中表达最高,在开花后15天的棉纤维中表达量有所下降,在纤维次生壁发育期(开花后20天)其表达又开始上升。
为进一步研究GhFLA1基因的组织特异性表达调控,本申请人分离了该基因的启动子。启动子分离采用基因组步移试剂盒(Genome Walker Universal Kit,BD BiosciencesClontech),首先建立棉花基因组步移文库,然后按照GhFLA1基因序列设计CP1和CP2引物,PCR扩增该棉花基因组步移文库,分离获得了GhFLA1基因的5’-上游序列,该序列长度为925bp。利用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析启动子中的顺式作用元件时发现,除存在真核生物典型启动子所具有的CAAT框,TATA框外,该启动子还含有其他一些顺式作用元件,如光应答元件(
AAAACGTTTA,
ATTAATTTTACA,
ATTAAT,
TTTCAAA),赤霉素应答元件(
TCTGTTG),热胁迫应答元件
AAAAAATTTC,低温应答元件(
CCGAAA),以及MeJA应答元件(
CGTCA,TGACG),缺氧诱导元件(
TGGTTT)等调控元件。因为烟草叶表皮毛与棉纤维(种皮毛)在起源、结构和遗传上都具有同源性,而且国内外一些研究者已经成功地利用了这个异源系统来检测棉纤维特异启动子的活性。因此,本发明也应用烟草来研究GhFLA1启动子活性。本申请人构建了GhFLA1启动子与GUS报告基因的融合表达载体,利用农杆菌介导的DNA转移技术将之导入拟南芥和烟草,获得转基因植株。对转基因烟草植株的组织化学染色结果显示,GhFLA1启动子驱动GUS基因在烟草叶柄表皮毛中表达,证实了该启动子是棉纤维特异的,可用作基因工程改良棉纤维品质的基因调控元件。
此外,应用AGP类蛋白的不可逆抑制剂β-Yariv处理离体胚珠,结果导致棉纤维伸长速度减慢,且抑制纤维伸长的速度与β-Yariv的浓度成正比。用AGP的糖组分抗体JIM4/8/13与开花后1天、2天和3天的胚珠进行免疫反应,结果显示开花后1天、2天和3天的纤维都可以与这几种抗体免疫反应,这表明纤维中存在大量的AGP蛋白(包括FLA蛋白)。FLA(作为AGP的一个亚类)在棉纤维中特异表达,说明FLA1等基因对棉纤维发育起重要作用。
本发明的优点:
1、提供了一个新的棉纤维特异表达的GhFLA1启动子序列,分析了其含有的顺式作用元件。该启动子调控其基因在棉纤维伸长期高水平表达,而且能够驱动GUS基因在烟草叶表皮毛中特异表达。本发明为纤维品质改良提供了特异的调控元件。
2、提供了一个新的棉纤维特异表达GhFLA1基因序列,其翻译的蛋白质序列与拟南芥AtFLA11同源性高达54%,表明该基因可能与棉纤维细胞次生壁发育相关。若抑制该类基因表达,则棉纤维发育受阻,长度变短,说明GhFLA1等基因在棉纤维发育过程中起重要作用。
本发明通过以下附图和实施例作进一步阐述,但不限制本发明的范围。
附图说明:
图1GhFLA1基因在棉花各组织中表达的荧光定量RT-PCR分析
图中:1)根;2)下胚轴;3)子叶;4)叶片;5)花瓣;6)花药;7)纤维;8)胚珠。
图2GhFLA1在棉纤维不同发育阶段表达的荧光定量RT-PCR分析
图中:1)2天(day post anthesis,开花后天数)纤维;2)5天纤维;3)10天纤维;4)15天纤维;5)20天纤维。
图3GhFLA1启动子在烟草表皮毛和种皮中表达活性的GUS组织化学染色分析
图中:A)烟草叶柄B)烟草种子。结果显示叶柄表皮毛和种子表皮均被染成蓝色,而其它组织细胞未被染色,表明在GhFLA1启动子的调控下GUS基因在表皮毛或种皮细胞中特异表达,从而证实该启动子在棉花中是纤维特异性的。
图4AGP蛋白的免疫定位分析
图中:用JIM4/8/13抗体分别与开花后1天(1DPA),2天(2DPA)和3天(3DPA)的胚珠进行免疫组化分析;图中绿色荧光代表抗体与纤维中的抗原AGP糖组分相作用。结果表明AGP(包括FLA)在棉纤维起始和伸长过程中起作用。(注:1-3DPA为棉纤维发育起始阶段,3-15DPA为纤维伸长阶段;JIM8抗体与AGP糖组分相特异结合,JIM4和JIM13与AGP中的部分糖支链相结合。DPA:开花后天数。)
图5不同浓度β-Yariv试剂处理棉花离体培养胚珠
图中:1)开花后1天胚珠在BT基本培养基上培养10天;2)开花后1天胚珠在BT基本培养基上附加10μMβ-Yariv(为AGP的不可逆抑制剂)培养10天;3)附加25μMβ-Yariv;4)附加50μMβ-Yariv 5)附加100μMβ-Yariv;6)附加100μMα-Yariv(为β-Yariv的类似物,但不作用于AGP),该结果表明AGP蛋白(包括FLA蛋白)参与棉纤维细胞发育过程的调控。
具体实施方式:
一个棉花新的FLA1启动子及其基因序列的分离、鉴定和表达活性分析。
1、棉花FLA1基因序列的分离鉴定
从棉纤维cDNA文库中分离了10,000多个棉花cDNA克隆,通过生物信息学分析,鉴定了4个GhFLA cDNA序列,其中的一个命名为GhFLA1,再以GhFLA1cDNA的全长序列设计引物GhFLA1Fup和GhFLA1Fdn,通过PCR扩增获得基因全长。
2、实时荧光定量RT-PCR分析GhFLA1基因的表达
(1)组织总RNA的提取(按Li XB,Cai L,Cheng NH,Liu JW,Molecular characterizationof the cotton GhTUB1 gene that preferentially expressed in fiber.Plant Physiol.2002,130:666-674的方法进行)。
(2)实时荧光定量RT-PCR研究基因的表达(按照Li XB,Fan XP,Wang XL,Cai L,YangWC,2005.The Cotton ACTIN1 gene is functionally expressed in fibers and participates in fiberelongation.Plant Cell 17:859-875进行)。首先,将棉花不同组织(根、下胚轴、子叶、叶子、花瓣、花药、开花后2天纤维、5天纤维、10天纤维和10天胚珠、15天纤维、18天纤维、20天纤维等)的总RNA(2μg/样)用SuperScriptTM II RNase H-Reverse Transcriptase(Invitrogen Life Technologies)反转录成cDNA;然后,以cDNA为模板,用基因特异的引物(GhFLA1RTP1和GhFLA1RTP2)和Real-time PCR Master Mix(TOYOBO,Japan)进行定量PCR反应。棉花polyubiquitin基因(GhUBI1)作为RT-PCR反应的内标,目标基因每一个循环的扩增都被SYBR-Green荧光检测。每个基因的表达水平相对值按公式Y=10ΔCt/3.57×100%计算(其中ΔCt=CtGhUBI1-CtGhFLA1,3.57是利用GhUBI1制备的标准曲线y=-0.28x+9.87中斜率的倒数,表示基因表达相差10倍的PCR循环数)。重复3次,统计分析实验结果。
3.启动子的分离
(1)用基因组步移试剂盒(Genome Walker Universal Kit,BD Biosciences Clontech,Cat.No.638904)构建棉花基因组步移文库,再按所提供的方法,用GSP1和GSP2引物分别于试剂盒中的AP1和AP2引物配对,通过两轮PCR从棉花基因组步移文库中分离了GhFLA1基因5’-上游区935bp片段(包括启动子和5’未翻译区)。
本项目所用引物见下表1:
表1
4.启动子的表达分析
启动子的顺式作用元件按照plantCARE(
http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)进行,结果见表2。构建GhFLA1启动子:GUS基因融合表达载体(引物序列分别为pFLA1P1和pFLA1P2),电击法转化农杆菌LBA4404,然后转化烟草。GUS活性的组织化学染色分析按照Li XB,Cai L,ChengNH,Liu JW(Molecular characterization of the cotton GhTUB1 gene that preferentiallyexpressed in fiber.Plant Physiol.2002,130:666-674)介绍的方法进行。
表2PlantCARE预测pGhFLA1的顺式作用元件
假定的顺势作 用元件基序 位置 基序序列 假定功能
AAAC-基序 +459,+845 CAACAAAAACCT 光应答元件
AAGAA-基序 -692 GAAAGAA 未知
ACE-基序r -331 AAAACGTTTA 光应答元件
ARE-基序 -11,+276 TGGTTT 缺氧诱导
ATCT-基序 +642 AATCTAATCT 光应答元件
Box I +279,+700 TTTCAAA 光应答元件
CGTCA-基序 +901 CGTCA 甲基茉莉酸应答
GA-基序 +184 ATAGATAA 光应答元件
GAG-基序 -541 AGAGAGT 光应答元件
GARE-基序 -649,-716 AAACAGA, TCTGTTG 赤霉素应答元件
GATA-基序 -354,-413 AAGATAAGATT 光应答元件
HSE -19,+61,+283 AAAAAATTTC 热胁迫应答
I-基序 -413 GATAAGATT 光应答元件
LTR +43 CCGAAA 低温应答元件
Sp1 +600 CC(G/A)CCC 光应答元件
TGACG -901 TGACG 甲基茉莉酸应答
circadian +412,-491 CAANNNNATC 时钟节律相关
5.GhFLA1基因功能分析
离体胚珠培养按照Bealsey CA和Ting IP(Effects of Plant Growth Substances on inVitro Fiber Development from Unfertilized Cotton Ovules.Amer.J.Bot.1974,61:188-194)介绍的方法进行,再以不同浓度β-Yariv处理离体胚珠,10天后观察并测量棉纤维的长度。结果表明,β-Yariv处理后棉纤维伸长受到显著抑制,且抑制程度与β-Yariv成正比,表明AGP蛋白(包括FLA蛋白)对棉纤维发育起重要作用。同时,用AGP蛋白的不同抗体与开花后1天,2天和3天的胚珠进行免疫组化分析(按Tang XC,He YQ,Wang Y,Sun MX,The role ofarabinogalactan proteins binding to Yariv reagents in the initiation,cell developmental fate,andmaintenance of microspore embryogenesis in Brassica napus L.cv.Topas.J Exp Bot.2006,57:2639-2650的方法进行),结果发现与AGP蛋白糖组分相结合的JIM8抗体能与开花后1/2/3天的纤维免疫反应,特别是与开花后3天的纤维免疫反应很强;而与AGP蛋白部分糖支链相结合的JIM4和JIM13抗体则与开花后1/2/3天的纤维的免疫反应较弱。说明AGP(包括FLA)蛋白在棉纤维发育过程中起重要作用,特别是在棉纤维伸长期。
一个棉纤维特异性调控的GhFLA1基因上游启动子序列(包括5’端未翻译区)如下:
1 ATCTTATTTA AAAACCATCG AAATTTTTAT TACTCAATCA TTACCGAAAT AGAATCGGGC
61 TAAAATATTT CGAAAACTAA AAGTTTCACT TTTTATATTG AAAAACGAGG CTTTGTGATT
121 CTTATAAATT TAATTCATTG AAATTTCATC AAGTAAAATG GAAGAATTAT AAATCTCTAA
181 AATGATAGAT AAAAATGTCG CAAATAAAGC CATTGTGACA CCCATTAAAG GAGTCTTTCC
241 CCATCCAGGG GCTACCTTAC CATATTCCGA ATTCAATGGT TTCAAAAAAT CTCCTACAAC
301 AATTCGTCTT GGACTAGATC TAGAACTACT ATTAACGTTT TGTGTAGCCA TAAATCTTAT
361 TTTGTATTCA TTGAGATTTG TTAACTTTGT ATATCATTTC ACTATAAATA AACAATCTTA
421 TCATAGACCC ATTGTGATCA TGAAATTATA TAATAATGGA AACAAAAACC TTAGTTGCAA
481 TCTCTATATC TGATTTACTT GTAAGTTTTA CTAGGTACAC CTTATATACT GCTTTTGGGT
541 AACTCTCTCA ACAATTAAGA GATCCATTCG AGGAATACGG GAAATAATTG AAGAAACGAG
601 CCTCCCCATA TGTATGTCTA TTTGGTCACA TATCCACTCC AAAATCTACT CTGTTTTCCC
661 TGCTTTTCCA AGCAATGTAG TTGCTCATCA ATTTCTTTCC TTTAA AAATCCCAAC
721 AGAGTTTGCT AAAGTTGATA AGTATGTCTT CTAGTTAACT AAAGTAGCAT ATTTTACCTA
781 ACTTCACCCT CCAATATCCAAG CTCCCATTTC TTATCCAATC AAACATCCA
841 TAACATTTTT GTTCAAGGAC CACTTCTTCC CTTCCATTTT ACTTTGTTTT AGTTGCCATA
901 ACGTCACCTT CCAATACAAC CCACA
FLA1启动子序列长度为925bp。利用NNPP预测转录起始位点,用PlaceCARE预测可能的调控元件。结果如下:方框为假定的转录起始位点,灰色底纹字母为假定的CAAAT框,而黑色底纹的字母为假定的TATA框。
GhFLA1基因编码区序列(包括开放阅读框和3’端未翻译区;open reading frame and3’-untranslated region,简称ORF and 3’-UTR)如下:
1 ATGAGGCAAC AATATGTCTT CACTACTCTC ACGTTGCTCA TCCTGTTTTC CCTCAGTTGT
61 TCAACAACAT TAGCCCAATC TCCGGCACTG GCCCCGGCAC CTTCTGGCCC GACAAACGTC
121 ACCAAGATCC TCGAAAAAGC CGGTCAATTC ACCCTCTTCA TTCGTCTTCT AAAGTCCACT
181 CAAGTGGCCA ACCAGCTGCT CGGTCAGCTC AACAATTCCA ACAATGGTAT GACCGTTTTT
241 GCACCAACGG ACAATGCTTT CTCCAGCCTT AAATCGGGCA CATTGAATTC ACTCACCGAT
301 GAACAAAAAG TGCAGCTGGT GCAATTCCAC ATCGTCCCAA CATACCTCAC CTCGTCTCAG
361 TTCCAAACCA TTAGCAACCC TTTGAGAACC CAAGCTGGTG ATAGTGGCGA TGGCAAGTTC
421 CCTCTCAATG TCACCACTTC GGGGAACTCT GTGAATATAA CAACAGGGTT GACAAACACC
481 AGTGTTTCCG GCACTATTTA CACTGATGGT CAGCTTGCTG TTTATCAAAT CGATCAAGTT
541 CTTCAACCAT TGCAAATATT TGCACCTAGG CCTCCAGCTC CCGCACCGGC ACCGGCAAAG
601 TCGAAGAATA AGAAGGCTAC CACTGTTGCT GATAGCCCCG ATGTTACCCC AGCTGATAAC
661 TCCAAAGCGG CCACCTTGCA AAATGTTGGT TTGTTTGGAG TTGCTGCTCT AGTTATTGCA
721 CTTTCTTTGT GACCATGAAA ATGGAGAAAA GAAGAAGACA GTGATTTTGA TGGTGGTGAT
781 CAAGATGGCG AGTGTTTTTT AATTTTTCAA TAATTATCAT TTAAAAAATT TATGTTCTGT
841 ATGAAGATTG AATTTTGAGT TCGTGTTGTT GATTTCATTT ATTTTTGTTT TGAAATTTTC
901 TTTGTTATCT CTTACTTCTC AATTGTAATT GTGAATTTTG TGTCACTTTC TTCATCCTTT
961 CTCTTTTTAA GATTTTGCAT CATTGCTTGT TTTTG
基因的编码区(ORF)从起始密码子ATG到终止密码子TGA(1-732bp),不含内含子(即该基因序列与其cDNA序列相同)。
GhFLA1基因编码区翻译的蛋白质序列如下:
1 MRQQYVFTTL TLLILFSLSC STTLAQSPAL APAPSGPTNV TKILEKAGQF TLFIRLLKST
61 QVANQLLGQL NNSNNGMTVF APTDNAFSSL KSGTLNSLTD EQKVQLVQFH IVPTYLTSSQ
121 FQTISNPLRT QAGDSGDGKF PLNVTTSGNS VNITTGLTNT SVSGTIYTDG QLAVYQIDQV
181 LQPLQIFAPR PPAPAPAPAK SKNKKATTVA DSPDVTPADN SKAATLQNVG LFGVAALVIA
241 LSL