相关申请
本申请要求2005年1月12日提交的美国临时专利申请60/643,674 的优先权,其内容全部引入作为参考。
技术领域
本申请的公开内容涉及具有改变含油量的转基因植物和植物细 胞,以及生产具有改变含油量的植物以及从这种植物生产油的方法。
发明背景
操纵农作物种子的组成,尤其是种子油类的含量和组成的能力在 涉及加工食品油类以及动物饲养油类的农业工业中具有重要的应用价 值。农作物的种子含有多种有价值的组分,包括油类,蛋白以及淀粉。 工业生产过程可以分离若干或所有这些组分用于专门应用的单独销 售。例如,几乎60%的美国大豆农作物通过大豆加工工业进行压榨。 大豆加工产生高价销售的精炼油,而残余物主要作为饲料销售(US Soybean Board,2001Soy Stats)。加拿大油菜(canola)种子被压榨产生油 类以及副产品加拿大油菜粗粉(加拿大加拿大油菜协会)。几乎20%的 1999/2000年的美国玉米农作物经过工业化精炼,主要用于产生淀粉, 乙醇以及油类(玉米精炼业者协会)。因此,常常需要使种子的含油量最 大化。例如,对于诸如大豆以及加拿大油菜的加工含油种子而言,提 高种子的绝对含油量将提高这种谷物的价值。对于加工的玉米而言, 可能需要根据其它主要组分的应用提高或者降低含油量。降低油类可 以通过降低与油类氧化相关的不希望的味道改善分离的淀粉的质量。 或者,在味道并不重要的乙醇产生中,提高含油量可以提高总的价值。
在许多谷物饲料中,诸如玉米以及小麦,可能希望提高植物含油 量,因为油类比诸如碳水化合物的其它种子组分具有较高的能含量。 含油种子加工,就像大多数谷物加工业一样是资金密集型产业;因此 从低值组分到高价值油类组分的产品分布的较小改变可能对于谷物加 工者而言就具有显著的经济影响。
油类的生物技术处理可以提供组成的改变以及油产量的提高。组 成的改变尤其包括高油酸的大豆以及玉米油(美国专利6,229,033以及 6,248,939),以及含有月桂酸酯的种子(美国专利5,639,790)等。组成改 变的工作主要集中在加工的含油种子但是已经可以很容易地延伸至非- 含油种子农作物包括玉米。虽然对提高含油量具有相当的兴趣,在这 一领域目前唯一可行的生物技术是高油类玉米(HOC)技术(杜邦,美国 专利5,704,160)。HOC利用通过标准的选择育种连同生产系统中称为顶 交(TopCross)的优良品种(不孕雄性)杂交雌性得到的高油类授粉者。 顶交高油类系统使玉米收获的谷物含油量从~3.5%提高到~7%,改善 了谷物的能含量。
虽然HOC生产系统已经卓有成效,但是其仍然具有固有的局限 性。首先,担负全部的土地的种子栽植的低授粉者百分比的系统含有 固有风险,尤其是在旱年。第二,当前HOC领域含油量已经平稳在大 约9%的油类。最后,高油类玉米主要不是生物化学变化,而是对提高 含油量产生间接结果的解剖学上的突变体(提高胚芽尺寸)。为此,可选 择的高油类策略,尤其是来源于改变生化产量的高油类策略将是非常 重要的。
操作油市场最明显的目标农作物是大豆以及油菜籽,并且大量商 业工作(例如美国专利5,952,544;PCT申请WO9411516)证明拟南芥是 这些农作物中油类代谢的优良模型。种子油组合物的生物化学筛选已 经鉴定了拟南芥的许多关键生物合成酶基因并且导致农业上重要基因 的直系同源物被鉴定出来。例如,利用化学诱变处理群的筛选已经鉴 定了其种子显示脂肪酸成份改变的脂类突变体(Lemieux等1990,Thero. Appl.Genet.80,234-240;James以及Dooner,1990,Thero.Appl.Genet. 80,241-245)。检测脂肪酸成份改变的T-DNA诱变筛选(Feldmann等 1989,Science243:1351-1354)鉴定了ω3脱氢酶(FAD3)以及δ-12脱氢 酶(FAD2)基因(美国专利5952544;Yadav等,1993,Plant Physiol.103, 467-476;Okuley et al.,1994,Plant Cell6(1):147-158)。集中在含油量而 非油类质量的筛选分析化学上诱导的皱缩种子或籽粒密度改变的突变 体,据此推断出改变的植物含油量(Focks以及Benning,1998,Plant Physiol.118:91-101)。
用来鉴定参与非常长链脂肪酸产生的酶的另一种筛选鉴定了编码 负责降低种子中三酰甘油聚集的甘油二酯酰基转移酶(DGAT)的基因的 突变(Katavic V等,1995,Plant Physiol.108(1):399-409)。此外,还显示 DGAT cDNA的种子特异性过表达与提高的植物含油量有关(Jako等, 2001,Plant Physiol.126(2):861-74)。拟南芥也是用于理解影响粗粉质量 的种子组分的累积的模型。例如,拟南芥含有在很多双子叶植物,包 括加拿大油菜和大豆中发现的白蛋白和球蛋白种子贮藏蛋白(Shewry 1995,Plant Cell7:945-956)。合成纤维的组分,诸如纤维素和木质素的 生化途径在这些维管植物中是保守的,并且影响这些组分的拟南芥突 变体也已经被分离(在Chapel和Carpita1998,Current Opinion in Plant Biology1:179-185中综述)。
植物中的激活标签法是一种通过将包含调节序列(例如,增强子) 的异源核酸构建体插入植物基因组中而产生随机突变的方法。调节序 列可起到增强一个或多个天然植物基因转录的作用;因此,激活标签 法是一种用于产生功能获得(gain-of-function),通常是显性突变体的有 效方法(参见,例如,Hayashi等,1992,Science258:1350-1353;Weigel D et al.,2000,Plant Physiology,122:1003-1013)。插入的构建体提供了一 种分子标签,其用于快速鉴定由于其错表达引起突变表型的天然植物。 激活标签法同时可导致功能丧失的表型。插入可导致天然植物基因的 破坏,在该情况中表型通常是隐性的。
激活标签法已经被用于多种物种,包括烟草和拟南芥,来鉴定各 种突变表型和与这些表型相关的基因(Wilson,等,1996,Plant Cell8: 659-671;Schaffer et al.,1998,Cell93:1219-1229;Fridborg et al.,1999, Plant Cell11:1019-1032;Kardailsky et al.,1999,Science286:1962-1965; and Christensen S et al.,1998,9thInternational Conference on Arabidopsis Research,Univ.of Wisconsin-Madison,June24-28,Abstract165)。
发明概述
本发明提供了具有高油类(以下称作“HIO”)表型的转基因植 物。具有HIO表型的转基因植物在植物的任一部分,例如种子相对于 对照,非转基因的或者野生型植物具有改变的或者增加的含油量。本 发明还提供了来源于转基因植物的种子的油,其中的种子具有改变的 或者提高的含油量。本发明还提供了从具有HIO表型的转基因植物的 任一部分产生的粗粉,饲料或者食物。
在某些实施方案中,该转基因植物包括含有编码或互补于编码 HIO多肽的核苷酸序列的转化载体。在具体的实施方案中,HIO多肽 在转基因植物中的表达引起转基因植物改变或者提高的含油量。在优 选的实施方案中,转基因植物选自油菜籽,大豆,玉米,向日葵,棉 花,可可,红花,油棕,椰子,亚麻,蓖麻以及花生。本发明还提供 了产生油类的方法,包括培育转基因植物以及从所述植物回收油类。 本发明进一步提供了含有编码HIO多肽的核酸序列的饲料,粗粉,谷 物或者种子。本发明还提供了含有HIO多肽或其直系同源物的饲料, 粗粉,谷物或者种子。
本发明公开的转基因植物通过包括如下步骤的方法产生:把植物 转化载体导入到植物的祖细胞中,该植物转化载体含有编码或互补于 编码HIO多肽的序列的核苷酸序列,以及培育该转化的祖细胞以生产 转基因植物,其中表达所述的HIO多核苷酸序列,引起转基因植物的 高油表型。在其他实施方案中,本发明公开的转基因植物是从所述组 细胞生长而来的植物的直接后代或者间接后代。在具体的非限制性实 施例中,所述方法产生的转基因植物中HIO多肽的表达相对于对照, 非转基因或者野生型植物引起转基因植物的HIO表型。
本发明还公开了产生具有HIO表型植物的其他方法,其中植物被 鉴定为在其HIO核酸序列中具有等位基因,与缺少该等位基因的植物 相比所述HIO核酸序列中的等位基因引起HIO表型。该植物可以产生 子代,其中产生的子代遗传该等位基因并且为HIO表型。在该方法的 一些实施方案中,该方法使用候选基因/QTL法或者使用TILLING法。
本发明还提供了具有HIO表型的转基因植物细胞。所述转基因植 物细胞包括含有编码或者互补于编码HIO多肽的序列的HIO核苷酸序 列的转化载体。在优选的实施方案中,该转基因植物细胞来自选自加 拿大油菜,油菜籽,大豆,玉米,向日葵,棉花,可可,红花,油棕, 椰子,亚麻,蓖麻以及花生的植物。在其它实施方案中,所述植物细 胞为种子,花粉,繁殖体或者胚芽细胞。在一些实施方案中,该植物 细胞获自本发明公开的转基因植物。本发明还提供了来自作为从所述 组细胞生长而来的植物的直接后代或者间接后代的植物的植物细胞, 或者来自作为从所述组细胞生长而来的植物的直接后代或者间接后代 的植物的植物细胞。
本发明还提供了超过约10,000,更优选约20,000,甚至优选约 40,000粒种子的容器,其中超过约10%,更优选约25%,更优选约50 %,甚至更优选约75%或者更优选约90%的种子为来源于本发明的植 物的种子。
本发明还提供了超过约10kg,更优选约25kg,甚至更优选约50kg 种子的容器,其中超过约10%,更优选约25%,更优选约50%,甚至 更优选约75%或者更优选约90%的种子为来源于本发明的植物的种 子。
本发明的任一植物或其部分可以被加工产生饲料,食品,粗粉或 者油制剂。用于该目的的尤其优选的植物部分为种子。在优选的实施 方案中,饲料,粗粉或者油制剂被设计用于动物。生产饲料,食品, 粗粉和油制剂的方法是本领域公知的。例如,参见美国专利4,957,748; 5,100,679;5,219,596;5,936,069;6,005,076;6,146,669;以及6,156,227。 本发明的粗粉可以与其他的粗粉混合。在优选的实施方案中,产自本 发明的植物或者由本发明的方法产生的粗粉构成任一产品的粗粉组分 的超过约0.5%,约1%,约5%,约10%,约25%,约50%,约75 %或约90%体积或者重量。在另一实施方案中,可以混合粗粉制剂并 可以构成混合物超过约10%,约25%,约35%,约50%或约75%的 体积。
发明详述
定义
除非另有陈述,这里使用的全部技术以及科学术语具有与本领域 技术人员知晓的相同的含义。专业人员尤其参考Sambrook等,1989, 以及Ausubel FM等,1993的定义以及术语。应该理解本发明不限于所 描述的特定方法,流程以及试剂,因为这些可以改变。
此处所述的术语“高油(HIO)表型”是指具有改变含油量(表 型)的植物,或者植物的任一部分(例如,种子)。如本发明提供的, 改变含油量包括相比于对照,非转基因或者野生型植物,植物或者种 子中含油量增加。
此处所述的术语“含量”是指例如种子或者种子粗粉组分的类型 和相对含量。
此处所述的术语“粗粉”是指在从种子提取油之后剩余的种子组 分。粗粉组分的实例包括蛋白和纤维。
此处所述的术语“纤维”是指植物种子不消化的组分,包括诸如 纤维素,半纤维素,果胶,木质素和酚类化合物的细胞组分。
此处所述的术语“载体”是指设计用于在不同宿主细胞之间转移 的核酸构建体。“表达载体”是指可以在异源细胞中整合并表达异源 DNA片段的载体。许多原核以及真核生物表达载体是可以市售获得的。 选择合适的表达载体是本领域述人员所熟知的。
“异源的”核酸构建体或序列具有的一部分序列不是植物细胞的 野生型序列但是在其中表达。异源的控制序列是指不天然调节目前正 在调节的相同基因表达的控制序列(即启动子或增强子)。通常,异源核 酸序列不是它们所存在于的细胞或者基因组的一部分所内源产生的, 但是已经通过传染,转染,显微注射,电穿孔法等添加到细胞中。“异 源的”核酸构建体可以含有控制序列/DNA编码序列组合,其与野生型 植物中发现的控制序列/DNA编码序列组合相同或者不同。异源核酸序 列的具体的非限制性实例包括HIO核酸序列,或其片段,衍生物(变 体)或者直系同源物。
此处所述的术语“基因”是指参与多肽链产生的DNA片段,其可 能包括或者不包括编码区之前以及之后的区域,例如5′非翻译区(5′ UTR)或者“前导”序列以及3′UTR或者“尾部”序列以及单独的编码 片段(外显子)以及非-转录调节序列之间的内含子序列(内含子)。
这里使用的“重组体”包括已经通过导入异源的核酸序列进行修 饰的细胞或者载体,或者所述细胞来源于如此修饰的细胞。因此,例 如,重组细胞表达在天然(非-重组体)形式的细胞内没有发现相同形式 的基因或者表达在人为故意干预下异常表达,下调表达或者完全不表 达的天然基因。
此处所述的术语“基因表达”是指基于基因的核酸序列产生的多 肽的过程。所述过程包括转录以及翻译;因此“表达”可以是针对多 核苷酸或者多肽序列或者两者。有时,多核苷酸序列的表达不会引起 蛋白翻译。“过表达”是指相对于其在野生型(或者其它的参考[例如, 非-转基因])植物中的表达,多核苷酸和/或多肽序列表达增加并且可能 涉及自然存在或者非-自然存在的序列。“异位表达”是指在未-改变或 者野生型植物中不自然发生的,在某时,某地和/或提高水平的表达。 “下调表达”是指多核苷酸和/或多肽序列,通常是内源性基因相对于 其在野生型植物中表达的降低表达。术语“错误表达”以及“改变表 达”包括过表达,下调表达以及异位表达。
在将核酸序列插入细胞的概念中,术语“引入的”是指“转染”, “转化”和“转导”,并且包括核酸序列整合到真核或者原核细胞中, 其中核酸序列可以整合入细胞的基因组(例如染色体,质粒,质体或者 线粒体DNA),转化为自主复制子,或者瞬间表达(例如,转染的mRNA)。
本文使用的“植物细胞”是指来源于植物的任意细胞,包括来自 未分化的组织(例如愈伤组织)以及在种子,花粉粒,繁殖体(progagules) 或胚或者其相关结构中存在的任一类型的细胞。
此处所述的术语“天然的”以及“野生型”相对于给定植物性状 或者表型是指具有在相同种类的植物本身发现的特征或者表型的形 式。在一个实施方案中,野生型植物也是对照植物。在另一实施方案 中,野生型植物是非转基因植物。
此处所述的关于植物特性的术语“修饰”是指转基因植物(例如, 具有改变含油量的转基因植物)在转基因植物的任一部分,例如种子 中相对于类似的非-转基因植物的表型的改变。此处所述的术语“改变 的”是指转基因植物的植物性状或者表型(例如,含油量)相对于类 似的非-转基因植物的提高或者下降。在一个具体的非限制性实例中, 具有改进的性状的转基因植物包括相对于类似的非-转基因植物具有提 高含油量,或者HIO含量的植物。
对于转基因植物的“目的表型(性状)”,指通过T1和/或后代植物 证明的可观察到的或可测量的表型,相应的非转基因植物不显示该表 型(也即,在相似条件下培养或分析的基因型类似的植物)。目的表型可 表示对植物的改良(例如,在植物的种子中提高的含油量或者HIO含 量),或可提供一种在其他植物中产生改良的方法。“改良”是一种通 过给植物提供独特的和/或新的表型或者品质,而增强植物物种或品种 的实用性的特征。这样的转基因植物可以具有改进的表型,诸如HIO 表型。
术语“改变含油量表型”指遗传修饰(转基因)植物的可测量表型, 其中与类似的,但是非修饰(非转基因)的植物相比,该植物显示统 计上显著增加或减少的总体含油量(即,油类占种子质量的百分比)。高 油(HIO)表型指总体含油量增加。
本文使用的“突变体”多核苷酸序列或者基因与相应的野生型多 核苷酸序列或者基因在序列或者表达上不同,其中的差异导致修饰的 或者改变的植物的表型或者性状。相对于植物或植物株系,术语“突 变体”是指植物或者植物株系具有修饰的或者改变的植物表型或性状, 其中修饰的或者改变的表型或性状与野生型多核苷酸序列或基因的修 饰或者改变表达有关。
此处所述的术语“T1”是指来自T0植物的种子的植物子代。T1 子代是可通过应用选择性试剂选择的第一系列转化的植物,所述的选 择性试剂为例如抗生素或除草剂,由此转基因植物含有相应的抗性基 因。术语“T2”是指通过T1植物的花进行自体受精产生的植物子代, 所述T1植物之前被选择作为转基因植物。T3植物是由T2植物等产生 的。这里所述的特定植物的“直接子代”来源于所述植物的种子(或者, 有时来自其它的组织)且是紧随的子代;例如,对于特定的家系而言, T2植物是T1植物的直接子代。特定植物的“间接子代”来源于所述 植物直接子代的种子(或其它组织),或来自该家系随后子代的种子(或 其它组织);例如,T3植物是T1植物的间接子代。
此处所述的术语“植物部分”包括任意的植物器官或组织,包括, 但不限于种子,胚,分生组织区域,愈伤组织,叶,根,芽,配子体, 孢子体,花粉和小孢子。植物细胞可获自任意的植物器官或组织以及 由其制备的培养物。本发明提供了具有HIO表型的转基因植物细胞。 所述转基因植物细胞包括含有编码或者互补于编码HIO多肽的序列的 HIO核苷酸序列的转化载体。在优选的实施方案中,该转基因植物细 胞来自选自加拿大油菜,油菜籽,大豆,玉米,向日葵,棉花,可可, 红花,油棕,椰子,亚麻,蓖麻以及花生的植物。在其它实施方案中, 所述植物细胞为种子,花粉,繁殖体或者胚芽细胞,包括在种子,花 粉粒,繁殖体(progagules)或胚或者其相关结构中存在的任一类型的细 胞。本发明还提供了来自作为从所述祖细胞生长而来的植物的直接后 代或者间接后代的植物的植物细胞。可用于本发明方法的植物种类通 常是广泛的,其可以是可用于转化技术的高等植物,包括单子叶的和 双子叶的植物。
在这里所述的“转基因植物”包括在其基因组内含有异源多核苷 酸的植物。异源的多核苷酸可以稳定地整合到基因组中,或可以被插 入到染色体外。优选地,本发明的多核苷酸被稳定地整合到基因组中 从而使多核苷酸被连续传代。植物细胞,组织,器官或已被导入异源 多核苷酸的植物被认为是“转化的”,“转染的”或“转基因的”植 物。也含有该异源多核苷酸的转化植物或植物细胞的直接和间接子代 也被视为是转基因的。
本发明提供了具有HIO表型的转基因植物。具有HIO表型的转基 因植物可以在转基因植物的任一部分,例如种子中含有改进的油量或 者改变的含油量。本发明还提供了来源于转基因植物的种子的油,其 中的种子具有改变的含油量。本发明还提供了从具有HIO表型的转基 因植物的任一部分产生的粗粉,饲料或者食物。
在某些实施方案中,该转基因植物包括含有编码或互补于编码 “HIO”多肽的序列的HIO核苷酸序列的转化载体。在具体的实施方 案中,HIO多肽在转基因植物中的表达引起转基因植物改变的含油量。 在优选的实施方案中,转基因植物选自加拿大油菜,油菜籽,大豆, 玉米,向日葵,棉花,可可,红花,油棕,椰子,亚麻,蓖麻以及花 生。本发明还提供了产生油类或者种子粗粉的方法,包括培育转基因 植物以及从所述植物回收油类和/或种子粗粉。本发明进一步提供了含 有编码HIO多肽的核酸序列的饲料,粗粉,谷物或者种子。本发明还 提供了含有HIO多肽或其直系同源物的饲料,粗粉,谷物或者种子。
可以利用将所需的编码所需蛋白的多核苷酸序列导入植物细胞的 多种方法,并且这些方法对本领域技术人员也是公知的,包括但不限 于:(1)诸如微注射,电穿孔和微粒介导的递送(粒子枪(biolistic) 或基因枪技术)的物理方法;(2)病毒介导的递送技术;以及(3) 农杆菌介导的转化方法。
最常使用的转化植物细胞的方法是农杆菌介导的DNA转化方法 和粒子枪或微粒轰击介导的方法(即,基因枪)。通常,核转化是所 希望的,但是当需要用于特异性转化质粒,诸如叶绿体或者造粉体时, 可以利用微粒介导递送所需的多核苷酸转化植物质粒。
农杆菌介导的转化通过使用基因工程化的属于农杆菌属的土壤细 菌实现。具有Ti或Ri质粒的根癌农杆菌(Agrobacterium tumefaciens) 以及发根农杆菌(Agrobacterium Rhizogenes)的大量野生型以及卸甲 (disarmed)株可用于向植物进行基因转化。通过将可被基因工程化携 带任一所需DNA片段的称作“T-DNA”的特异性DNA转化到很多品 种的植物内进行基因转化。
农杆菌介导的植物的遗传转化包括若干步骤。第一步,首先将毒 性的农杆菌和植物细胞彼此接触,通常这一步称作“接种”。接种后, 使农杆菌和植物细胞/组织在一起培养几小时到几天的时间或者更长时 间,培养条件适于生长和T-DNA的转化。这一步称作“共培养”。共 培养和T-DNA递送以后,用杀细菌或者制菌剂处理植物细胞灭杀与外 植体接触和/或保留在含有外植体的容器中的农杆菌。如果在缺乏任一 选择剂促进转基因植物细胞相比非转基因植物细胞的优先生长的条件 下进行,通常这一步称作“延迟”步骤。如果在存在选择性好压转基 因植物细胞的条件下进行,这一步称作“选择”步骤。在使用“延迟” 步骤时,通常紧接着一个或者多个“选择步骤”。
对于微粒轰击(美国专利5,550,318;美国专利5,538,880,美国专 利5,610,042;以及PCT公开WO95/06128;每一个都在此处具体引入 作为参考)而言,粒子涂覆有核酸并通过推进力递送到细胞中。示范 性的粒子包括钨,铂,并优选金。
通过加速将DNA递送到植物细胞中的方法的示范性实施方案为 粒子枪粒子递送系统(Biolistics Particle Delivery System)(BioRad, Hercule,CA),该系统可被用于将涂覆DNA或者细胞的粒子推进通 过筛子,诸如不锈钢或者Nytex筛子到用悬浮培养的单子叶植物细胞覆 盖的过滤器表面上。
微粒轰击技术是广泛应用的技术,并且可几乎被用于转化任一的 植物品种。已通过微粒轰击转化的植物品种的实例包括单子叶植物品 种,诸如玉米(国际公开WO95/06128),大麦,小麦(美国专利 5,563,055,在此处全文引入作为参考),大米,燕麦,黑麦(rye), 甘蔗以及高粱;以及大量包括烟草,大豆的双子叶植物(美国专利 5,322,783,在此处全文引入作为参考),向日葵,花生,棉花,番茄 以及豆类(美国专利5,563,055,在此处全文引入作为参考)。
为了不考虑转化方法对转化的植物细胞进行选择或者记分,导入 细胞中的DNA含有在可再生的植物组织中发挥产生对植物组织赋予对 其他毒性化合物抗性的化合物的基因。用作可选择的,可筛选的或者 可记分的标记的目的基因包括但不限于GUS,绿色荧光蛋白(GFP), 荧光酶(LUX),抗生素或者除草剂耐受基因。抗生素抗性基因的实 例包括青霉素,卡那霉素(以及新霉素,G418,博来霉素);氨甲蝶 呤(以及三甲氧苄二氨嘧啶);氯霉素以及四环素。编码参与除草剂 耐受的蛋白的多核苷酸分子是本领域公知的,包括但不限于美国专利 5,627,061,美国专利5,633,435以及美国专利6,040,497记载的编码5- 烯醇丙酮基莽草酸盐-3-磷酸盐合成酶(EPSPS)的多核苷酸分子以及美 国专利5,094,945描述的用于耐受glyphosate的aroA;描述于美国专利 4,810,648用于耐受溴苯腈(bromoxynil)的编码溴苯腈水解酶(Nitrilase) (Bxn)的多核苷酸分子;描述于Misawa等,(Plant J.4:833-840,1993) 以及Misawa et al,(Plant J.6:481-489,1994)用于耐受哒草伏 (norflurazon)的编码八氢番茄红素脱氢酶(crtI)的多核苷酸分子; 描述于Sathasiivan等(Nucl.Acids Res.18:2188-2193,1990)用于耐受磺 酰脲类除草剂的编码乙酰羟基酸合成酶(AHAS,也称作ALS)的多核苷 酸分子;以及描述于DeBlock等(EMBO J.6:2513-2519,1987)用于耐 受草铵膦(Glufosinate)和双丙氨膦(bialaphos)的bar基因。
从多种转化的外植体再生,发育和培育植物是本领域公知的。这 种再生和生长过程通常包括选择转化的细胞以及通过常规的胚芽发育 到生根的小苗发育阶段培育这些单独的细胞的阶段。类似地再生转基 因胚芽和种子。然后将所产生的转基因生根的小苗种植在合适的植物 生长介质,诸如土壤中。暴露选择性试剂但存活下来的细胞,或者在 筛选分析中记分为阳性的细胞可以培养在支持植物体再生的培养基 中。将发育中的小苗转移到土壤较少的植物生长混合物中,并在转移 到温室或者用于成熟的生长室之前使(幼苗)受冷而变得耐寒。
本发明可以与转化的细胞或者组织一起使用。本文中所使用的“可 转化的”是指能够进一步繁殖产生植物体的细胞或者组织。本领域技 术人员认识到大量插入外源DNA后的植物细胞或者组织是可以转化 的,并且在合适的培养条件下,该植物细胞或者组织可以形成分化的 植物。适于这些目的的组织可以包括但不限于未成熟的胚芽,小组织, 悬浮细胞培养物,未成熟的花序,茎分生组织,结外植体,愈伤组织, 下胚轴组织,子叶,根和叶。
可以使用任一合适的培养基。合适的培养基的实例包括但不限于 基于MS-的培养基(Murashige和Skoog,Physiol.Plant,15:473-497,1962) 或填充有包括但不限于植物激素,细胞分裂素,ABA和赤霉素的其他 植物生长调节剂的基于N6-的培养基(Chu等,Scientia Sinica18:659, 1975)。本领域技术人员熟知多种组织培养基,其当进行适当补充时可 以支持植物组织生长和发育并适于植物转化和再生。这些组织培养基 可以作为市售制剂,或者用户制备以及改进的试剂出售。本领域技术 人员可以认识到用于转化和再生的诸如营养剂和生长调节剂的培养基 和培养基补充剂以及其他培养条件,诸如培养期间的光密度,pH以及 培养温度可被优化用于特定的多种目的的培养温度。
本领域技术人员将认识到将表达盒稳定整合到转基因植物并证实 可以操作后,可以通过有性杂交导入其他的植物体内。取决于所杂交 的品种,可以使用大量标准的繁殖技术。
具有改变的含油量表型的植物的鉴定
我们使用拟南芥激活标签(ACTTAG)筛选来鉴定我们已经鉴定 并命名为HIO#(列举在下表1中的1栏)的基因15232503与改变的 含油量表型(具体地,高油表型)之间的关联。简要地,而且如实施例中 进一步描述的,用pSKI015载体对许多拟南芥植物进行了突变,所述 载体包含来自根癌农杆菌Ti质粒的T-DNA,病毒增强子元件和选择标 记基因(Weigel等,2000)。当T-DNA插入到转化植物的基因组中时, 增强子元件可导致附近基因的上调,通常在增强子的大约10千碱基(kb) 内。为了特异性回收转化的植物,把T1植物暴露于选择剂。为了扩增 种子原种,将来自每种T1植物的大约18粒T2种子播种在土壤中,并 且在萌芽后,暴露于选择剂来回收转化的T2植物。收获来自这些植物 的T3种子并汇集。利用下述的两种方法之一评价油含量;利用用于 HIO30.1的气相色谱(GC)分析,测定T2种子中的脂肪酸含量和组成或 者利用用于HIO101B的近红外光谱学(NIR)估计T3种子的总脂类含 量。
通过分析所鉴定的品系中侧接T-DNA插入片段的基因组DNA序 列发现了HIO核酸与高油表型之间的关联。因此,HIO核酸和/或多肽 可用于开发具有修饰的含油量表型(“HIO表型”)的基因修饰的植物。 HIO核酸可用于产生含油种子作物,其从含油种子加工提供提高的产 油量,以及用于生产能提供能量增加的饲料谷物作物用于动物饲养。 HIO核酸可进一步用于增加特种油料作物的含油量,以便增加所需稀 有脂肪酸的产量。已经进行遗传修饰表达HIO多肽的转基因植物可用 于生产油,其中利用标准方法培养转基因植物,并从植物部分(例如, 种子)获得油。
HIO核酸和多肽
在激活标签筛选中发现的HIO核酸列在表1的第1栏中。拟南芥 信息源(TAIR)鉴定号提供在第2栏。第3-4栏分别提供了核苷酸和 多肽序列的Genbank鉴定号(GI#)。第5栏列举了可能的生物化学 功能和/或蛋白名称。第6栏列举了保守的蛋白结构域。第7栏列举了 过量表达HIO核酸的植物的相对种子含油量。第8栏提供了来自其他 植物品种的直系同源物基因的核酸和/或多肽序列的GI#。
拟南芥HIO30.1核酸(基因组DNA)序列提供于SEQ ID NO:1以 及Genbank登录号GI#30694055。对应的蛋白序列提供于SEQ ID NO: 2以及GI#15232503中。拟南芥HIO101B核酸提供于SEQ ID NO:3 以及Genbank登录号GI#30680675中。相应的蛋白序列提供在SEQ ID NO:4以及GI#30680676中。
如这里使用的术语“HIO多肽”指当在植物中表达时引起植物的 任一部分,例如种子HIO表型的任一多肽。本发明还提供了超过约 10,000,更优选约20,000,甚至优选约40,000粒种子的容器,其中超 过约10%,更优选约25%,更优选约50%,甚至更优选约75%或者 更优选约90%的种子为来源于本发明的植物的种子。
本发明还提供了超过约10kg,更优选约25kg,甚至更优选约50kg 种子的容器,其中超过约10%,更优选约25%,更优选约50%,甚至 更优选约75%或者更优选约90%的种子为来源于本发明的植物的种 子。
如这里使用的术语“HIO多肽”指全长HIO蛋白或其“功能活性” 的片段,衍生物(变体)或者直系同源物,如该蛋白片段,衍生物或者直 系同源物显示与全长HIO多肽相关的一种或多种功能活性。在一个优 选的实施方案中,功能活性HIO多肽在转基因植物中导致HIO表型。 在更进一步优选的实施方案中,HIO多肽在植物中的错表达导致高油 表型。在另一个实施方案中,功能活性HIO多肽当在植物或植物细胞 中表达时,能拯救缺陷的(包括缺失的)内源HIO活性;该拯救多肽可来 自与具有缺陷活性的植物相同的或不同的物种。在另一个实施方案中, 全长HIO多肽的功能活性片段保留与全长HIO多肽相关的一种或多种 生物学特性,例如信号活性,结合活性,催化活性或细胞或者细胞外 定位活性。
HIO片段优选包括HIO结构域,例如C-或N-末端或者催化结构 域,尤其,优选包括HIO蛋白的至少10个,优选至少20个,更优选 至少25个,最优选至少50个连续氨基酸。HIO基因的功能域列举在 表1的第6栏中,并可使用PFAM程序(Bateman A等,1999Nucleic Acids Res27:260-262)或者INTERPRO(Mulder等,2003,Nucleic Acid Res. 31,315-318)程序进行鉴定。全长HIO多肽或其片段的功能活性变体 包括具有氨基酸插入序列,缺失,或者置换,但保留与全长HIO多肽 相关的一种或多种生物学特性的多肽。有时,产生的变体能改变HIO 多肽的翻译后加工。例如,与天然多肽相比,变体可以具有改变的蛋 白转运或者蛋白定位特性,或者改变的蛋白的半衰期。
这里使用的术语“HIO核酸”包含具有表1的第3栏的GenBank 登录序列提供的序列,或者与其互补的序列的核酸,及其功能活性片 段,衍生物或直系同源物。本发明的HIO核酸可以是来源于基因组DNA 或者cDNA的DNA,或者RNA。
在一个实施方案中,功能活性的HIO核酸编码或者互补于编码功 能活性的HIO多肽的核酸。基因组DNA包括在该定义内,其用作原始 RNA转录本(也即,mRNA前体)的模板,其在编码功能活性HIO多肽 之前需要加工,例如剪接。HIO核酸可包括其他的非编码序列,其可 以转录或者不被转录;这种序列包括5’和3’UTRs,聚腺苷酸化信号和 尤其是本领域已知的控制基因表达的调节序列。一些多肽需要加工事 件,例如蛋白水解剪切,共价修饰,等等,以便完全活化。因此,功 能活性核酸可编码成熟的或者预先加工的HIO多肽,或者中间体形式。 HIO多核苷酸还可以包括异源编码序列,例如,编码包括的促进融合 多肽纯化的标记或者转化标记的序列。在另一个实施方案中,功能活 性HIO核酸可用于例如,通过反义抑制,共抑制等产生功能丧失的HIO 表型。本发明还提供了含有编码HIO多肽的核酸序列的饲料,粗粉, 谷物,食物或者种子。
在一个优选的实施方案中,用于本发明方法的HIO核酸,包括编 码或互补于编码HIO多肽的序列的核酸序列,该HIO多肽与表1的第 4栏的GenBank登录序列提供的HIO多肽序列(例如,SEQ ID NO:2 或4列出的氨基酸序列)具有至少50%,60%,70%,75%,80%,85%, 90%,95%,97%,98%或者99%的序列同一性。
在另一个实施方案中,本发明的HIO多肽包括与SEQ ID NO:2 或4的HIO多肽序列具有至少50%或60%同一性的多肽序列,而且与 所公开的HIO多肽序列可具有至少70%,80%,85%,90%,95%,97 %,98%或者99%的序列同一性,并且可以包括所公开的HIO多肽的 保守蛋白结构域,诸如表1的第6栏所列举的蛋白结构域。在另一个 实施方案中,HIO多肽包括与表1的第4栏的GenBank登录序列提供 的多肽序列的功能活性片段,例如SEQ ID NO:2或者4所列出的氨基 酸序列具有至少50%,60%,70%,80%,85%,90%,95%,97%,98 %或者99%序列同一性的多肽序列。在另一个实施方案中,HIO多肽 包括与表1的第4栏的GenBank登录序列提供的全长多肽序列,例如 SEQ ID NO:2或者4所列出的氨基酸序列,具有至少50%,60%,70%, 80%或90%的序列同一性的多肽序列,并且包括表1的第6栏所列举的 保守蛋白结构域。
在另一个方面,HIO多核苷酸序列与所公开的HIO核酸序列的全 长,诸如SEQ ID NO:1或3所示的HIO核酸序列的全长或是与这种 HIO序列互补的核酸序列具有至少50%到60%的同一性,而且可包含 与所公开的HIO核酸序列(例如,SEQ ID NO:1或3,或者表1的第 3栏的GenBank登录序列提供的序列)或其功能活性片段,或与这种 HIO序列互补的核酸序列具有至少70%,80%,85%,90%或95%或以 上的序列同一性。在另一个实施方案中,所公开的HIO核酸包括SEQ ID NO:1或者SEQ ID NO:3所示的核酸序列,或者与这样的HIO序列 互补的核酸序列,以及与这样的HIO序列具有显著的序列同源性的核 酸序列。在本文使用的短语“显著的序列同源性”是指与诸如HIO序 列,具有微小或者不重要的序列变异的那些核酸序列,即以基本上相 同的方式发挥功能并且编码HIO多肽的序列。
这里使用的,特定的目标序列或其特定部分的“百分比(%)序列同 一性”被定义为如果需要获得最大的百分比序列同一性,如通过 WU-BLAST-2.0al9程序(Altschul等,J.Mol.Biol.(1990)215:403-410) 所产生的,其中搜索参数设为缺省值,在进行序列比对和引入缺口之 后,候选的衍生序列中核苷酸或氨基酸与目标序列(或其特定部分)中核 苷酸或氨基酸相同的百分比。HSP S和HSP S2参数是机动值,而且是 通过程序本身取决于特定序列的组成和在其中对感兴趣的序列进行搜 索的特定数据库的组成而确定的。“%同一性值”通过把匹配的相同核 苷酸或氨基酸的数目除以报告的百分比同一性的序列的序列长度而确 定。“百分比(%)氨基酸序列相似性”通过进行与确定百分比氨基酸序列 同一性相同的计算而确定,但是在计算中除了相同的氨基酸之外还包 括保守氨基酸取代。保守氨基酸取代,即其中氨基酸被具有相似特性 的另一个氨基酸所取代,而对蛋白的折叠或活性没有显著的影响。可 以互相取代的芳香族氨基酸为苯丙氨酸,色氨酸和酪氨酸;可互换的 疏水氨基酸为亮氨酸,异亮氨酸,甲硫氨酸和缬氨酸;可互换的极性 氨基酸为谷氨酰胺和天门冬酰胺;可互换的碱性氨基酸为精氨酸,赖 氨酸和组氨酸;可互换的酸性氨基酸为天冬氨酸和谷氨酸;可互换的 小氨基酸为丙氨酸,丝氨酸,苏氨酸,半胱氨酸和甘氨酸。
目标核酸分子的衍生核酸分子包括能选择性地与所公开的核酸序 列,例如SEQ ID NO:1或3的核酸序列杂交的序列。杂交的严谨度可 通过温度,离子强度,pH,以及杂交和洗涤期间变性剂诸如甲酰胺的 存在来进行控制。通常使用的条件是大家所熟知的(参见,例如,Current Protocol in Molecular Biology,Vol.1,Chap.2.10,John Wiley & Sons, Publishers(1994);Sambrook等,Molecular Cloning,Cold Spring Harbor (1989))。
在一些实施方案子中,本发明的核酸分子能在如下的严谨杂交条 件下与核酸分子,例如具有SEQ ID NO:1或SEQ ID NO:3的核苷酸 序列的核酸分子杂交:含有核酸的滤纸,在含有6X单倍浓度的柠檬酸 盐(SSC)(1X SSC为0.15M NaCl,0.015M柠檬酸钠;pH7.0),5X Denhardt溶液,0.05%焦磷酸钠和100μg/ml的鲱鱼精子DNA的溶液 中,65℃预杂交8小时至过夜;在含有6X SSC,1X Denhardt溶液,100 μg/ml酵母tRNA和0.05%焦磷酸钠的溶液中,65℃杂交18-20小时; 在含有0.1X SSC和0.1%SDS(十二烷基硫酸钠)的溶液中,65℃洗涤滤 纸1小时。
在其他的实施方案中,使用如下的中等严谨杂交条件:包含核酸 的滤纸,在含有35%甲酰胺,5X SSC,50mM Tris-HCl(pH7.5),5mM EDTA,0.1%PVP,1%Ficoll,1%BSA和500μg/ml变性鲑鱼精子DNA 的溶液中,40℃预处理6小时;在含有35%甲酰胺,5X SSC,50mM Tris-HCl(pH7.5),5mM EDTA,0.02%PVP,0.02%Ficoll,0.2%BSA, 100μg/ml鲑鱼精子DNA和10%(wt/vol)葡聚糖硫酸酯的溶液中,40℃ 杂交18-20小时;接着,在含有2X SSC和0.1%SDS的溶液中,55℃ 洗涤两次1小时。或者,可使用如下的低严谨条件:在含有20%甲酰 胺,5x SSC,50mM磷酸钠(pH7.6),5X Denhardt溶液,10%葡聚糖 硫酸酯和20μg/ml变性剪切鲑鱼精子DNA的溶液中,37℃孵育8小 时到过夜;在相同的缓冲液中杂交18到20小时;在1x SSC中,大约 37℃洗涤滤纸1小时。
由于遗传密码的简并性,可产生许多编码HIO多肽的多核苷酸序 列。例如,根据特定宿主生物显示的最佳密码子使用,可选择密码子 以增加多肽在特定的宿主物种中的表达(参见,例如,Nakamura等, 1999)。这种序列变体可用于本发明的方法中。
本发明的方法可使用拟南芥HIO的直系同源物。在下表1中鉴定 的每一种拟南芥HIO基因的可能直系同源物鉴定在表1的第8栏。鉴 定其他植物品种中直系同源物的方法是本领域已知的。一般说来,不 同物种中的直系同源物保持相同的功能,由于存在一个或多个蛋白基 序和/或三维结构。在进化过程中,当物种形成后发生基因重复事件时, 一个物种,例如拟南芥中的单个基因可能相应于另一个物种中的多个 基因(旁系同源物)。这里使用的,术语“直系同源物”包括旁系同源物。 当序列数据可用于特定的植物物种时,通常可通过序列同源性分析, 例如BLAST分析,一般使用蛋白饵序列,来鉴定直系同源物。如果来 自正向BLAST结果的最合适序列检索到了反向BLAST中原始的查询 序列,该序列则为可能的直系同源物(Huynen MA和Bork P,Proc Natl Acad Sci(1998)95:5849-5856;Huynen MA等,Genome Research(2000) 10:1204-1210)。
用于多个序列比对的程序,例如CLUSTAL(Thompson JD等,1994, Nucleic Acids Res22:4673-4680),可用于突出直系同源蛋白的保守区 域和/或残基,并产生系统树。在表示来自不同物种的多个同源序列(例 如,通过BLAST分析检索到的)的系统树中,来自2个物种的直系同 源序列,相对于来自2个物种的所有其他的序列,通常在系统树上显 得最靠近。结构串线(threading)或蛋白折叠的其他分析(例如,使用 ProCeryon,Biosciences,Salzburg,Austria的软件)也可鉴定可能的直系 同源物。核酸杂交方法也可用于寻找直向同源基因,而且当不能获得 序列数据时是优选的。简并PCR和cDNA或基因组DNA文库筛选是 寻找相关基因序列的常见方法,而且是本领域熟知的(参见,例如, Sambrook,1989,Molecular Cloning:A Laboratory Manual(第二版), Cold Spring Harbor Press,Plainview,N.Y.;Dieffenbach和Dveksler,1995, PCR Primer:A Laboratory Manual,Cold Spring Harbor Laboratory Press, NY)。例如,Sambrook等中描述了用于从感兴趣的植物物种产生cDNA 文库,和用部分同源基因探针探测文库的方法。拟南芥HIO编码序列 的高度保守部分可用作探针。HIO直系同源核酸可在高度,中度或低 度严谨条件下与表1第3栏的GenBank登录号所示的核酸杂交。扩增 或分离假定的直系同源物的部分之后,可通过标准技术克隆该部分并 进行测序,而且用作探针来分离完整的cDNA或基因组克隆。
或者,可以启动EST方案来产生感兴趣的植物物种的序列信息数 据库。在另一种方法中,特异性结合已知的HIO多肽的抗体,用于直 系同源物分离(参见,例如,Harlow and Lane,1988,1999,Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory Press,New York)。 Western印迹分析可确定HIO直系同源物(也即,所公开的HIO多肽的 直系同源蛋白)存在于特定植物物种的粗提取物中。当观察反应性时, 可通过筛选显示特定植物物种的表达文库,来分离编码候选直系同源 物的序列。如Sambrook等1989中所述,可在各种商业可获得的载体 中构建表达文库,包括λgt11。一旦通过任何这些方法鉴定到了候选的 直系同源物,候选的直系同源序列可用作饵(“查询”),用于从其中已 经鉴定到HIO核酸和/或多肽序列的拟南芥或其他的物种中对序列进行 反向BLAST。
可使用任何可用的方法来获得HIO核酸和多肽。例如,通过如前 所述的筛选DNA文库或通过使用聚合酶链式反应(PCR),分离感兴趣 的cDNA或基因组DNA序列的技术是本领域熟知的。或者,可合成核 酸序列。任何已知的方法,例如位点定向诱变(Kunkel TA等,1991), 可用于将所需的改变引入到克隆的核酸中。
通常,本发明的方法包括把所需形式的HIO核酸整合到用于转化 植物细胞的植物表达载体中,并在宿主植物中表达HIO多肽。
“分离的”HIO核酸分子是不同于天然发现的形式或设置的核酸 分子,而且从至少一个杂质核酸分子中鉴定和分离,该杂质核酸分子 通常结合在HIO核酸的天然来源中。然而,分离的HIO核酸分子包括 包含在通常表达HIO的细胞中的HIO核酸分子,例如,该核酸分子位 于与天然细胞的核酸分子不同的染色体位置中。
产生具有改变的含油量表型的遗传修饰的植物
本发明所公开的HIO核酸和多肽可用于产生具有修饰的含油量表 型的遗传修饰的植物。这里使用的,“修饰的含油量(表型)”可指 植物任何部分中修饰的含油量。在优选的实施方案中,HIO基因在植 物中的改变表达用于产生具有高油含量(表型)的植物。常常在种子 中观察到改变的含油量。转基因植物的实例包括含有具有编码或者互 补于编码具有SEQ ID NO:2或者SEQ ID NO:4所示的氨基酸序列的 HIO多肽的序列的核苷酸序列的植物转化载体。
本发明的任一植物或其部分可以被加工产生饲料,粗粉或者油制 剂。诸如含有本发明所公开的核酸序列的玉米,大豆和加拿大油菜的 转基因植物可用于产生植物油和粗粉。用于该目的的尤其优选的植物 部分为种子。植物油被用于多种食物产品中,而来自种子的粗粉被用 作动物饲料。在优选的实施方案中,饲料,食物,粗粉或者油制剂被 设计用于反刍动物。生产饲料,食物,粗粉和油制剂的方法是本领域 公知的。例如,参见美国专利4,957,748;5,100,679;5,219,596;5,936,069; 6,005,076;6,146,669;以及6,156,227。在粗粉制备的一个具体但非限 制性实例中,从转基因植物收获种子后,清洗种子去除茎、杆、柄以 及其他物质,然后在滚筒辗粉机中辗碎从而破碎种子外壳。将辗碎的 种子加热到75-100℃使水解酶变性,溶解含有油的未破裂的细胞,使 小油滴聚集。通过在螺旋压榨机中压榨种子提取(并可以回收)大多 数的油。通过用有机溶剂,如己烷提取从压滤饼提取剩余的油。通过 将粗粉加热到大约100℃从粗粉去除溶剂。干燥后,使粗粉成粒化至统 一的形状。含有种子的蛋白,可降解的碳水化合物以及纤维的粗粉可 以在用作动物饲料之前与其他的材料混合。
本发明的粗粉可以与其他的粗粉混合。在优选的实施方案中,产 自本发明的植物或者由本发明的方法产生的粗粉构成任一产品的粗粉 组分的超过约0.5%,约1%,约5%,约10%,约25%,约50%,约 75%或约90%体积或者重量。在另一实施方案中,可以混合粗粉制剂 并可以构成混合物超过约10%,约25%,约35%,约50%或约75% 的体积。
这里所述的方法一般适用于所有植物。尽管在拟南芥中进行了激 活标签法和基因鉴定,但是HIO核酸序列(或其直系同源物,变体或片 段)可在任何植物种类中表达。在一个优选的实施方案中,产油植物, 在特异性器官,主要是在种子中生产和储存三酰基甘油。这些物种包 括大豆(Glycine max),油菜籽和加拿大油菜(包括甘蓝型油菜(Brassica napus),B.campestris)),向日葵(Helianthus annus),棉花(陆地棉),玉 米(Zea maya),可可(Theobroma cacao),红花(Carthamus tinctorius),油 棕(Elaeis guineensis),椰子(Cocos nucifera),亚麻(Linum usitatissimum), 蓖麻(Ricinus communis)和花生(Arachis hypogaea)。本发明还涉及产生 果实和蔬菜的植物,产生谷物的植物,产生坚果的植物,快速周期的 芸苔品种,紫花苜蓿(Medicago sativa),烟草(Nicotiana),草坪草(Poaceae family),其他的饲料作物,和可能是稀有脂肪酸来源的野生物种。
本领域技术人员应该了解本领域存在各式各样的转化技术,而且 新技术不断地变成可用的。适于靶宿主植物的任何技术可用于本发明 的范围内。例如,可引入各种形式的构建体,包括但不限于DNA链, 到质粒,或人工染色体中。可通过各种技术将构建体引入到靶植物细 胞中,包括但不限于异源核酸的土壤农杆菌介导的转化,电穿孔法, 显微注射,微粒轰击,磷酸钙-DNA共沉淀或脂质体介导的转化。植物 转化优选是永久的,也即通过使导入的表达构建体整合到宿主植物基 因组中,以便该导入的构建体传递给连续的植物世代。根据计划的用 途,包含HIO多核苷酸的异源核酸构建体可编码完整的蛋白或其生物 学活性部分。
在一个实施方案中,双元的基于Ti的载体系统可用于转移多核苷 酸。标准的土壤农杆菌双元载体是本领域技术人员已知的,而且许多 是可商业获得的(例如,pBI121 Clontech Laboratories,Palo Alto,CA)。 构建体或者载体可以包括植物启动子来表达所选择的核酸分子。在优 选的实施方案中,启动子为植物启动子。
用土壤农杆菌载体转化植物的最佳方法随待转化的植物种类而变 化。用于土壤农杆菌介导的转化的示例性方法包括转化来源于无菌籽 苗和/或小植株的胚轴,芽,茎或叶组织的外植体。这种转化的植物可 有性繁殖,或通过细胞或组织培养繁殖。先前已经描述了土壤农杆菌 转化用于许多不同类型的植物,而且可在科学文献中找到这种转化方 法。其中特别相关的是转化商业上重要的作物,例如芸苔物种,包括 加拿大油菜和油菜籽(De Block等,1989,Plant Physiol.,91:694-701), 向日葵(Everett等,1987,Bio/Technology,5:1201)和大豆(Christou等, 1989,Proc.Natl.Acad.Sci USA,86:7500-7504;Kline et al.,1987,Nature, 327:70)的方法。
根据表达水平,发生表达的组织类型和/或表达的发育阶段,可调 节HIO核酸序列的表达(包括转录和翻译)。许多异源调节序列(例如, 启动子和增强子)可用于控制HIO核酸的表达。这些包括组成型,诱导 型和可调节的启动子,以及能以组织或瞬时特异性方式调控表达的启 动子和增强子。示例性的组成型启动子包括树莓E4启动子(美国专利 5,783,393和5,783,394),胭脂碱合成酶(NOS)启动子(Ebert等,Proc. Natl.Acad.Sci(U.S.A)84:5745-5749,1987),章鱼碱合成酶(OCS)启 动子(其由根癌农杆菌的诱导肿瘤的质粒携带),诸如花椰菜花叶病 毒(CaMV)19S启动子(Lawton等,Plant Mol.Biol,9:315-324,1987) 以及CaMV35S启动子(Odell et al.,Nature313:810-812,1985and Jones JD et al,1992)的花椰菜病毒启动子,玄参花叶病毒35S-启动子(美国专 利5,378,619),光诱导的来自1,5-二磷酸核酮糖羧化酶小亚基的启动子 (ssRUBISCO),Adh启动子(Walker等,Proc.Natl.Acad.Sci.(U.S.A.) 84:6624-6628,1987),蔗糖合成酶启动子(Yang等,Proc.Natl.Acad.Sci. (U.S.A.)87:4144-4148,1990),R基因复合启动子(Chandler等,The Plant Cell 1:1175-1183,1989),叶绿素a/b结合蛋白基因启动子,CsVMV启 动子(Verdaguer B et al.,1998,Plant Mol Biol.,37:1055-1067),甜瓜肌动 蛋白启动子(公开的PCT申请WO0056863),以及种子特异性PRU启动 子(美国专利申请公开U.S.20040064854,Clendennen等)示例性的组 织特异性启动子包括番茄E4和E8启动子(美国专利5,859,330)和番茄 2AII基因启动子(Van Haaren MJJ et al.,1993,Plant Mol Bio., 21:625-640)。
在一个优选的实施方案中,HIO表达在来自其表达与早期种子和/ 或胚胎发育相关的基因的调节序列的调控下。实际上,在优选的实施 方案中,所使用的启动子为种子增强的启动子。这种启动子的实例包 括来自诸如napin(Kridl等,Seed Sci.Res.1:209:219,1991),球蛋白 (Belanger and Kriz,Genet.,129:863-872,1991,GenBank Accession No. L22295),γ玉米醇溶蛋白Z27(Lopes等,Mol Gen Genet.,247:603-613, 1995),L3油质蛋白启动子(美国专利6,433,252),菜豆蛋白(Bustos等, Plant Cell,1(9):839-853,1989),arcelin5(US申请2003/0046727),大豆 7S启动子,7Sα启动子(US申请2003/0093828),大豆7Sα ’β黄豆蛋白 启动子,7Sα ’启动子(Beachy等,EMBO J.,4:3047,1985;Schuler等, Nucleic Acid Res.,10(24):8225-8244,1982),大豆胰蛋白酶抑制剂 (Riggs等,Plant Cell1(6):609-62l,1989),ACP(Baerson等,Plant Mol. Biol.,22(2):255-267,1993),硬脂酰-ACP脱氢酶(Slocombe等,Plant Physiol.104(4):167-176,1994),β黄豆蛋白的大豆a′亚基(Chen等,Proc. Natl.Acad.Sci.83:8560-8564,1986),蚕豆USP(P-Vf.Usp,SEQ ID NO:1, 2,和3(US申请2003/229918)以及玉米L3油质蛋白启动子(Hong等, Plant Mol.Biol.,34(3):549-555,1997)等基因的5’调节区域。还包括玉米 醇溶蛋白,是在玉米胚乳中发现的一组贮藏蛋白。玉米醇溶蛋白基因 的基因组克隆已被分离(Pedersen等,Cell29:1015-1026,1982;以及 Russell等,Transgenic Res.6(2):157-168)以及来自这些克隆的启动子, 包括15kD,16kD,19kD,22kD,27kD以及这些基因也可被利用。 已知例如在玉米内发挥功能的其他启动子包括下列基因的启动子: waxy,Brittle,Shrunken2,分支酶I和II,淀粉合成酶,去分支酶, 油质蛋白,谷蛋白以及蔗糖合成酶。其启动子与早期种子和胚胎发育 相关的豆科植物基因包括V.faba豆球蛋白(Baumlein等,1991,Mol Gen Genet225:121-8;Baumlein等,1992,Plant J2:233-9),V.faba usp (Fiedler等,1993,Plant Mol Biol22:669-79),豌豆convicilin(Bown等, 1988,Biochem J251:717-26),豌豆凝集素(dePater等,1993,Plant Cell 5:877-86),P.vulgarisβ菜豆蛋白(Bustos等,1991,EMBO J10: 1469-79),P.vulgaris DLEC2和PHS[β](Bobb等,1997,Nucleic Acids Res25:641-7)和大豆β-conglycinin,7S贮藏蛋白(Chamberland 等,1992,Plant Mol Biol19:937-49)。
其启动子与早期种子和胚胎发育相关的谷类基因包括水稻谷蛋白 (″GluA-3,″Yoshihara and Takaiwa,1996,Plant Cell Physiol37:107-11; ″GluB-1,″Takaiwa等,1996,Plant Mol Biol30:1207-21;Washida等, 1999,Plant Mol Biol40:1-12;″Gt3,″Leisy等,1990,Plant Mol Biol14: 41-50),水稻醇溶谷蛋白(Zhou & Fan,1993,Transgenic Res2:141-6), 小麦醇溶谷蛋白(Hammond-Kosack等,1993,EMBO J12:545-54),玉 米醇溶蛋白(Z4,Matzke等,1990,Plant Mol Biol14:323-32)和大麦 B-hordein(Entwistle等,1991,Plant Mol Biol17:1217-31)。
其他的其启动子与早期种子和胚胎发育相关的基因,包括油棕 GL07A(7S球蛋白,Morcillo等,2001,Physiol Plant112:233-243),甘 蓝型油菜napin,2S贮藏蛋白和napA基因(Josefsson等,1987,J Biol Chem262:12196-201;Stalberg等,1993,Plant Mol Biol199323: 671-83;Ellerstrom等,1996,Plant Mol Biol32:1019-27),甘蓝型油菜 油质蛋白(Keddie等,1994,Plant Mol Biol24:327-40),拟南芥油质蛋 白(Plant等,1994,Plant Mol Biol25:193-205),拟南芥FAE1(Rossak 等,2001,Plant Mol Biol46:717-25),刀豆conA(Yamamoto等,1995, Plant Mol Biol27:729-41)和长春花异胡豆苷合成酶(Str,Ouwerkerk and Memelink,1999,Mol Gen Genet261:635-43)。在另一个优选的实施方案 中,使用来自在油生物合成期间表达的基因的调节序列(参见,例如, 美国专利5,952,544)。可选择的启动子来自于植物贮藏蛋白基因(Bevan 等,1993,Philos Trans R Soc Lond B Biol Sci342:209-15)。其他可使 用的启动子例如描述于美国专利5,378,619;5,391,725;5,428,147; 5,447,858;5,608,144;5,608,144;5,614,399;5,633,441;5,633,435和 4,633,436。
在另一个方面,有时可能需要抑制宿主细胞中内源HIO的表达。 用于实施本发明该方面的示例性方法包括,但不限于反义抑制(Smith 等,1988,Nature,334:724-726;van der Krol et al.,1988,BioTechniques, 6:958-976);共抑制(Napoli,等,1990,Plant Cell,2:279-289);核酶 (PCT公开WO97/10328);和正义与反义的组合(Waterhouse,等,1998, Proc.Natl.Acad.Sci.USA,95:13959-13964)。抑制宿主细胞中内源序列 的方法,一般使用待抑制序列的至少一部分的转录或转录和翻译。这 种序列可以与内源序列的编码以及非编码区同源。反义抑制可使用完 整的cDNA序列(Sheehy等,1988,Sheehy et al.,1988,Proc.Natl.Acad. Sci.USA,85:8805-8809),部分cDNA序列包括5’编码序列(Cannon等, 1990,Plant Mol.Biol.,15:39-47)或3’非编码序列(Ch′ng等,1989,Proc. Natl.Acad.Sci.USA,86:10006-10010)的片段。共抑制技术可使用完整 的cDNA序列(Napoli等,1990,Plant Cell,2:279-289;van der Krol et al., 1990,Plant Cell,2:291-299)或部分cDNA序列(Smith等,1990,Mol.Gen. Genetics,224:477-481)。
可进行标准的分子和遗传试验,以更进一步分析基因与观察到的 表型之间的关联。示例性技术描述如下。
1.DNA/RNA分析
例如,通过原位杂交,可通过突变体与野生型系的对比确定阶段- 与组织特异性基因表达模式。可进行基因,尤其是侧翼调节区甲基化 状况的分析。其他的适用技术包括过表达,异位表达,在其他植物物 种中的表达和基因敲除(反向遗传学,靶向敲除,病毒诱导的基因沉默 [VIGS,参见Baulcombe D,1999,Arch.Virol.Suppl.15:189-201])。
在优选的应用中,通过微阵列分析的表达分布被用于同时测量许 多不同基因表达中的差异或诱导的改变。用于微阵列分析的技术是本 领域熟知的(Schena M等,Science(1995)270:467-470;Baldwin D等, 1999,Cur.Opin.Plant Biol.2(2):96-103;Dangond F,Physiol Genomics (2000)2:53-58;van Hal NL et al.,J Biotechnol.(2000)78:271-280; Richmond T and Somerville S,Curr.Opin.Plant Biol.20003:108-116)。可 以进行单独标签的株系的表达分布分析。这种分析可鉴定由于感兴趣 基因的过表达而协调调节的其它基因,其可有助于把未知基因置于特 定的途径。
2.基因产物的分析
基因产物分析可包括重组蛋白表达,抗血清产生,免疫定位,催 化或其他的活性的生物化学分析,磷酸化状况分析和通过酵母双杂交 分析进行与其他蛋白之间的相互作用分析。
3.途径分析
途径分析可包括,基于它的错表达表型或通过与相关基因的序列 同源性,把基因或基因产物置于特定的生物化学,新陈代谢或信号途 径中。或者,分析可包括与野生型系和其它突变系的遗传交叉(产生双 突变体),以把基因指定于途径中,或确定在途径中突变对下游“报告” 基因表达的作用。
产生具有改变含油量的表型的突变植物
本发明更进一步提供了鉴定在赋予改变含油量的内源HIO多肽中 具有突变的植物以及产生具有HIO表型的植物,其中该植物被鉴定为 在其HIO核酸序列中具有等位基因,与缺乏该等位基因的植物相比产 生HIO表型。该植物可以产生后代,其中后代遗传了等位基因并具有 HIO表型。例如,本发明提供了鉴定在内源HIO核酸序列中具有能赋 予HIO表型的突变以及产生具有HIO表型,但是未经遗传修饰的这些 植物后代的方法。
在一种称为“TILLING”的方法中(用于在基因组中靶向诱导的局部 病变),例如,使用EMS(甲磺酸乙酯)处理,在感兴趣植物的种子中 诱导突变。培养得到的植物,并且自花受精,后代用于制备DNA样品。 HIO-特异性PCR被用于鉴定突变的植物在HIO核酸序列中是否具有突 变。然后测试具有HIO突变的植物的改变的含油量,或者测试植物改 变的含油量,然后使用PCR扩增以及HIO核酸序列的测序确定具有改 变含油量的植物是否具有突变的HIO核酸序列。TILLING可鉴定能改 变特异性基因的表达或由这些基因编码的蛋白的活性的突变(参见 Colbert等(2001)Plant Physiol126:480-484;McCallum等(2000)Nature Biotechnology18:455-457)。
在另一种方法中,候选基因/数量性状基因座(QTL)方法可用于标 记辅助的育种项目,以鉴定HIO核酸序列或HIO核酸序列的直系同源 物中能赋予改变的含油量的等位基因或突变(参见Bert et al.,Theor Appl Genet.,2003Jun;107(1):181-9;以及Lionneton et al.,Genome,2002 Dec;45(6):1203-15。因此,在本发明更进一步的方面中,HIO核酸被用 于鉴定具有改变的含油量的植物是否在内源HIO核酸序列中具有突 变,或具有引起改变的含油量的特定的等位基因。
虽然参考特定的方法和实施方案已经描述了本发明,应当理解只 要不背离本发明可以进行各种修饰和改变。这里引用的所有出版物都 明确地在这里作为参考引入,用于描述和公开可与本发明一起使用的 组合物和方法的目的。所有引用的专利,专利申请和参考的网站和公 共数据库中的序列信息也引入作为参考。
实施例
实施例1
利用激活标签构建体进行转化产生具有HIO表型的植物
这个实施例描述了产生具有改变油含量的转基因植物。
使用激活标签“ACTTAG”载体,pSKI015产生突变体(GI#6537289; Weigel D等,2000,Plant Physiology,122:1003-1013)。使用标准方法 产生拟南芥转基因植物,基本上如公开的申请PCT WO0183697中所 述。简要地,T0拟南芥(Col-0)植物用携带有pSKI015载体的土壤农杆 菌进行转化,该载体包括来源于土壤农杆菌Ti质粒的T-DNA,除草剂 抗性选择性标记基因和4X CaMV35S增强子元件。根据除草剂抗性, 在T1世代选择转基因植物并收获T2种子。
利用下列用于HIO30.1的方法进行T2种子中脂肪酸含量的定量测 定。来自每个检测的株系15到20粒T2种子的样品。该样品通常含有 以1:1:2的标准比例具有同源插入片段,没有插入片段以及半合子 插入片段的植物。该种子样品在UMT-2超微量天平(Mettler-Toledo Co., Ohio,USA)上称重然后转移到玻璃提取瓶中。从种子提取脂类并在80 ℃,500μ12.5%H2SO4的甲醇溶液中转-酯化3小时,然后进行Browse 等(Biochem J.,235:25-31,1986)的方法。已知量的十七烷酸包括在反 应中作为内标。向每个瓶中加入750μl的水和400μl的己烷,然后剧 烈振荡并使相分离。将反应瓶直接上样到GC上用于分析,并且由自动 取样器取上层己烷相。具有火焰电离检测的气相色谱法用于脂肪酸甲 酯的分离和测定。Agilent6890Plus GC′s用于用Agilent Innowax柱(30m ×0.25mm ID,250um膜厚度)进行分离。载气是以2.5ml/分钟恒定流动 的氢气。以不分流的方式注射1μl的样品(入口温度220℃,清洗气流 15ml/min1分钟)。烘箱设置为105℃的起始温度,起始时间0.5分钟, 然后以每分钟60℃的斜度升至175℃,40℃/分钟升至260℃,最终保 持时间2分钟。通过火焰电离进行检测(温度275℃,燃油流30.0ml/ 分钟,氧化剂400.0ml/min)。利用Millennium色谱管理系统监控仪器 控制和数据收集与分析(版本3.2,Waters Corporation,Milford,MA)。 自动进行整合和定量分析,但是所有的分析随后都进行人工检验以在 得到研究中获得的结果汇总之前证实正确的峰鉴别和可接受的信噪 比。
ACTTAG品系W000086431被鉴定为高油表型并命名为HIO30.1。 具体地,与其它生长的ACTTAG品系并在相同条件下分析(即基准线) 的平均28.7%的平均含油量相比,油构成HIO30.1种子质量的 34.8%(w/w)。一式三份进行同样种子的重新分析。油构成种子质量的 32.1%证实相对于基准线含油量的增加。
为了扩增ACTTAG品系的种子原种,将大约18粒T2种子播种在 土壤中,并且在萌芽后,暴露于选择剂来回收转化的T2植物。收获来 自这些植物的T3种子并汇集。
在收获时通过用于HIO101B的近红外光谱学(NIR)分析T3种子集 合,并通过反向PCR和DNA测序分析T3种子集合的ACTTAG元件 的插入位点。利用Bruker22N/F近红外光谱仪捕获NIR红外光谱。利 用NIR分析的数据和参考厂商说明通过Bruker软件估计总种子油的含 量以及总种子蛋白含量。美国石油化学家学会官方的方法以及推荐作 法(Official and Recommended Practices of American Oil Chemists Society),第五版本,AOCS,Champaign III的AOCS法Am1-92的 一般方法,开发校准预测的油含量。允许进行粗油(醚提取物) (PDXOil3,AOAC法920.39(脂肪(粗产物)或者动物饲料种的醚提 取物(AOAC国际,官方分析方法(AOAC International,Official Methods of Analysis),第17版,AOAC International,Gaithersburg Maryland) 以及粗油ASE(Ren Oil,加速溶剂提取)NIR预测的校准值。将我们 的校准预测的油含量(PDX Oil3,预测己烷提取的油)与29,746个单独 的T3ACTTAG种子集合进行比较。平均NIR预测的油含量为35.9%。 油含量较高的前15%(预测油≥38%)样品考虑进一步分析。由该限 定,3,870T3种子集合具有高油含量。反向PCR用于回收侧接T-DNA 插入片段的基因组DNA,然后使用基础的BLASTN搜索和/或拟南芥 信息源(TAIR)数据库进行序列分析。将大约40%的所分析的株系中 的ACTTAG元件置于基因组上。在分析的同时,478个高油株系(如 上述定义的)成功进行了ACTTAG元件在基因组中的放置。来自 IN022173和IN023577的种子具有高油(107%)并且在彼此的10kb 中具有ACTTAG插入片段。基因Atlg08520(HIO101B)在这些株系 中位于ACTTAG元件的插入位点之间。
实施例2
显示改变的含油量(HIO)表型的植物中T-DNA插入序列的表征
我们进行了基本上如专利申请PCT WO0183697中所示的标准分 子分析,确定W000086431(HIO30.1)中的T-DNA插入位点。简而言 之,从显示改变的含油量表型的植物提取基因组DNA。使用pSKI015 载体的特异性引物进行的PCR,确认了来自W000086431系的植物中 存在35S增强子,Southern印迹分析证实了ACTTAG T-DNA的基因组 整合。
质粒拯救和反相PCR被用于回收T-DNA插入序列侧翼的基因组 DNA,然后使用基础的BLASTN搜索拟南芥基因组DNA TAIR数据库 (可以在公众可以进入的拟南芥信息资源网站获得)进行序列分析。 W000086431系(HIO30)在三个不同的位点具有插入的T-DNA。
为了确定哪一个插入序列引起高种子油表型,检验高种子油表型 以及T-DNA的存在的共分离。将18个T2植物培养成熟并由这些植物 收集的种子确定种子油表型。如实施例1所述通过GC分析确定这些植 物的种子油含量。通过使用对相应的基因组区域以及T-DNA特异性的 引物的PCR,分析T3种子中T-DNA在插入位点的存在或者不存在, 推断T2种子的遗传型。结果显示位点2和3紧密连锁。此外,在位点 2和3包含T-DNA插入序列的T3种子的平均含油量比在这些位点缺乏 该插入序列的那些家族的平均含油量更高。位点2和3的T2个体纯合 子产生对照115.4%含油量的种子并且这些位点的T2个体半合子产生 对照118.4%含油量的种子,而在这些位点缺乏T-DNA的个体具有来自 野生型Col-0植物的种子对照样品的105%的平均含油量。因为高油位 点的纯合子和半合子显示含油量类似的增加,我们推断位点2和3与 高油表型相关并且表型由显性突变引起。相比之下,在位点1含有 T-DNA插入序列的T3家族的平均含油量低于或者大约等于在相应位 点缺乏插入序列的那些植物的平均含油量。得出结论。位点1不与高 油表型相关。
序列分析揭示命名为HIO30.1的核苷酸的起始密码子在位点3的 T-DNA插入序列的边界下游的5’的约8kb处。
实施例3
拟南芥HIO序列的分析
用BLAST(Altschul等,1990,J.Mol.Biol.215:403-410),PFAM (Bateman等,1999,Nucleic Acids Res27:260-262),PSORT(Nakai K,和 Horton P,1999,Trends Biochem Sci24:34-6),InterPro(Mulder等,2003, Nucleic Acids Res.,31,315-318)和/或CLUSTAL(Thompson JD等, 1994,Nucleic Acids Res22:4673-4680)进行序列分析。
实施例4
高油(HIO)表型的复述
为了检验At3g54400(HIO30.1)的过表达是否引起高种子油表型, 将从过表达该基因的转基因植物的种子中的油含量与来自非-转基因对 照植物种子中的油含量相比较。为了这么做,将At3g54400克隆到种 子特异性PRU启动子后植物转化载体中并利用花浸渍法转化到拟南芥 植物中。该植物转化载体含有nptII基因,提供针对卡那霉素的抗性并 用作选择性标记。将来自转化的植物的种子接种在含有卡那霉素的琼 脂培养基上。7天后,转基因植物被鉴定为健康的绿色植物并移植到土 壤上。非-转基因对照植物在琼脂培养基上萌芽,生长7天然后移植到 土壤上。将22个转基因的幼苗和10个非转基因的对照植物转移到相 同的32格平地的随机位置。植物生长至成熟并自花授精并结子。从每 一植物收获种子,通过如上所述的方法由近红外(NIR)波谱学评估种 子的含油量。
已经在2个实验中检验了At3g54400的过表达对种子油的影响。 在2个实验中,过表达At3g54400的植物具有比生长在相同的平地的 对照植物高的种子油含量。整个实验中,过表达At3g54400的植物的 平均种子油含量比未转化的对照高3%。过表达At3g54400的植物的种 子油含量显著高于非-转基因对照植物(双向方差分析(ANOVA);P= 0.0477)。
表2
实验植物ID转基因预测的平均值相对值平均值1G002735001Pru::HIO30.133.6166103.56981G002735002Pru::HIO30.132.410799.85471G002735003Pru::HIO30.132.5525100.29131G002735004Pru::HIO30.133.0253101.74821G002735005Pru::HIO30.134.7112106.94221G002735008Pru::HIO30.130.356693.52621G002735010Pru::HIO30.133.7207103.89051G002735011Pru::HIO30.133.7407103.95231G002735012Pru::HIO30.135.5092109.40091G002735013Pru::HIO30.132.5828100.38481G002735014Pru::HIO30.130.929195.291G002735015Pru::HIO30.133.2569102.46161G002735016Pru::HIO30.129.970492.33631G002735017Pru::HIO30.128.710988.45581G002735018Pru::HIO30.132.977101.59941G002735019Pru::HIO30.132.9081101.3871
1G002735020Pru::HIO30.132.097598.88951G002735021Pru::HIO30.132.5745100.35921G002735022Pru::HIO30.132.434299.9271G002736001无31.189696.09251G002736002无31.784297.92431G002736003无33.9313104.53941G002736005无32.7659100.94891G002736006无32.6891100.71241G002736007无31.920298.34351G002736009无30.759194.76621G002736010无34.6237106.67282DX06813001Pru::HIO30.126.958199.29332DX06813002Pru::HIO30.131.5024116.03092DX06813003Pru::HIO30.127.7407102.17592DX06813005Pru::HIO30.127.8096102.42962DX06813006Pru::HIO30.127.6955102.00922DX06813007Pru::HIO30.129.4047108.30482DX06813008Pru::HIO30.131.3112115.32682DX06813009Pru::HIO30.128.395104.58582DX06813010Pru::HIO30.127.2328100.3052DX06813011Pru::HIO30.127.8172102.45742DX06813012Pru::HIO30.131.7126116.80532DX06813013Pru::HIO30.127.7825102.32972DX06813016Pru::HIO30.130.1171110.92882DX06813021Pru::HIO30.129.7314109.5082DX06795001无26.464797.47592DX06795002无27.6689101.91132DX06795003无27.9777103.04872DX06795004无28.3052104.2549
2DX06795005无26.859198.92862DX06795006无26.849398.89272DX06795007无24.761691.20322DX06795008无26.989899.40992DX06795009无29.5455108.82322DX06795010无26.07896.0517
为了检验Atlg08520(HIO101B)的过表达是否引起高种子油表型, 将从过表达该基因的转基因植物的种子中的油含量与来自非-转基因对 照植物种子中的油含量相比较。为了这么做,将Atlg08520克隆到种 子特异性PRU启动子后植物转化载体中并利用花浸渍法转化到拟南芥 植物中。该植物转化载体含有nptII基因,提供针对卡那霉素的抗性并 用作选择性标记。将来自转化的植物的种子接种在含有卡那霉素的琼 脂培养基上。7天后,转基因植物被鉴定为健康的绿色植物并移植到土 壤上。非-转基因对照植物在琼脂培养基上萌芽,生长7天然后移植到 土壤上。将22个转基因的幼苗和10个非转基因的对照植物转移到相 同的32格平地的随机位置。植物生长至成熟并自花授精并结子。从每 一植物收获种子,通过如上所述的方法由近红外(NIR)波谱学评估种 子的含油量。
参见表3,已经在3个实验中检验了Atlg08520的过表达对种子 油的影响。在3个实验中,过表达Atlg08520的植物具有比生长在相 同的平地的对照植物高的种子油含量。整个实验中,过表达Atlg08520 的植物的平均种子油含量比未转化的对照高5%。过表达Atlg08520的 植物的种子油含量显著高于非-转基因对照植物(双向方差分析 (ANOVA);P=0.0030)。
表3
实验植物ID转基因预测的油相对油值1Z003907002Pru::HIO101B34.5351109.01181Z003907003Pru::HIO101B35.7637112.88981Z003907004Pru::HIO101B36.1101113.98321Z003907005Pru::HIO101B35.0344110.58771Z003907006Pru::HIO101B33.6465106.20671Z003907008Pru::HIO101B31.57299.65841Z003907009Pru::HIO101B34.8969110.15361Z003907011Pru::HIO101B33.2621104.99331Z003907012Pru::HIO101B33.7056106.39331Z003907013Pru::HIO101B34.043107.45821Z003907017Pru::HIO101B30.575496.51281Z003907019Pru::HIO101B30.573596.50671Z003907021Pru::HIO101B35.6997112.68791Z003910001无32.4184102.33011Z003910002无31.8453100.52121Z003910003无33.7541106.54661Z003910004无32.409102.30061Z003910005无31.269198.70241Z003910006无30.975897.77671Z003910007无30.692696.88271Z003910008无31.7123100.10151Z003910009无30.413596.00181Z003910010无31.311598.83642Z003985002Pru::HIO101B29.267294.45252Z003985003Pru::HIO101B34.2542110.54672Z003985006Pru::HIO101B34.5119111.37852Z003985008Pru::HIO101B33.6445108.579
2Z003985010Pru::HIO101B29.984296.76652Z003985011Pru::HIO101B31.1537100.54082Z003985013Pru::HIO101B36.1835116.77322Z003985018Pru::HIO101B35.0497113.11422Z003985019Pru::HIO101B35.7475115.36612Z004001001无34.5363111.45712Z004001002无31.3602101.2072Z004001003无25.914683.63272Z004001004无28.729292.71632Z004001005无27.883489.98662Z004001006无30.494298.41232Z004001007无31.7341102.41362Z004001008无27.543288.88872Z004001009无35.3457114.06932Z004001010无36.3209117.21643DX06630001Pru::HIO101B29.833597.06893DX06630002Pru::HIO101B29.162894.88663DX06630003Pru::HIO101B29.561896.1853DX06630004Pru::HIO101B34.1125110.99153DX06630005Pru::HIO101B29.909597.31633DX06630009Pru::HIO101B31.2482101.67193DX06630010Pru::HIO101B31.3747102.08343DX06630011Pru::HIO101B29.316295.38583DX06630012Pru::HIO101B33.8001109.9753DX06630013Pru::HIO101B32.1773104.69493DX06630014Pru::HIO101B33.8088110.00323DX06630015Pru::HIO101B30.963100.74393DX06612001无30.373398.82533DX06612002无30.155498.1162
3DX06612003无30.726599.97443DX06612004无31.8674103.68673DX06612005无30.483899.18493DX06612006无29.979597.54383DX06612007无30.9704100.76793DX06612008无31.4789102.42243DX06612009无31.0681101.08583DX06612010无30.240498.3927
实施例5
为了检验过表达HIO30.1的植物中高种子油表型可以遗传,将从 显示高油表型(DX06813012)的转基因株系的后代的种子油含量与来 自非-转基因对照植物种子中的油含量相比较。为了这么做,将来自 DX06813012的T2种子接种在含有卡那霉素的琼脂培养基上来鉴定含 有转基因的植物。7天后,转基因植物被鉴定为健康的绿色植物并移植 到土壤上。非-转基因对照植物在琼脂培养基上萌芽,生长7天然后移 植到土壤上。将22个转基因的幼苗和10个非转基因的对照植物转移 到相同的32格平地的随机位置。植物生长至成熟并自花授精并结子。 从每一植物收获种子,通过如上所述的方法由近红外(NIR)波谱学评 估种子的含油量。
DX06813012后代的种子油含量高于生长在相同的平地的对照植 物的种子油含量,参见表4。DX06813012后代的平均种子油含量比未 转化的对照的种子油含量高4.6%。由T检验确定增加是显著的(P值= 0.0015)。
表4
实验 编号植物ID种子世 代 亲本转基因预测的平均 值 相对值平 均值 1DX08262001T3DX06813012Pru::HIO30.135.32105.461DX08262002T3DX06813012Pru::HIO30.134.89104.181DX08262003T3DX06813012Pru::HIO30.132.8998.221DX08262004T3DX06813012Pru::HIO30.134.31102.471DX08262005T3DX06813012Pru::HIO30.133.8100.931DX08262006T3DX06813012Pru::HIO30.136.18108.041DX08262007T3DX06813012Pru::HIO30.133.2699.321DX08262008T3DX06813012Pru::HIO30.132.1395.941DX08262009T3DX06813012Pru::HIO30.134.82103.981DX08262010T3DX06813012Pru::HIO30.135.42105.771DX08262011T3DX06813012Pru::HIO30.133.97101.441DX08262012T3DX06813012Pru::HIO30.134.34102.561DX08262013T3DX06813012Pru::HIO30.136.79109.851DX08262014T3DX06813012Pru::HIO30.133.4399.831DX08262015T3DX06813012Pru::HIO30.135.89107.181DX08262016T3DX06813012Pru::HIO30.133.79100.91DX08262017T3DX06813012Pru::HIO30.136.4108.691DX08262018T3DX06813012Pru::HIO30.137.13110.881DX08262019T3DX06813012Pru::HIO30.134.5103.011DX08262020T3DX06813012Pru::HIO30.135.8106.921DX08262021T3DX06813012Pru::HIO30.137.71112.621DX08262022T3DX06813012Pru::HIO30.137.92113.231DX08278001T3COL-0无34.14101.941DX08278002T3COL-0无33.98101.471DX08278003T3COL-0无31.9495.391DX08278004T3COL-0无33.86101.11DX08278005T3COL-0无32.4696.931DX08278006T3COL-0无32.9198.271DX08278007T3COL-0无33.53100.141DX08278008T3COL-0无33.69100.621DX08278009T3COL-0无33.2699.321DX08278010T3COL-0无35.1104.82
为了检验过表达HIO101B的植物中高种子油表型可以遗传,将从 显示高油表型(Z003907005,Z003907008,Z003907013和Z003907018) 的4种转基因株系的后代的种子油含量与来自非-转基因对照植物种子 中的油含量相比较。为了这么做,将来自Z003907005,Z003907008, Z003907013和Z003907018的T2种子接种在含有卡那霉素的琼脂培养 基上来鉴定含有转基因的植物。7天后,转基因植物被鉴定为健康的绿 色植物并移植到土壤上。非-转基因对照植物在琼脂培养基上萌芽,生 长7天然后移植到土壤上。将来自每个株系的22个转基因的幼苗和10 个非转基因的对照植物转移到相同的32格平地的随机位置。植物生长 至成熟并自花授精并结子。从每一植物收获种子,通过如上所述的方 法由近红外(NIR)波谱学评估种子的含油量。
这些转基因株系后代的种子油含量高于生长在相同的平地的对照 植物的种子油含量,参见表5。Z003907005,Z003907008,Z003907013 和Z003907018后代的平均种子油含量分别比相同的平地未转化的对照 的种子油含量高6.3,10.1,3.0和3.3%。由T检验确定增加是显著的 (P值分别=0.0015,0.003,0.026和0.013)。
表5
实验 编号植物种子 世代亲本转基因预测的平 均值 相对值平 均值 1DX06905001T3Z003907005Pru::HIO101B34.34114.91DX06905002T3Z003907005Pru::HIO101B34.42115.21DX06905003T3Z003907005Pru::HIO101B32.17107.71DX06905004T3Z003907005Pru::HIO101B32.2107.81DX06905005T3Z003907005Pru::HIO101B34.04113.91DX06905006T3Z003907005Pru::HIO101B31.8106.51DX06905007T3Z003907005Pru::HIO101B32.13107.61DX06905008T3Z003907005Pru::HIO101B33.73112.91DX06905009T3Z003907005Pru::HIO101B31.78106.41DX06905010T3Z003907005Pru::HIO101B33.19111.11DX06905011T3Z003907005Pru::HIO101B29.4398.51DX06905012T3Z003907005Pru::HIO101B33.73112.91DX06905013T3Z003907005Pru::HIO101B30.89103.41DX06905014T3Z003907005Pru::HIO101B25.184.01DX06905015T3Z003907005Pru::HIO101B29.5699.01DX06905016T3Z003907005Pru::HIO101B29.6999.41DX06905017T3Z003907005Pru::HIO101B31.21104.51DX06905018T3Z003907005Pru::HIO101B32.73109.61DX06905019T3Z003907005Pru::HIO101B30.23101.21DX06905020T3Z003907005Pru::HIO101B32.88110.11DX06905021T3Z003907005Pru::HIO101B32.27108.0
1DX06905022T3Z003907005Pru::HIO101B30.9103.41DX06919001T3COL-0无29.0397.21DX06919002T3COL-0无30.87103.31DX06919003T3COL-0无32.64109.31DX06919004T3COL-0无31.55105.61DX06919005T3COL-0无31.18104.41DX06919006T3COL-0无28.4595.21DX06919007T3COL-0无28.9697.01DX06919008T3COL-0无28.6295.81DX06919009T3COL-0无30.38101.71DX06919010T3COL-0无27.0490.52DX07000001T3Z003907008Pru::HIO101B30.72103.62DX07000003T3Z003907008Pru::HIO101B30.12101.62DX07000004T3Z003907008Pru::HIO101B32.09108.32DX07000005T3Z003907008Pru::HIO101B34.17115.32DX07000007T3Z003907008Pru::HIO101B33.99114.62DX07000008T3Z003907008Pru::HIO101B33.14111.82DX07000009T3Z003907008Pru::HIO101B32.91111.02DX07000010T3Z003907008Pru::HIO101B33.94114.52DX07008001T3COL-0无30.17101.82DX07008002T3COL-0无27.7593.62DX07008003T3COL-0无27.4892.72DX07008004T3COL-0无32.74110.42DX07008005T3COL-0无29.5399.62DX07008006T3COL-0无27.4692.62DX07008007T3COL-0无32.13108.42DX07008008T3COL-0无30.97104.52DX07008010T3COL-0无28.5596.33DX06908001T3Z003907013Pru::HIO101B32.84105.03DX06908002T3Z003907013Pru::HIO101B33.59107.43DX06908003T3Z003907013Pru::HIO101B33.03105.73DX06908004T3Z003907013Pru::HIO101B32.38103.63DX06908005T3Z003907013Pru::HIO101B32.79104.93DX06908006T3Z003907013Pru::HIO101B32.36103.53DX06908007T3Z003907013Pru::HIO101B3442110.13DX06908008T3Z003907013Pru::HIO101B34.02108.83DX06908009T3Z003907013Pru::HIO101B31.1999.83DX06908010T3Z003907013Pru::HIO101B29.7595.23DX06908011T3Z003907013Pru::HIO101B32.78104.93DX06908012T3Z003907013Pru::HIO101B32.25103.23DX06908013T3Z003907013Pru::HIO101B32.1102.73DX06908014T3Z003907013Pru::HIO101B31.2399.93DX06908015T3Z003907013Pru::HIO101B32.26103.23DX06908016T3Z003907013Pru::HIO101B32.25103.23DX06908017T3Z003907013Pru::HIO101B32.13102.8
3DX06908018T3Z003907013Pru::HIO101B32.1102.73DX06908019T3Z003907013Pru::HIO101B31.1599.63DX06908020T3Z003907013Pru::HIO101B30.2796.83DX06908021T3Z003907013Pru::HIO101B32.89105.23DX06908022T3Z003907013Pru::HIO101B30.9899.13DX06922001T3COL-0无30.6598.03DX06922002T3COL-0无32.52104.03DX06922004T3COL-0无32.1102.73DX06922005T3COL-0无29.5794.63DX06922006T3COL-0无31.56101.03DX06922007T3COL-0无31.2499.93DX06922008T3COL-0无31.85101.93DX06922009T3COL-0无30.3497.03DX06922010T3COL-0无31.54100.94DX06911001T3Z003985018Pru::HIO101B28.83102.34DX06911003T3Z003985018Pru::HIO101B27.8298.74DX06911004T3Z003985018Pru::HIO101B27.0896.14DX06911005T3Z003985018Pru::HIO101B28.37100.64DX06911006T3Z003985018Pru::HIO101B28.65101.64DX06911007T3Z003985018Pru::HIO101B29.94106.24DX06911008T3Z003985018Pru::HIO101B30.08106.74DX06911009T3Z003985018Pru::HIO101B28.0999.64DX06911010T3Z003985018Pru::HIO101B28.84102.34DX06911011T3Z003985018Pru::HIO101B28.68101.74DX06911012T3Z003985018Pru::HIO101B28.199.74DX06911013T3Z003985018Pru::HIO101B31.92113.24DX06911014T3Z003985018Pru::HIO101B31.01110.04DX06911015T3Z003985018Pru::HIO101B29.71105.44DX06911016T3Z003985018Pru::HIO101B27.7398.44DX06911017T3Z003985018Pru::HIO101B28.75102.04DX06911018T3Z003985018Pru::HIO101B29.01102.94DX06911019T3Z003985018Pru::HIO101B31.19110.64DX06911020T3Z003985018Pru::HIO101B28.7101.84DX06911021T3Z003985018Pru::HIO101B29.4104.34DX06911022T3Z003985018Pru::HIO101B29.96106.34DX06925001T3COL-0无27.2596.74DX06925002T3COL-0无28.38100.74DX06925003T3COL-0无29102.94DX06925004T3COL-0无27.5297.64DX06925005T3COL-0无27.0796.04DX06925006T3COL-0无29.36104.14DX06925007T3COL-0无27.9899.24DX06925008T3COL-0无28.83102.34DX06925009T3COL-0无28.24100.24DX06925010T3COL-0无28.31100.4
本发明公开的内容描述了由于HIO核酸的改变的表达显示改变的 含油量表型的植物&植物细胞的发现,以及用于利用这种发现的相关 方法和组合物。很明显,本发明描述的方法的精确细节可以被改变或 者修饰,只要不背离本发明的精神。我们要求在本发明的说明书以及 权利要求的范围和精神内的这种修饰和改变。
序列表
<110>农业经济有限责任公司(Agrinomics LLC)
<120>生产改变含油量的植物(GENERATION OF PLANTS WITH ALTERED OIL CONTENT)
<130>SCT073199-66
<150>US 60/643,674
<151>2005-01-12
<160>10
<170>PatentIn version 3.3
<210>1
<211>1554
<212>DNA
<213>Arabidopsis thaliana
<400>1
acaaacacta gaaaccacaa agacaaaatc aaggtcttaa acaatgagat cccatctctt 60
gattttgtta atctctctct taatcttgaa atctgaatcc ataaactgca atgaaaagag 120
ccattcctca gatctaagag tgttccacat taacagtcta tgttctccat tcaaaacttc 180
tgtttcatgg gcagatacac ttcttcaaga taaggctcgt ttcctatact tgtcaagcct 240
cgctggcgtt aggaaatcat cagttccaat cgcctctggt cgggccatcg ttcagagccc 300
gacttacatc gtgagggcta acatcgggac accggctcag cccatgctcg tggctcttga 360
cactagcaat gacgctgctt ggattccttg ttctggctgc gttggctgtt cttcctctgt 420
tctctttgac ccttccaagt caagctcctc tcgtactctt caatgcgaag ctcctcagtg 480
taaacaggct ccaaatccaa gttgcacagt aagcaaatca tgtggtttca acatgaccta 540
cggtggttca accatcgaag catatctgac acaagacaca ctaacattgg ccagtgacgt 600
catcccaaac tacacctttg ggtgcatcaa caaagctagt ggaacatcgt tgccagcgca 660
aggactcatg ggcttaggtc gtggtccatt gtctttaatc tcacagtcac aaaatcttta 720
tcagtctaca ttctcgtatt gcttgcctaa tagtaagtcc agcaatttct ccggatcact 780
aagattggga cctaagaacc aaccgatccg gatcaagacc actccattgt taaagaaccc 840
tagaagatca tcgctttact atgttaactt ggttgggatt cgtgtcggaa acaaaattgt 900
ggatattcct acaagtgcac tcgcctttga tccggccacc ggagccggca ccatctttga 960
ctcggggacg gtctacacaa ggctagtcga accagcttac gtggcggtga gaaacgagtt 1020
caggagacgt gttaagaacg caaacgcaac ttcactagga ggtttcgaca catgctactc 1080
cggctccgtc gtgttcccgt cggtgacgtt tatgttcgcc ggaatgaacg tgactctgcc 1140
tccagacaac cttctcatcc acagctccgc aggtaacctc agctgcctcg ccatggctgc 1200
agctccggtc aacgttaact ctgtccttaa cgtcatcgct agtatgcagc aacagaacc 1260
ccgagttctc atcgacgttc caaattccag gctcggaatt tcccgtgaaa cttgcacca 1320
agttttatcg atttgtattt ttgttttcgg tcgatttcgt aatgcgtttt gaactttga 1380
attttggaaa ctatataagt taatgatttt tgttaattct caaacgattg taaaatttt 1440
cgtatgattt tctttcgatg ttctctgttc aaaaaggatt gtactcatga atttgggat 1500
gcaataagcc tggaacagag gacctttatt attttaaata tatatatgtt ccaa 1554
<210>2
<211>425
<212>PRT
<213>Arabidopsis thaliana
<400>2
Met Arg Ser His Leu Leu Ile Leu Leu Ile Ser Leu Leu Ile Leu Lys
1 5 10 15
Ser Glu Ser Ile Asn Cys Asn Glu Lys Ser His Ser Ser Asp Leu Arg
20 25 30
Val Phe His Ile Asn Ser Leu Cys Ser Pro Phe Lys Thr Ser Val Ser
35 40 45
Trp Ala Asp Thr Leu Leu Gln Asp Lys Ala Arg Phe Leu Tyr Leu Ser
50 55 60
Ser Leu Ala Gly Val Arg Lys Ser Ser Val Pro Ile Ala Ser Gly Arg
65 70 75 80
Ala Ile Val Gln Ser Pro Thr Tyr Ile Val Arg Ala Asn Ile Gly Thr
85 90 95
Pro Ala Gln Pro Met Leu Val Ala Leu Asp Thr Ser Asn Asp Ala Ala
100 105 110
Trp Ile Pro Cys Ser Gly Cys Val Gly Cys Ser Ser Ser Val Leu Phe
115 120 125
Asp Pro Ser Lys Ser Ser Ser Ser Arg Thr Leu Gln Cys Glu Ala Pro
130 135 140
Gln Cys Lys Gln Ala Pro Asn Pro Ser Cys Thr Val Ser Lys Ser Cys
145 150 155 160
Gly Phe Asn Met Thr Tyr Gly Gly Ser Thr Ile Glu Ala Tyr Leu Thr
165 170 175
Gln Asp Thr Leu Thr Leu Ala Ser Asp Val Ile Pro Asn Tyr Thr Phe
180 185 190
Gly Cys Ile Asn Lys Ala Ser Gly Thr Ser Leu Pro Ala Gln Gly Leu
195 200 205
Met Gly Leu Gly Arg Gly Pro Leu Ser Leu Ile Ser Gln Ser Gln Asn
210 215 220
Leu Tyr Gln Ser Thr Phe Ser Tyr Cys Leu Pro Asn Ser Lys Ser Ser
225 230 235 240
Asn Phe Ser Gly Ser Leu Arg Leu Gly Pro Lys Asn Gln Pro Ile Arg
245 250 255
Ile Lys Thr Thr Pro Leu Leu Lys Asn Pro Arg Arg Ser Ser Leu Tyr
260 265 270
Tyr Val Asn Leu Val Gly Ile Arg Val Gly Asn Lys Ile Val Asp Ile
275 280 285
Pro Thr Ser Ala Leu Ala Phe Asp Pro Ala Thr Gly Ala Gly Thr Ile
290 295 300
Phe Asp Ser Gly Thr Val Tyr Thr Arg Leu Val Glu Pro Ala Tyr Val
305 310 315 320
Ala Val Arg Asn Glu Phe Arg Arg Arg Val Lys Asn Ala Asn Ala Thr
325 330 335
Ser Leu Gly Gly Phe Asp Thr Cys Tyr Ser Gly Ser Val Val Phe Pro
340 345 350
Ser Val Thr Phe Met Phe Ala Gly Met Asn Val Thr Leu Pro Pro Asp
355 360 365
Asn Leu Leu Ile His Ser Ser Ala Gly Asn Leu Ser Cys Leu Ala Met
370 375 380
Ala Ala Ala Pro Val Asn Val Asn Ser Val Leu Asn Val Ile Ala Ser
385 390 395 400
Met Gln Gln Gln Asn His Arg Val Leu Ile Asp Val Pro Asn Ser Arg
405 410 415
Leu Gly Ile Ser Arg Glu Thr Cys Thr
420 425
<210>3
<211>2548
<212>DNA
<213>Arabidopsis thaliana
<400>3
gcaatcagga aaggatgacg agacaaaaga tagagaagca aaagtaagct gataaggttt 60
gatacagtag aaaatactat ctcttaactt cttcttcttc ttcttcttct tctcctatct 120
ttgaaaatgg cgatgactcc ggtcgcgtca tcatctccag tttcaacctg cagactcttt 180
cgctgcaatc tcctccctga tctcttacct aagcctctgt ttctctccct ccccaaacga 240
aacagaattg cctcgtgccg cttcactgta cgtgcctccg cgaatgctac cgtcgaatcc 300
cctaacggtg tccctgcctc cacatcagat acggatacgg agacggatac cacctcctat 360
ggccgacagt ttttcccttt ggccgcagtt gttggccagg aaggcataaa aactgctctt 420
ttacttggcg cggttgatcg tgaaatcgga gggattgcca tttcaggtcg tagaggcact 480
gcaaaaacag tcatggcgcg agggcttcat gaaatcctcc ctcctattga agttgttgta 540
ggctcaatat caaatgctga cccagcttgt ccagatgagt gggaagatga cttagatgag 600
cgcatagagt acaatgctga caataccatt aagactgaga ttgtcaaatc tcctttcatt 660
cagattccac taggagttac agaagacaga ctcattgggt ctgttgatgt tgaggagtct 720
gtgaaaaggg ggacaactgt tttccaacct ggtcttttgg ctgaagccca tagaggagtg 780
ttgtatgttg atgaaataaa tctcttagat gagggaatta gtaatttgct tctcaatgta 840
ttgacggatg gtgttaatat agttgaaaga gaaggaatca gctttaggca cccgtgcaaa 900
ccacttttaa ttgcaaccta taaccctgaa gaaggtgctg ttcgagagca cttgctagac 960
cgtgttgcca ttaatttaag tgcagaccta cctatgagtt ttgaagatcg tgtcgcagca 1020
gttggaattg ccacacagtt tcaggaacgc tgtaatgagg tttttagaat ggtaaatgaa 1080
gagacagaaa cagcaaagac gcagattata ttggctagag aatatttgaa agatgtcaag 1140
ataagtagag agcaattgaa gtatctggtt ttggaagctg tccgaggtgg tgtccaggga 1200
caccgcgccg aattgtatgc agctcgtgtg gcgaagtgtt tagctgcaat tgaaggacga 1260
gaaaaagtca caatcgatga cctcagaaag gccgttgagc tggtcattct tcctcgttca 1320
tcactagatg agactccacc tgaacaacaa aaccaaccac cacctcctcc acctcctcca 1380
caaaatagcg aatctggaga agaagaaaat gaagaagaac aagaagaaga agaagaggat 1440
gaaagcaatg aagaaaatga aaatgagcag caacaggacc aaatacctga agagtttata 1500
tttgacgctg agggcggtct ggtggatgag aaactcctct tctttgctca acaagcccag 1560
aaacgtcggg ggaaagctgg cagggcgaag aatgtcatat tctcagaaga tagaggacgc 1620
tacataaagc caatgcttcc aaagggtcca gtaaaaagat tagctgtgga tgcaaccctt 1680
agagcagctg caccatacca gaaattgcgc agagagaagg atatctcagg aactaggaaa 1740
gtctttgttg agaagacaga tatgagggcc aaaagaatgg caaggaaagc tggagccctg 1800
gttatctttg tggttgatgc aagtggcagt atggcattga atcgtatgca aaacgccaaa 1860
ggtgctgcac tcaaactact ggcagagagc tatactagca gggatcaggt ttcgattatt 1920
cctttccgag gggatgctgc ggaagtgctc ttgccccctt ctagatcaat agcaatggca 1980
aggaatcgtc ttgagagact tccttgtggt ggtggttctc ctcttgccca tggtttaaca 2040
acggctgtaa gagtaggact taacgcagag aagagtggtg atgtcgggcg cataatgatt 2100
gttgcgataa ccgatggtcg agccaacatt acactgaaaa gatcaactga tccggagtct 2160
attgccccag atgctcctag acccacgtcc aaagaattga aggatgagat tctggaagtt 2220
gctgggaaga tatacaaggc agggatgtct cttctagtga ttgataccga gaacaagttt 2280
gtttcaactg gttttgcaaa ggagatcgca agagttgctc aaggaaaata ttattacttg 2340
ccaaatgctt cggatgctgt aatctcggcc accactaggg atgcactatc tgatctgaag 2400
aattcttgac ctcattttgt ctgcaatacc ttgattctgg atcaaagtgt atattctaat 2460
tgtgcaacac atcagtcact aaacatgaaa ttataagaaa tgaaattttg ttttaacata 2520
ctcttaaaat gaatttccga ttttattc 2548
<210>4
<211>760
<212>PRT
<213>Arabidopsis thaliana
<400>4
Met Ala Met Thr Pro Val Ala Ser Ser Ser Pro Val Ser Thr Cys Arg
1 5 10 15
Leu Phe Arg Cys Asn Leu Leu Pro Asp Leu Leu Pro Lys Pro Leu Phe
20 25 30
Leu Ser Leu Pro Lys Arg Asn Arg Ile Ala Ser Cys Arg Phe Thr Val
35 40 45
Arg Ala Ser Ala Asn Ala Thr Val Glu Ser Pro Asn Gly Val Pro Ala
50 55 60
Ser Thr Ser Asp Thr Asp Thr Glu Thr Asp Thr Thr Ser Tyr Gly Arg
65 70 75 80
Gln Phe Phe Pro Leu Ala Ala Val Val Gly Gln Glu Gly Ile Lys Thr
85 90 95
Ala Leu Leu Leu Gly Ala Val Asp Arg Glu Ile Gly Gly Ile Ala Ile
100 105 110
Ser Gly Arg Arg Gly Thr Ala Lys Thr Val Met Ala Arg Gly Leu His
115 120 125
Glu Ile Leu Pro Pro Ile Glu Val Val Val Gly Ser Ile Ser Asn Ala
130 135 140
Asp Pro Ala Cys Pro Asp Glu Trp Glu Asp Asp Leu Asp Glu Arg Ile
145 150 155 160
Glu Tyr Asn Ala Asp Asn Thr Ile Lys Thr Glu Ile Val Lys Ser Pro
165 170 175
Phe Ile Gln Ile Pro Leu Gly Val Thr Glu Asp Arg Leu Ile Gly Ser
180 185 190
Val Asp Val Glu Glu Ser Val Lys Arg Gly Thr Thr Val Phe Gln Pro
195 200 205
Gly Leu Leu Ala Glu Ala His Arg Gly Val Leu Tyr Val Asp Glu Ile
210 215 220
Asn Leu Leu Asp Glu Gly Ile Ser Asn Leu Leu Leu Asn Val Leu Thr
225 230 235 240
Asp Gly Val Asn Ile Val Glu Arg Glu Gly Ile Ser Phe Arg His Pro
245 250 255
Cys Lys Pro Leu Leu Ile Ala Thr Tyr Asn Pro Glu Glu Gly Ala Val
260 265 270
Arg Glu His Leu Leu Asp Arg Val Ala Ile Asn Leu Ser Ala Asp Leu
275 280 285
Pro Met Ser Phe Glu Asp Arg Val Ala Ala Val Gly Ile Ala Thr Gln
290 295 300
Phe Gln Glu Arg Cys Asn Glu Val Phe Arg Met Val Asn Glu Glu Thr
305 310 315 320
Glu Thr Ala Lys Thr Gln Ile Ile Leu Ala Arg Glu Tyr Leu Lys Asp
325 330 335
Val Lys Ile Ser Arg Glu Gln Leu Lys Tyr Leu Val Leu Glu Ala Val
340 345 350
Arg Gly Gly Val Gln Gly His Arg Ala Glu Leu Tyr Ala Ala Arg Val
355 360 365
Ala Lys Cys Leu Ala Ala Ile Glu Gly Arg Glu Lys Val Thr Ile Asp
370 375 380
Asp Leu Arg Lys Ala Val Glu Leu Val Ile Leu Pro Arg Ser Ser Leu
385 390 395 400
Asp Glu Thr Pro Pro Glu Gln Gln Asn Gln Pro Pro Pro Pro Pro Pro
405 410 415
Pro Pro Gln Asn Ser Glu Ser Gly Glu Glu Glu Asn Glu Glu Glu Gln
420 425 430
Glu Glu Glu Glu Glu Asp Glu Ser Asn Glu Glu Asn Glu Asn Glu Gln
435 440 445
Gln Gln Asp Gln Ile Pro Glu Glu Phe Ile Phe Asp Ala Glu Gly Gly
450 455 460
Leu Val Asp Glu Lys Leu Leu Phe Phe Ala Gln Gln Ala Gln Lys Arg
465 470 475 480
Arg Gly Lys Ala Gly Arg Ala Lys Asn Val Ile Phe Ser Glu Asp Arg
485 490 495
Gly Arg Tyr Ile Lys Pro Met Leu Pro Lys Gly Pro Val Lys Arg Leu
500 505 510
Ala Val Asp Ala Thr Leu Arg Ala Ala Ala Pro Tyr Gln Lys Leu Arg
515 520 525
Arg Glu Lys Asp Ile Ser Gly Thr Arg Lys Val Phe Val Glu Lys Thr
530 535 540
Asp Met Arg Ala Lys Arg Met Ala Arg Lys Ala Gly Ala Leu Val Ile
545 550 555 560
Phe Val Val Asp Ala Ser Gly Ser Met Ala Leu Asn Arg Met Gln Asn
565 570 575
Ala Lys Gly Ala Ala Leu Lys Leu Leu Ala Glu Ser Tyr Thr Ser Arg
580 585 590
Asp Gln Val Ser Ile Ile Pro Phe Arg Gly Asp Ala Ala Glu Val Leu
595 600 605
Leu Pro Pro Ser Arg Ser Ile Ala Met Ala Arg Asn Arg Leu Glu Arg
610 615 620
Leu Pro Cys Gly Gly Gly Ser Pro Leu Ala His Gly Leu Thr Thr Ala
625 630 635 640
Val Arg Val Gly Leu Asn Ala Glu Lys Ser Gly Asp Val Gly Arg Ile
645 650 655
Met Ile Val Ala Ile Thr Asp Gly Arg Ala Asn Ile Thr Leu Lys Arg
660 665 670
Ser Thr Asp Pro Glu Ser Ile Ala Pro Asp Ala Pro Arg Pro Thr Ser
675 680 685
Lys Glu Leu Lys Asp Glu Ile Leu Glu Val Ala Gly Lys Ile Tyr Lys
690 695 700
Ala Gly Met Ser Leu Leu Val Ile Asp Thr Glu Asn Lys Phe Val Ser
705 710 715 720
Thr Gly Phe Ala Lys Glu Ile Ala Arg Val Ala Gln Gly Lys Tyr Tyr
725 730 735
Tyr Leu Pro Asn Ala Ser Asp Ala Val Ile Ser Ala Thr Thr Arg Asp
740 745 750
Ala Leu Ser Asp Leu Lys Asn Ser
755 760
<210>5
<211>1592
<212>DNA
<213>Arabidopsis thaliana
<400>5
ataacccatc caacccaaaa gcatacaata caatgtctac tcttgtttta ttcctccaac 60
ttttttccat cctaccatta gcacttgggt tgaaccaccc aaattgtgac ctgaccaaga 120
ctcaagacca aggctctacc ctaagaatct tccacataga cagcccttgc tcccccttca 180
aatcatcatc cccactctca tgggaagcgc gtgtgctcca gacgctggct caagaccagg 240
cccgtctcca gtacctgagc agcctcgtcg ccgggagatc tgtagtcccc attgcctcag 300
ggcgtcaaat gttgcaaagc actacataca ttgtcaaggc tttgatcggt actccggctc 360
agccgctgct cctagccatg gacacgagca gtgacgtggc ttggattcct tgctccggct 420
gcgttggctg tccttctaac acggcctttt cccctgctaa gtctacatcc ttcaagaacg 480
ttagctgcag cgctcctcag tgtaagcagg taccaaaccc cacgtgtgga gcacgcgcgt 540
gctctttcaa cctcacctat ggaagctcct ccattgcggc taacctctct caagacacga 600
tacgtcttgc cgccgatccg atcaaagcct ttacattcgg atgcgtcaac aaagtcgccg 660
gtggaggaac catcccacca cctcaaggct tgttgggctt gggacgaggc ccactttcac 720
tcatgtcaca ggctcagtct atttacaagt ccactttctc ttactgtttg ccaagtttca 780
ggtctctgac cttctctggt tctctcagac tcggccctac ctcccagccc cagcgcgtga 840
agtacactca acttctcaga aaccctagaa ggtcttctct gtactacgtc aacctcgttg 900
cgatccgcgt tggtcggaaa gtcgtcgatt taccgccggc agctattgct tttaatcctt 960
caaccggcgc tggaaccatc ttcgactccg gaactgtgta cacgcggctg gctaaaccgg 1020
tttacgaggc agtgaggaac gagttcagga agcgcgtgaa gccaaccaca gccgtggtga 1080
cgtcactcgg gggtttcgac acgtgctact cagggcaagt caaggtgccg acgataacat 1140
tcatgttcaa gggagtgaac atgacgatgc cggctgataa cctgatgtta cacagtaccg 1200
ccggaagcac gtcgtgcctc gccatggctg cagcgccgga aaacgtaaac tctgtcgtca 1260
atgtgatcgc aagcatgcag cagcagaacc accgtgtcct catcgacgtc cccaatggac 1320
ggctcggttt ggcacgtgaa cgatgctctt agaaagatga atgagacaat aagagcctac 1380
tcatatttat gcagagactt gtttgtttgt gttatttgtg tgtttcattt ttgtcttgtc 1440
ttgcgtcgtt tgcttcacca gtcttagagg gcggaggtgt gtagcatttg tgctatctag 1500
taatttatgt ttttaattgt tcttcaatta tctagagtgt tggatctaag ctaatcaaat 1560
aatgaaacta tattatattt ccttacggta ta 1592
<210>6
<211>1350
<212>DNA
<213>Oryza sativa
<400>6
atggcgctga gaatgagcat cgcggcgatg tcggtgttgg cggtggcggc ggtgctcgtt 60
gtggccggca cggcggcggc ggcggcggcg tcgtgcccgg cgacgccgcc ggacgcgggg 120
gcgacgctgc aggtgtcgca cgcgttcggg ccgtgctcgc cgctgggggc ggagtcggcg 180
gcgccgtcgt gggcggggtt cctggcggac caggcggcgc gcgacgcgtc gaggctgctg 240
tacctcgact cgctggcggt gaaggggcgc gcgtacgcgc cgatcgcgtc ggggaggcag 300
ctgctgcaga cgccgacgta cgtggtgcgc gcccgcctcg gcacgcccgc gcagcagctg 360
ctcctcgccg tcgacaccag caacgacgcc gcctggatcc cctgctccgg ctgcgcgggc 420
tgccccacct cgtcgccgtt caacccggcc gcctccgcct cctaccgccc ggtgccgtgc 480
ggctcgccgc agtgcgtgct ggcgcccaac ccgtcgtgct cccccaacgc caagtcctgc 540
ggcttcagcc tctcctacgc cgactcctcg ctccaggccg cgctgtcgca ggacaccctc 600
gccgtcgccg gcgacgtcgt gaaggcctac accttcggct gcttgcagag ggccaccggc 660
acggcggcgc cgccgcaggg cctcctcggg ctcggccgtg gcccgctctc cttcctgtct 720
cagaccaagg acatgtacgg ggccacgttc tcctactgcc tcccgagctt caagtcgctc 780
aacttctccg gcacgctccg gctcggccgg aacgggcagc cgcggcggat caagacgacg 840
ccgctgctcg ccaacccgca ccgctcgtcg ctctactacg tcaacatgac cggcatccgc 900
gtggggaaaa aggtggtgtc gatcccggcg tccgcgctgg cgttcgaccc ggcgacgggc 960
gccggcacgg tgctcgactc ggggacgatg ttcacgcgcc tggtggcgcc ggtgtacctg 1020
gcgctccgcg acgaggtccg ccgccgcgtc ggcgccggcg ccgccgccgt gtcctccctc 1080
ggcgggttcg acacgtgcta caacaccacg gtggcgtggc cgccggtgac gctgctgttc 1140
gacggcatgc aggtgacgct gccggaggag aacgtggtga tccacaccac gtacggcacc 1200
accagctgcc tggccatggc ggcggcgccc gacggcgtca acacggtgct caacgtcatc 1260
gccagcatgc agcagcagaa ccaccgcgtc ctcttcgacg tgcccaacgg ccgcgtcggc 1320
ttcgcccgcg agagctgcac cgccgcctag 1350
<210>7
<211>1338
<212>DNA
<213>Oryza sativa
<400>7
atgtcactcc ttgcattacc actcctagcc ttcttgtcca tattcttgac tcctacaacg 60
gcagtgagca gctcaacgct gcagctggca cgttctcact cggtgacgcc caatgccggg 120
gcgccgctca gcgcgtgggc cgcgtccgta gccgcccagt cggcggcgga cacggcgcgc 180
atcgtcagca tgctcacgtc gggggcgggg cctctgacga ccagagccaa gcccaaaccc 240
aagaacaggg caaacccacc cgtgccgatc gcgccggggc gtcagatcct cagcatcccg 300
aactacatcg cccgcgcggg cctcggcacg ccggcgcaga cgctcctcgt ggccatcgac 360
cccagcaacg acgcggcgtg ggtgccatgc agcgcctgcg ccggctgcgc cgcctcgtcg 420
ccgtccttct ccccgacgca gtcgtccacg taccgcaccg tgccctgcgg ctcgccgcag 480
tgcgcgcagg tgcccagccc gtcctgcccc gcgggcgtcg gctcctcctg cgggttcaac 540
ctcacctacg cggcgtccac gttccaggcc gtgctcgggc aggactcgct ggccctcgag 600
aacaacgtcg tcgtgtcgta caccttcggg tgcctccgtg tcgtcagcgg caactccgtg 660
ccgccgcagg ggctcatcgg cttcggccgc gggccgctct ccttcttgtc gcagaccaag 720
gacacgtacg gctccgtgtt ctcctactgc ctcccgaact acaggtcgtc taacttctcc 780
ggcacactaa agctcggccc catcgggcaa cccaagagga tcaagacgac gccgttgctc 840
tacaaccctc atcgcccttc actctactac gtcaacatga tcgggatccg cgtcggcagc 900
aaggtcgtgc aagtcccgca atccgcgctc gcgttcaacc cggtcacggg cagcggcacc 960
atcatcgacg ccgggacaat gttcacgcgg cttgccgccc cggtgtacgc cgccgtgcgc 1020
gacgcgttcc ggggcagggt gcgcacgccg gtggcgccgc cgctgggcgg gttcgacacg 1080
tgctacaacg tgaccgtctc ggtgcctacc gtcacgttca tgttcgccgg ggcggtcgcc 1140
gtgacgctgc cggaggagaa cgtgatgatc cacagctcgt cgggcggcgt cgcgtgcctg 1200
gcgatggccg cggggccctc ggacggcgtg aacgcggcgc tcaatgtgct ggccagcatg 1260
cagcagcaga accaacgcgt gctgttcgac gtcgccaacg gccgcgtcgg cttctcccgt 1320
gagctttgca cggcctga 1338
<210>8
<211>2495
<212>DNA
<213>Nicotiana tabacum
<400>8
catctaaaat cctaaatcaa aaacttcgat gctataaaaa tggggttttg ttcaacttca 60
accctcccac aaacatcact atccaattct caatcttcaa cattcttcac atacttaaaa 120
ccatgcccaa ttctatcctc cacatattta aggccgaaac ggctaaaatt tcgcctcaga 180
ataagtgcca ctgcaactat tgattcacct aatggcgctg ttgcagtagt ggaacctgaa 240
aaacaacctg agaaaatttc ctttggtaga cagtattttc ctctagctgc tgttattgga 300
caggatgcta ttaaaactgc tcttttactt ggggccattg accgtgagat aggaggaatt 360
gcaatatgtg ggaagcgtgg aacagcgaaa acgttaatgg cacgtggatt gcatgctatt 420
ctgccaccaa ttgaagtagt tgttggctca atggcaaatg ctgatccgaa ctgtcccgat 480
gagtgggaag acgggctagc tgacagagca gaatatgggt ctgatggtaa tatcaagacc 540
cagatagtta aatccccatt tgttcagatt ccccttggtg tcacagaaga tagattgatt 600
ggctctgttg atgtcgagga gtccgtgaaa tctggaacca ctgtctttca accaggcctc 660
ctcgcagaag ctcatcgagg agttctatat gttgatgaga ttaatctatt agatgaaggt 720
ataagtaacc tacttctgaa tgtattgact gagggagtca atattgtaga aagagaggga 780
atcagctttc gacatccatg caaaccacta ctaattgcta cctataaccc tgaagagggt 840
gcggttcgtg agcatctgct agaccgtatt gcgattaatt taagtgcaga tcttccaatg 900
agttttgacg atcgtgttgc agctgttgac atagcaacac gttttcagga gtgtagcaat 960
gaggttttta aaatggtgga tgaagaaaca gacagtgcaa aaacccagat aatattggca 1020
agggagtatt taaaggatgt cacaatcagt agagatcaac taaaatactt ggtcatggaa 1080
gcaattcgtg gtggctgcca ggggcaccga gctgaacttt atgctgctcg tgtagccaaa 1140
tgcttagctg ccatcgatgg acgtgaaaaa gttggtgttg atgagctgaa aaaagctgta 1200
gagcttgtca tcctcccacg ttcaactata gttgaaaacc caccagacca gcaaaaccag 1260
cagccacctc ctccccctcc ccctccccaa aatcaagatt cttcagaaga gcagaatgaa 1320
gaagaagaaa aagaagaaga agatcaagag gatgagaaag atagagaaaa tgaacagcaa 1380
cagccacaag tccctgatga gtttattttt gatgcggaag gtggtttagt ggatgaaaaa 1440
cttctcttct ttgcacaaca agcacaaaga cgcaaaggaa aagctggacg agcaaagaag 1500
gtcatctttt ccgaagatag aggtcgatat ataaagccaa tgcttccaaa gggtccagtg 1560
aagagattgg cagttgatgc aactctaaga gcagcggcac catatcagaa gttacgaaga 1620
gcaaaggaca tccaaaaaac tcgcaaggtt tatgtagaga aaactgacat gagagccaaa 1680
agaatggcac gcaaagccgg agctctggtg atattcgtag ttgacgctag tgggagtatg 1740
gcactgaata gaatgcagaa tgccaaagga gcagcactta aactacttgc agagagttat 1800
acaagcagag atcaggtctg tatcattccc ttccgcggag atgctgctga agttttgttg 1860
ccaccttcta ggtcaatatc gatggcaaga aatcgtcttg agagacttcc ctgtggaggg 1920
ggttctcccc ttgctcatgg gcttacgacg gcagttagag ttggaatgaa tgcagaaaag 1980
agtggtgatg ttggacgtat catgattgtt gcaattactg atggtagagc taacatctct 2040
cttaaaagat ccacagaccc tgaagctgaa gcttctgatg cacccagacc ttcttcccaa 2100
gagctgaagg atgagattct cgaggtggct ggtaaaatat acaaaacagg aatgtctctc 2160
ctcgtcatag atacagaaaa taagtttgtt tctactggtt ttgcgaaaga aatcgcgaga 2220
gtagctcaag ggaagtacta ttatttacca aatgcttcag atgctgtgat atctgcagca 2280
acaaaggatg cattatctgc attaaaggaa tcttgaccta aactcgatcg aattaattgt 2340
aaatgttgtt ttgagtatag attattggga ggatataaga gcttgcttga taattcttat 2400
cttttgttgt actaattgaa cttatttctc aattatgcaa tcagggtaat gaagattctt 2460
ttcatttcaa aaaaaaaaaa aaaaaaggaa ttcga 2495
<210>9
<211>2607
<212>DNA
<213>Pisum sativum
<400>9
gtggcaccgt gatcgttggt tctaaattca atcaaatggg tttcagtttg acacacacac 60
ctcacaccac tgcttccccc aatcttcaac tccgatttca ctctcttctt cctccttcat 120
tcacatcaca accgtttctc tctttgcatt ccacatttcc accaaaacgc accgttccaa 180
aacttcgcgc tcaatccgaa aatggagctg ttctgcaagc ttctgaggag aagctcgatg 240
cttccaatta cggaagacag tacttccctc tcgctgctgt tataggccaa gatgctatta 300
aaactgctct tttacttggg gctactgacc ctaggattgg agggattgct atatcaggaa 360
ggcggggaac tgctaaaaca ataatggcgc gtggaatgca tgcaattctt ccgcctattg 420
aagttgtaca aggttccatt gccaatgcag atccctcgtg ccctgaagag tgggaagatg 480
gtctttacaa acgcgtggaa tatgattctg atggaaatgt taaaactcat atcatcaagt 540
ctccttttgt tcagattcct cttggagtca cagaggacag actcattgga tcagttgatg 600
ttgaggagtc tgtgaagaca ggcacaactg ttttccaacc aggcctactc gctgaagctc 660
atagaggtgt tttatatgtt gatgaaatta atcttttgga cgagggtatc agtaatttgc 720
tccttaatgt actgactgaa ggagtaaata ttgttgaaag agagggaatc agctttaggc 780
acccatgcag gccccttctg attgctacct ataaccctga cgaaggttct gttcgtgaac 840
atctgctaga ccgcattgca attaatttga gtgcagatct tccaatgagt tttgaaaacc 900
gtgttgaagc tgttggaatt gcaacagaat ttcaggataa ctgtggccaa gtatttaaaa 960
tggttgatga ggatacagac aatgcaaaga cacagatcat cttggctaga gagtatctca 1020
aggatgttac tattagcaaa gaacaattaa aatacctggt tatcgaggct ttacgaggtg 1080
gtgtccaggg acacagagct gagctgtatg ctgctcgtgt tgctaagtgc ttagctgctc 1140
tggagggacg tgaaaaggtt tatgtggatg accttaaaaa agccgtagaa ttggtcattc 1200
ttccccggtc aatcattacc gatactccac ctgagcaaca aaatcaacct cctccgccac 1260
caccgcctcc acaaaaccaa gaatctaatg aagaacagaa tgaagaggaa gaacaagaag 1320
aagaggaaga ggatgacaat gatgaagaga atgaacaaca gcaagaccaa ttacctgaag 1380
aatttatctt tgatgctgaa gggggtttgg tggatgaaaa acttctcttc tttgcccaac 1440
aagcacagag acgccgtggg aaggctggaa gggcaaaaaa tgtcatattt tcagaggaca 1500
gaggccgata catcaagcca atgcttccaa agggtcctgt aaagagatta gcagttgatg 1560
caacccttag agctgctgca ccttatcaaa agttgcgaag ggaaaaagac accgaaaacc 1620
gtagaaaagt atatgttgaa aaaactgaca tgagggcaaa gagaatggcg cgtaaagcag 1680
gagcattggt catatttgtg gttgatgcta gtggaagcat ggcattgaac agaatgcaga 1740
atgcaaaagg tgcggcactt aagcttctgg cagaaagtta tacaagcagg gatcaggtat 1800
ctataattcc attccgtgga gattctgcag aagttctcct accaccttct agatcaattg 1860
caatggcaag gaaacgtctt gaaagactgc catgtggtgg agggtcgccc cttgcacatg 1920
gtcttaccac agctgttagg gttggattaa atgcagagaa aagtggtgat gttggacgta 1980
taatgattgt tgcaatcact gatggtcgtg ccaacatatc attgaaaagg tcaaatgacc 2040
ctgaagctgc tgccgctagt gatgccccta aacctacatc gcaagaatta aaggatgaaa 2100
ttattgaggt cgctgcgaag atatataaaa caggaatgtc tctccttgtc atcgacactg 2160
aaaacaagtt tgtgtcaact ggtttcgcta aagagattgc tagagttgct caagggaagt 2220
attattattt gccaaatgct tctgacgcag ttgtctcgtt ggcaacaagg gaagctttag 2280
cagctctgaa gagttcatga aactgaatga gaagcaacca atcttgacac ccctcccaat 2340
ttttgttaca taatgttatt gtaaattgcg caactataaa tgtctggtgg gaagaaagca 2400
tactcttata gcaagttcca ttatttccta ttttcgatga gattttgttt ttagtttctg 2460
tgtggattgt tgtaagtata aatttctctt actagtagac tcttcgaagt cagtcactaa 2520
ctgttaggag ggtggactcg gctggacaat taattttcac acaactttat aaataaatta 2580
gaatcttttg taaaagaaaa aaaaaaa 2607
<210>10
<211>2571
<212>DNA
<213>Oryza sativa
<400>10
gaccgcgctc tctccctccc ctcccatggc gatggccacc accgcgctct ccgcctccct 60
cccgcgccta ctcccgcctc gccgccgccg cttcccgacg ccctcctcct cctccccctc 120
cgccgcatcc acctccacct cccgcgtcgt ccgcctgcgg gccgccgcgg cctcggcgcc 180
atccgaggtc ctcgactcca ccaacggggc catcccctcg gggaagggcg gcggcgggca 240
gcagtacggg agggagtatt tccccttggc cgctgtcgtc gggcaggatg caattaaaac 300
tgctctgctg cttggggcaa ttgaccgtga aattggaggc atcgccatct cagggaagcg 360
tgggacagca aagacagtga tggctcgtgg cttgcacgct atgcttccac ctattgaagt 420
ggttgtaggc tcgattgcaa atgctgaccc taactaccca gaagaatggg aggagggttt 480
ggctaaccaa gttcaatatg atgctgatgg taacttgaag accgagatta tcaaaacacc 540
ttttgtgcag atcccgcttg gtatcactga ggataggtta atcggatcag tcgatgttga 600
agcatctgtg aaatcaggaa ctactgtgtt tcaacctggc cttcttgctg aagctcacag 660
aggcgttctt tatgttgatg agataaatct attggatgag ggcgtaagca atctacttct 720
gaatgtcttg actgagggag tcaatattgt ggaaagagag ggcattagct ttcgtcatcc 780
atgcaaacca cttctaattg ctacttacaa cccagaggaa ggatctgtac gtgaacactt 840
acttgatcgt attgcaatta atttaagcgc tgatctgcca atgagttttg atgatcgtgt 900
ggcagctgtg gatattgcaa cacaatttca agagtccagc aaagaggttt ttaaaatggt 960
ggaagaagaa actgaggttg caaaaaccca gataattttg gcaagagaat atctgaaaga 1020
tgttgcaatc agcacagagc agctcaaata tcttgtcatg gaagctatac gcggtggctg 1080
tcaggggcac cgggctgagc tgtatgctgc tcgagtggca aaatgtcttg ctgctatgga 1140
agggcgtgaa aaagtatatg tggatgacct taagaaagct gtagagctag ttattctacc 1200
tcgatcaatc ctatctgata acccacagga gcagcaagac caacaacctc ctccaccccc 1260
accgccaccc cctccacaag atcaagattc tcaagaagat caagatgaag acgaggaaga 1320
ggaccaagag gacgatgatg aagaaaatga acagcaggac cagcagatac ctgaggagtt 1380
catttttgat gctgaaggtg gtatagtaga tgagaagctc cttttctttg ctcagcaagc 1440
tcaaagacgg cgagggaaag ctggacgagc aaagaatctc atattctcat ctgatagggg 1500
acgatacata ggttctatgc ttcccaaggg tccaataagg aggttagctg ttgatgccac 1560
acttcgagca gctgcaccat accagaaact gaggagagag aaagatcgtg acaagacaag 1620
aaaggttttt gttgaaaaaa ctgacatgag agccaaaaga atggctcgaa aagcaggcgc 1680
actggtcata tttgttgtgg atgctagcgg tagcatggct ctgaatcgca tgcagaatgc 1740
gaaaggtgca gcattaaagt tgcttgcaga aagctacaca agcagagatc aggtttcaat 1800
cattccattt cgtggagatt ttgctgaggt tcttcttcca ccttcaagat ccatagcaat 1860
ggcccgcaat cgtcttgaga agttaccatg tggtggcggt tctcctttag ctcacggcct 1920
tagcacagct gtcagagtgg gtttgaatgc tgaaaagagc ggtgatgttg gacgtatcat 1980
gattgttgca atcaccgatg gaagagctaa tgtgtcactg aagaaatcga ctgacccaga 2040
agccacttca gatgctccaa gaccttcttc tcaagaatta aaggatgaga tacttgaggt 2100
ggctggcaaa atatacaagg ctggaatttc acttcttgtt attgataccg agaacaagtt 2160
tgtatccaca ggatttgcca aggaaattgc aagggtcgcc caaggtaaat actattacct 2220
gccgaatgct tcagacgctg ttatttccgc cgccaccaag actgcactct cggacctgaa 2280
gagttcgtga tcctggagag cgttttacct tcagataatg agtggttttt accttttacc 2340
ttgtttggtg cagcagtgtc catgtttcgt gtaactttgg gacgtttcgg ctgtgataac 2400
caattttggc ataggatttt taccgtgaga gttggaattc gggcgtagca ccgtgtaaag 2460
aatcatataa tccctcttct gtctaaataa ttggccatgt aaatatggtg ttattgcgta 2520
cagttctaag taataataac attcataatt tatgtgaaga aagaaattgc c 2571