《产生基因嵌合体的方法.pdf》由会员分享,可在线阅读,更多相关《产生基因嵌合体的方法.pdf(118页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102933710 A (43)申请公布日 2013.02.13 CN 102933710 A *CN102933710A* (21)申请号 201180028352.2 (22)申请日 2011.04.08 10159515.5 2010.04.09 EP 61/322,680 2010.04.09 US C12N 15/10(2006.01) C12N 15/90(2006.01) (71)申请人 艾威艾基克斯有限公司 地址 法国巴黎 (72)发明人 鲁迪潘查伊坦 亚历杭德罗卢克 (74)专利代理机构 北京林达刘知识产权代理事 务所 ( 普通合伙 ) 11277 。
2、代理人 刘新宇 李茂家 (54) 发明名称 产生基因嵌合体的方法 (57) 摘要 本发明涉及通过体细胞体内重组来产生基 因嵌合体的方法, 其包括 : e) 在单个步骤过程中 (vii) 用至少一种基因 A 转化细胞, 所述至少一 种基因 A 与要重组的另外的基因具有小于 99.5% 的序列同源性, 所述要重组的另外的基因为所述 细胞基因组的整合部或存在于遗传构建体的构架 中, (viii) 重组所述基因, (ix) 在靶基因组的整 合位点产生所述基因的基因嵌合体, 其中所述至 少一种基因 A 在 5端或者 3端具有锚定到所 述整合位点的 5或 3端的单个侧翼靶序列, 和 (f) 选择包含所述基。
3、因嵌合体的克隆, 以及产生 基因嵌合体的多样性和基因组装的方法。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.12.07 (86)PCT申请的申请数据 PCT/EP2011/055530 2011.04.08 (87)PCT申请的公布数据 WO2011/124693 EN 2011.10.13 (51)Int.Cl. 权利要求书 2 页 说明书 20 页 序列表 75 页 附图 20 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 20 页 序列表 75 页 附图 20 页 1/2 页 2 1. 一种通过体细胞体内重组来产生基因嵌。
4、合体的方法, 其包括 c) 在单个步骤过程中 (iv) 用至少一种基因 A 转化细胞, 所述至少一种基因 A 与要重组的另外的基因具有小 于 99.5% 的序列同源性, 所述要重组的另外的基因为所述细胞基因组的整合部或存在于遗 传构建体的构架中, (v) 重组所述基因, (vi) 在靶基因组的整合位点产生所述基因的基因嵌合体, 其中所述至少一种基因 A 在 5端或者 3端具有锚定到所述整合位点的 5或 3端的单个侧翼靶序列, 和 d) 选择包含所述基因嵌合体的克隆。 2. 根据权利要求 1 所述的方法, 其中在所述基因嵌合体中使用选择标记物, 并根据所 述选择标记物的存在来选择所述克隆。 3.。
5、根据权利要求1或2所述的方法, 其中所述另外的基因为所述细胞基因组的一部分。 4. 根据权利要求 1 至 3 任一项所述的方法, 其中用至少一种基因 A 和至少一种基因 B 共转化所述细胞, 其中所述基因 A 的所述单个侧翼靶序列锚定到所述靶基因组上的整合位 点的 5端, 和其中基因 B 连接到锚定至整合位点 3端的单个侧翼靶序列。 5. 根据权利要求 1 至 4 任一项所述的方法, 其中用至少两种不同的基因 A1 和 A2 以及 任选的用至少两种不同的基因 B1 和 B2 来共转化所述细胞。 6. 根据权利要求 1 至 5 任一项所述方法, 其中共转化至少一种其它基因 C, 所述至少一 种其。
6、它基因 C 具有与基因 A 和 / 或所述另外的基因的序列杂交的序列以获得所述其它基因 C 到所述基因 A 和 / 或所述另外的基因的组装。 7. 根据权利要求 1 至 6 任一项所述的方法, 其中所述基因 A 和 / 或所述另外的基因编 码具有活性的多肽或多肽的一部分。 8. 根据权利要求 6 或 7 所述的方法, 其中将编码生化途径的多肽的多种基因重组和组 装。 9. 根据权利要求 1 至 8 任一项所述的方法, 其中所述细胞为修复缺陷细胞。 10.根据权利要求1至9任一项所述的方法, 其中所述细胞为真核细胞, 或原核细胞, 所 述真核细胞优选为真菌、 哺乳动物或植物细胞。 11. 根据权。
7、利要求 10 所述的方法, 其中所述细胞为真菌细胞, 所述真菌细胞优选选自 由酵母菌属、 念珠菌属、 克鲁维酵母菌属、 汉逊氏酵母菌属、 裂殖酵母菌属、 耶氏酵母菌属、 毕赤酵母菌属和曲霉菌属组成的组。 12. 根据权利要求 1 至 11 任一项所述的方法, 其中所述侧翼靶序列为至少 5bp。 13. 根据权利要求 1 至 12 任一项的所述的方法, 其中所述侧翼靶序列与所述整合位点 的锚定序列具有 30% 至 99.5% 范围内的同源性。 14.根据权利要求1至13任一项所述的方法, 其中使用选择标记物, 所述选择标记物选 自由营养缺陷型标记物、 抗生素抗性标记物、 荧光标记物、 敲入标记物。
8、、 活化剂 / 结合结构 域标记物和显隐性标记物以及比色标记物组成的组。 15.根据权利要求1至14任一项所述的方法, 其中所述基因包含于线性多核苷酸、 载体 或酵母人工染色体中。 16.根据权利要求1至15任一项所述的方法, 其中所述基因为线性多核苷酸, 所述线性 权 利 要 求 书 CN 102933710 A 2 2/2 页 3 多核苷酸优选 300 至 20,000bp。 17. 根据权利要求 1 至 16 任一项所述的方法, 其中选择具有基因内基因嵌合体的至少 一种克隆。 18. 根据权利要求 1 至 17 任一项所述的方法, 其中选择具有基因组装和至少一种基因 内基因嵌合体的至少一。
9、种克隆。 19.根据权利要求1至18任一项所述的方法, 其中获得至少3至20,000碱基对的基因 嵌合体, 其优选每 700bp 具有至少 3 个交换事件。 20. 根据权利要求 1 至 19 任一项所述的方法, 其中所述基因为非编码序列或者多肽 的编码变体, 所述多肽选自由酶、 抗体或其部分、 细胞因子、 生长因子、 疫苗抗原和肽组成的 组。 21. 一种基因变体的细胞展示方法, 其包括使用根据权利要求 1 至 20 任一项所述的方 法在细胞中创建基因嵌合体的多样性, 和将所述多样性展示到所述细胞的表面上, 从而获 得嵌合体文库。 22.一种基因嵌合体文库, 其可通过权利要求1至20任一项所。
10、述的方法获得, 其中至少 80% 的基因嵌合体包含于功能性 ORF 中。 23. 根据权利要求 22 所述的文库, 其包含含有基因变体的生物体的多样性。 24. 一种生物体, 其包含来自根据权利要求 22 或 23 所述的文库的基因变体。 权 利 要 求 书 CN 102933710 A 3 1/20 页 4 产生基因嵌合体的方法 技术领域 0001 本发明涉及通过部分同源 (homeologous) 体内重组来产生基因嵌合体的方法。 背景技术 0002 蛋白质设计的主要目的之一是产生具有新的或改善的性质的蛋白质。 将所需的活 性赋予到蛋白质或酶的能力在化学和制药工业中具有相当大的实际应用。 。
11、定向蛋白质进化 (directedprotein evolution) 作为蛋白质工程中强有力的技术平台已经出现, 该技术中, 试验性搜索变体文库以寻找具有所需性质的克隆。 0003 定向蛋白质进化利用 (harness) 自然选择的力量来使具有自然界中未曾发现的 所需性质的蛋白质或核酸进化。 已将各种技术用于产生蛋白质突变体和变体以及用于选择 所需的功能。重组 DNA 技术使整个通路的单独一种或多种结构基因转移到适当的替代宿 主, 从而快速增殖和 / 或产生高水平蛋白质。通过反复地突变和筛选通常获得活性或其它 性质累加的改善。 定向进化的应用主要存在于研究所和工业实验室中以改善蛋白质稳定性 。
12、和增强酶和生物体的活性或整体性能, 或改变酶底物特异性以及设计新活性。大多数定向 进化项目寻求进化使得在农业、 医学或工业范围 ( 生物催化 ) 中对人类有用的性质。 0004 由于多数天然和新化合物是通过通路而非通过单个酶来产生的, 所以整个代谢通 路的进化是特别具有吸引力的概念。代谢通路工程通常需要通路中的所有酶协同操作。新 的代谢通路的进化以及生物工艺的增强通常通过重组和筛选或选择的重复循环的工艺以 进化单个基因、 整个质粒、 多基因簇乃至整个基因组来进行。 0005 Shao 等人 (Nucleic Acids Research 37(2):e16 Epub 2008 Dec12) 描。
13、述了通过 在 5和 3端包含酿酒酵母 (Saccharomycescerevisiae) 中的相邻片段的 5或 3端的 序列的两侧(锚定)区域的体内同源重组来以单个步骤组装编码整个生化途径的大型重组 DNA 或基因组。 0006 Elefanty 等人 (Proc.Natl.Acad.Sci.95,11897-11902(1998) 描述了基因打靶实 验以产生突变小鼠, 其中已将 lacZ 报告基因敲入到 SCL 基因座 (locus) 中。参考图 1 显示 SCL-lacZ 基因打靶策略采用了两种锚定序列, 即在各 5和 3端的那些。 0007 可在活细胞内进行定向进化, 也称为体内进化, 。
14、或可以根本不涉及细胞 ( 活体外 进化)。 体内进化具有选择细胞环境中的性质的优点, 当将进化的蛋白质或核酸用于活生物 体中时这是有用的。酵母的体内同源重组已广泛地用于基因克隆、 质粒构建和文库创建。 0008 文库多样性通过诱变或重组来获得。 DNA改组(DNAshuffling)使来自多种基因的 有益突变的定向重组。在 DNA 改组中, DNA 序列的群体被随机片段化然后重新组装为全长 杂种序列。 0009 为了同源重组的目的, 将天然产生的同源基因用作起始多样性的来源。单基因改 组文库成员典型地为超过 95% 的同一性。然而, 家族改组 (familiy-shuffling) 使序列的 。
15、嵌段互换(blockexchange), 其典型地为超过60%的同一性。 功能性序列多样性来自经历自 然选择的相关的亲代序列 ; 因此, 在给定序列中耐受更大数量的突变而不对结构或功能引 说 明 书 CN 102933710 A 4 2/20 页 5 入有害作用。 0010 具有多达 30% 多样性的不同来源的 DNA 片段的重组描述于 WO 1990007576A1 中。 通过在错配修复缺陷细菌中或在错配修复(MMR)系统暂时失活的细菌中的属间和/或种间 重组来在体内产生杂种基因 (hybrid genes)。由此, 避免了修复受损 DNA 的那些过程, 这 些过程对趋异序列(diverge。
16、nt sequence)之间的重组, 即部分同源重组的频率具有抑制作 用。 0011 MMR 基本机理的综述由 Kunz 等人提供 (Cell.Mol.Life Sci.66(2009)1021-1038)。 0012 在 MMR 缺陷植物中描述了靶向部分同源重组 (WO2006/134496A2)。靶向具有多达 10% 差异的序列的基因座是可能的。 0013 同源重组到细菌以产生多核苷酸文库公开于 WO03/095658A1。产生多核苷酸的表 达文库, 在该文库中利用包括与宿主细胞基因组的区域同源的多核苷酸和两侧序列的非复 制线性整合盒 (linear integration cassett。
17、e), 将各多核苷酸通过同源重组整合到感受 态细菌宿主细胞的基因组中。 0014 文库多样性可通过利用单倍体细胞有效地配对导致形成二倍体生物体的能力来 增强。在其无性繁殖 (vegetative) 生命周期中, 酿酒酵母细胞具有单倍体基因组, 即, 每个 染色体以单拷贝存在。 在某些条件下单倍体细胞可以配对。 通过这种方式形成二倍体细胞。 二倍体细胞, 特别是当没有某些营养素时, 可再次形成单倍体细胞。 然后它们进行称为减数 分裂的过程, 随后孢子形成 (sporulation) 以形成四个单倍体孢子。减数分裂期间, 亲代基 因组的不同染色体重组。减数分裂重组期间, DNA 片段互换产生重组的。
18、 DNA 物质。 0015 WO2005/075654A1 公开了用于在酿酒酵母中产生重组 DNA 序列的系统, 该系统基 于酿酒酵母的有性生殖周期。 杂合二倍体细胞在引起减数分裂和孢子形成过程的条件下生 长。通常减数分裂由升高的基因重组频率来表征。因此, 减数分裂的产物 ( 其为单倍体细 胞或孢子 ) 可包含由于两个趋异的 DNA 序列之间的重组所引起的重组 DNA 序列。通过选择 重组的单倍体后代并彼此配对的重复方法, 所得二倍体再次生成孢子, 并且使它们的后代 孢子经受适当的选择条件来鉴定新的重组事件。 该过程描述于野生型或错配修复缺陷的酿 酒酵母细胞中。因此, 将各自在侧面连接有两个选。
19、择标记物的目标基因整合到错配修复缺 陷二倍体株的两个姐妹染色体各自的相同基因座。将与必然整合 DNA 的基因座的侧翼 DNA 序列 100% 相同的 DNA 序列添加到新 DNA 片段的 5或 3端。这些侧翼靶序列的长度约为 400-450 个核苷酸。然后使细胞被迫起始孢子形成。在孢子形成期间发生重组过程。所得 孢子和重组序列可通过选择适当的侧翼标记物来区别。 0016 酵母有效重组同源 DNA 序列的能力还可被用于增加文库的多样性。当共有 89.9% 同源性的两种基因通过 PCR 突变并被转化到野生型酵母时, 通过体内同源重组创建 10e7 的嵌合体文库, 其贯穿两种基因显示若干交换 (cr。
20、oss-over) 点 (Swers 等人 NucleicAcids Research 32(3)e36(2004)。 0017 Nicholson 等 人 描 述 了 有 丝 分 裂 部 分 同 源 重 组 的 方 法 (Genetics 154:133-146(2000)。研究了短反向重复中包含的特定错配对野生型或 MMR- 缺陷株中的 重组率的影响。 0018 本发明的目的是提供制备和组装多种基因嵌合体的改进方法, 其特别用于重组长 说 明 书 CN 102933710 A 5 3/20 页 6 DNA 片段。结果, 可期望地提供变体的相应文库以选择改善的重组体。 0019 通过提供本申。
21、请的实施方案来实现所述目的。 发明内容 0020 本发明提供通过体细胞的体内重组来产生基因嵌合体的新方法, 其包括 0021 a) 在单个步骤过程中 0022 (i)用至少一种基因A转化细胞, 所述至少一种基因A与要重组的另外的基因具有 小于 99.5% 的序列同源性, 所述要重组的另外的基因为所述细胞基因组的整合部或存在于 遗传构建体的构架中, 0023 (ii) 重组所述基因, 0024 (iii) 在靶基因组的整合位点产生所述基因的基因嵌合体, 其中所述至少一种基 因 A 在 5端或者 3端具有锚定到所述整合位点的 5或 3端的单个侧翼靶序列, 和 0025 b) 选择包含所述基因嵌合体。
22、的克隆。 0026 具体地本发明涉及通过体细胞的体内重组产生基因嵌合体的方法, 其包括 0027 a) 在单个步骤过程中 0028 (i) 用至少一种基因 A 转化细胞, 所述至少一种基因 A 与不同的基因 B 具有小于 99.5% 的序列同源性, 所述基因 B 为所述细胞基因组的整合部或存在于遗传构建体的构架 或表达盒中, 0029 (ii) 重组所述基因, 0030 (iii)在靶基因组的整合位点产生基因A和B的基因嵌合体, 其中所述至少一种基 因 A 在锚定到所述整合位点的 5或 3端的遗传构建体的 5端或者 3端连接到单个侧 翼靶序列, 和 0031 b) 选择包含所述基因嵌合体的克隆。
23、。 0032 具体地优选将选择标记物用于基因嵌合体中, 并根据选择标记物的存在来选择克 隆。例如, 基因嵌合体包含选择标记物, 如, 其中所述基因 A 连接到选择标记物。可选地, 也 可通过所得重组体的任何产物的存在, 例如通过测定产量或功能特征来进行选择。 具体地, 可使用一种或多种不同选择标记物来区分基因嵌合体的类型。 0033 具体地, 根据本发明的方法采用所述另外的基因, 所述另外的基因为靶基因组, 例 如细胞基因组的一部分。在优选实施方案中, 所述另外的基因为作为细胞基因组的一部分 的基因 B。 0034 根据可选的优选实施方案, 所述另外的基因为从靶基因组分离的遗传构建体, 例 如。
24、线性多核苷酸, 并在重组过程中被任选地整合到靶基因组中。 0035 根据本发明的具体实施方案, 用至少一种基因 A 和至少一种基因 B 共转化所述细 胞, 其中基因 A 的所述单个侧翼靶序列锚定到所述靶基因组上的整合位点的 5端, 和其中 基因 B 连接到锚定至整合位点 3端的单个侧翼靶序列。 0036 具体地, 细胞可共转化有至少一种具有选择标记物的基因 A 和至少一种基团 B, 其 中基因A的所述单个侧翼靶序列锚定到所述靶基因组上的整合位点的5端, 其中基因B连 接到不同的选择标记物和锚定到整合位点 3端的单个侧翼靶序列, 和其中选择至少两种 选择标记物的克隆。 说 明 书 CN 1029。
25、33710 A 6 4/20 页 7 0037 具体地, 细胞可共转化有至少两种不同的基因 A1 和 A2 以及任选的至少两种不同 的基因 B1 和 B2。 0038 根据具体实施方案, 共转化至少一种其它基因 C, 其具有与基因 A 和 / 或所述另外 的基因的序列杂交的序列以获得所述其它基因 C 到基因 A 和 / 或所述另外的基因的组装 (assembly)。 0039 具体地, 共转化至少一种其它基因 C, 所述至少一种其它基因 C 具有与基因 A 和 / 或 B, 如全长基因 A 或基因 B 的序列或者基因 A 和 / 或基因 B 的部分序列杂交的序列, 以获 得所述其它基因 C 到。
26、基因 A 和 / 或 B 的重组和组装。 0040 具体地, 所述基因C的杂交序列与所述序列具有小于99.5%的序列同源性, 并优选 至少 30% 的序列同源性。 0041 具体地, 选择在基因内具有至少一个核苷酸互换或交换的基因嵌合体, 即, 具有基 因内交换的嵌合体, 例如包含基因 A 的部分并组合所述另外的一种或多种基因的部分的那 些, 将其理解为部分基因的混合物以获得重组的基因内基因嵌合体, 例如以不同方式 ( 如 具有改善的性质或以改善的产量 ) 适于产物表达的基因。该基因内的基因嵌合体可通过重 组和此外优选一系列基因的组装来产生, 其中组装的基因中的一种或多种具有该基因内的 基因嵌。
27、合体。 0042 根据优选实施方案, 可获得至少三种不同基因 A 和 / 或 B 和 / 或 C 的嵌合体。 0043 优选地, 所述基因A和/或所述另外的基因编码具有活性的多肽或多肽的一部分。 0044 具体地, 本发明的方法采用编码部分具有活性的多肽的基因 A、 B 和 / 或 C。因此, 基因例如基因 A 和 / 或 B 和 / 或 C 优选它们本身都不单独编码生物活性多肽, 而只编码其 一部分, 并且仅当基因组装时可引起相应的活性或修饰的活性。 0045 使用本发明的方法, 可以组装和重组编码生化途径的多肽的多种基因。 0046 在另外具体的实施方案中, 本发明的方法提供产生非编码序列。
28、, 例如启动子、 非翻 译区、 核糖体结合位点、 终止子等的基因的重组和最终组装。 0047 根据本发明可使用任何重组感受态真核或原核宿主细胞通过体细胞的体内重组 来产生基因嵌合体。根据本发明优选的实施方案, 细胞为修复缺陷细胞, 例如, 核酸修复缺 陷细胞, 如具有 DNA 修复缺陷的细胞, 或 MMR 缺陷的细胞。 0048 具体地, 细胞为优选真菌、 哺乳动物或植物细胞的真核细胞, 或原核细胞。 0049 优选细胞为曲霉属 (Aspergillus sp.) 或真菌细胞, 优选地, 其可选自由酵 母菌属、 念珠菌属 (Candida)、 克鲁维酵母菌属 (Kluyveromyces)、 。
29、汉逊氏酵母菌属 (Hansenula)、 裂殖酵母菌属 (Schizosaccaromyces)、 耶氏酵母菌属 (Yarrowia)、 毕赤酵母 菌属 (Pichia) 和曲霉菌属组成的组。 0050 优选单倍体株, 例如采用单倍体酵母株。 0051 可选地, 可使用原核生物, 例如大肠杆菌 (E.coli)、 杆菌属 (Bacillus)、 链霉菌 属 (Streptomyces), 或哺乳动物细胞, 诸如 HeLa 细胞或 Jurkat 细胞, 或植物细胞如拟南芥 (Arabidopsis)。 0052 根据具体实施方案, 侧翼靶序列至少为 5bp, 优选至少 10bp, 更优选至少 2。
30、0bp、 50bp、 100bp 直至 5,000bp 长。具体地, 侧翼靶序列连接到所述基因或为所述基因整合的末 端部分。优选所述侧翼靶序列具有 30% 至 99.5% 范围内的与所述整合位点的锚定序列杂交 说 明 书 CN 102933710 A 7 5/20 页 8 的同源性, 优选小于 95%、 小于 90%、 小于 80%。 0053 根据本发明当使用锚定至基因组的靶整合位点的至少两种不同侧翼靶序列时, 优 选它们彼此不重组, 优选它们共有小于 30% 的同源性。 0054 对本发明的方法有用的选择标记物可选自由任何已知的营养缺陷型标记物、 抗生 素抗性标记物、 荧光标记物、 敲入标。
31、记物、 活化剂 / 结合结构域标记物和显隐标记物和比色 标记物 (colorimetric markers) 组成的组。优选的标记物可以是暂时失活的或功能性敲 除的, 并且可以被重新建立以恢复其标记性。 另外优选的标记物为可追踪基因, 其中标记物 为基因序列 A 和 / 或其它基因 ( 例如基因 B) 之一的功能, 而无需单独的具有标记物功能的 序列, 因此基因嵌合体的表达可通过嵌合体本身的检测而直接测定。在这种情况下基因嵌 合体是直接可追踪的。 0055 根据具体实施方案, 所述基因包含于线性多核苷酸、 载体 (vector) 或酵母人工 染色体中。具体地, 要重组的基因 A 和 / 或其它。
32、基因为线性多核苷酸的形式, 优选 300 至 20,000bp。 具体地, 无需构建体或使用质粒或巨型质粒(megaplasmid)。 因此基因可原样使 用, 即, 没有运载体 (carrier)。 0056 用于重组和整合的基因还可包含于任何遗传构建体, 例如用作运载所述基因的载 体中。因此, 所述基因可包含于遗传构建体, 例如, 线性多核苷酸、 载体或酵母人工染色体 中。这些优选包括线性多核苷酸、 质粒、 PCR 构建体、 人工染色体诸如酵母人工染色体、 病毒 载体或转座元件。 0057 根据本发明的具体实施方案, 靶基因组的整合位点位于任何一种基因上, 例如, 在 线性多核苷酸、 质粒或。
33、包括人工染色体在内的染色体中。 0058 根据本发明的方法具体地提供具有基因内基因嵌合体的至少一种克隆的选择。 具 体地, 选择具有基因组装和至少一种基因内的基因嵌合体的至少一种克隆。 0059 使用根据本发明的方法, 可获得至少 3 个, 优选至少 9 个, 直至 20,000 个碱基对 的基因嵌合体, 以及例如, 包括至少一种基因内的嵌合体的基因嵌合体, 该基因嵌合体基于 700 个碱基对、 更优选基于 600bp, 基于 500bp 甚至以下具有优选至少 3 个交换事件, 优选至 少 4、 5 或 10 个交换事件。典型地, 交换事件的程度高使重组基因的多样性大, 其可用于产 生用于选择。
34、适当文库成员的文库。嵌合体或交换事件的程度可理解为该文库的质量参数。 0060 根据本发明的方法修饰的基因可以是对科学或工业目的有用的任何基因。这些 基因可以是例如非编码序列, 如可用于重组表达系统的那些非编码序列, 或者为完整或部 分多肽变体, 包括那些不编码具有生物活性的多肽的部分序列, 所述多肽具体选自由酶、 抗 体或其部分、 细胞因子、 疫苗抗原、 生长因子或肽组成的组。如果编码非编码序列或作为具 有生物活性多肽的部分的氨基酸序列的基因 ( 也称为 “部分基因” ) 被修饰, 则可优选该部 分基因的组装具有功能特征, 例如编码具有生物活性的多肽。优选重组许多不同的基因, 例如大小在 3。
35、bp 至 20,000bp 范围内、 具体地至少 100bp、 优选 300bp 至 20,000、 具体多达 10,000bp的不同的部分基因, 不同基因的数量为至少2, 更具体地至少3、 4、 5、 6、 7、 8、 9或至 少 10, 以产生非编码或编码重组多肽 ( 例如, 具有生物活性的多肽, 其被有利地调节为例如 具有增强的生物活性 ) 的重组基因序列。在此处使用的术语 “生物活性” 具体指酶活性, 例 如将特定底物转化为特定产物的活性。根据本发明所多样化的优选基因编码多链多肽。 0061 根据本发明的特定实施方案, 提供基因变体的细胞展示方法, 其包括使用根据本 说 明 书 CN 。
36、102933710 A 8 6/20 页 9 发明的方法在细胞中创建基因嵌合体的多样性, 和将所述多样性展示到所述细胞的表面 上, 从而获得嵌合体文库。 0062 可通过该优选的展示可获得的文库具体包括在功能性开放阅读框 (ORF) 内的高 百分比的、 优选至少 80% 的基因嵌合体。 0063 根据本发明的文库具体可以是任何适当的形式, 具体地生物文库包括含有基因变 体的各种生物体。根据本发明的生物文库可包含于生物体群体和 / 或具体地由生物体群体 表达, 以创建生物体库 (repertoire), 其中个体生物体包含至少一种文库成员。 0064 根据本发明的具体方面, 进一步提供包含来自该。
37、文库的基因变体的生物体, 例如 选自生物体库的生物体。根据本发明所提供的生物体可用于在适当的表达系统, 例如生产 宿主细胞中表达基因表达产物。 附图说明 0065 图 1 : 非减数分裂体内重组 0066 重组部分同源的基因 A 和 B( 小于 99.5% 的同源性 )。由于标记物序列和侧翼靶 序列不同源, 所以仅在基因 A 和 B 之间发生重组 / 组装。结果, 杂种 / 嵌合体 DNA 包含重组 的基因 A 和 B、 两种标记物以及两个侧翼靶序列。基因嵌合体整合到靶染色体的靶基因座。 已整合整个构建体的克隆在对于两种标记物为选择性的适当培养基上生长。 0067 T5和T3相应于酵母基因组上。
38、的靶序列(小于99.5%的同源性)(大约400bp), 使同源整合定位到染色体位点上。M1 和 M2 为双重选择的侧翼标记物。基因 A 和基因 B 为 具有给定同源度(小于99.5%)的相关的部分同源译本(homeologous version)。 重叠序列 相应于两基因的整个ORF。 通过在MMR缺陷型酵母转化体中的部分同源重组来组装后, 双重 选择使重组体分离。 0068 图 2 : 通过部分同源重组的 DNA 重组和组装 0069 该图示出具体实施方案的示意性介绍, 其中细胞共转化有至少两种基因, 此处为 DNA 片段 A 和 B, 在它们 80bp 的重叠部分上具有小于 99.5% 的。
39、同源性。各 DNA 片段侧面连 接有一种选择标记物。 0070 片段 A 包含相应于染色体上 5端恰当整合位点的侧翼靶序列以及与片段 B 重叠 的杂交区域, 片段 B 包含相应于 3整合位点的侧翼靶序列以及与片段 A 重叠的杂交区域。 用所得片段转化错配缺陷型酵母细胞。将所得转化体铺板到两种标记物的选择性培养基 上。分离可被两种标记物选择的克隆, 通过选择的重组体基因组 DNA 的分子分析来确认基 因 A 和 B 的组装 / 整合的簇的整合性以及 ORF 的重构。 0071 T5和T3相应于酵母基因组上的靶序列(小于99.5%的同源性)(大约400bp), 使同源整合定位到染色体位点上。M1 。
40、和 M2 为双重选择的侧翼标记物。DNA 片段 A 和 B 可 组装到可被追踪的一种基因 ( 例如 GFP), 或者可代表通过该方法所组装的两种基因。所有 基因的重叠序列具有小于 99.5% 的同源性 (120bp), 从而在通过部分同源重组的组装后使 得 ORF 的重构。双重选择使得重组体分离并用作组装的主要验证。 0072 图 3 : 基因 A、 B 和 C 的重组和组装 0073 该图示出其它基因 C 的共转化, 所述其它基因 C 具有与基因 A 和 / 或 B 的侧翼序 列杂交的序列, 从而获得所述基因 C 到基因 A 和 B 的组装。 说 明 书 CN 102933710 A 9 7。
41、/20 页 10 0074 T5和T3相应于酵母基因组上的靶序列(小于99.5%的同源性)(大约400bp), 使同源整合定位到染色体位点上。M1 和 M2 为双重选择的侧翼标记物。基因 A、 基因 B 和基 因 C 为与给定同源度 ( 小于 99.5%) 相关的部分同源译本。重叠序列相应于基因的 5部 分和 3部分。基因 B 连接侧翼片段并且通过序列相似性来重构新的 ORF ABC。在通过在 MMR 缺陷型酵母转化体中的部分同源重组的组装后, 双重选择使重组体分离。 0075 图 4 : Oxa 重组底物 0076 四种基因编码 - 内酰胺酶的变体。它们是在 DNA 水平上具有不同同源度 (。
42、 从 95% 至 49%) 的相关译本。上图示出基因 ORF 的示意性退火, 其含有比对后产生的系统树图 (dendrogramme)。基因大小为约 800bp。ATG 和 TAA 是指起始密码子和终止密码子。下表 示出在 DNA 水平上四种基因之间的序列相似性的百分数。 0077 图 5 : 基因和蛋白质嵌合体 OXA11/OXA7 的序列 (SEQ IDNOs 1-14) 0078 OXA7 来源的核苷酸序列为粗体下划线, 突变核苷酸序列为粗体斜体。 0079 通过双重选择来分离克隆, 并将 DNA 用于扩增和测序。仅使用双链均清晰可读的 序列。将所得色谱图用 Clustal 类程序比对。。
43、 0080 图 6 : 基因和蛋白质嵌合体 OXA11/OXA5 的序列 (SEQ IDNOs 15-38) 0081 OXA5 来源的核苷酸序列为粗体下划线, 突变核苷酸序列为粗体斜体。 0082 通过双重选择来分离克隆, 并将 DNA 用于扩增和测序。仅使用双链均清晰可读的 序列。将所得色谱图用 Clustal 类程序比对。 0083 图 7 : 亲代基因 OXA11、 OXA7 和 OXA5 的序列 (SEQ ID NOs39-41) 0084 图 8 : 包含复合嵌合基因的克隆的序列, 相应于 OXA11/OXA5/OXA7 的部分同源组装 0085 序列克隆和相应蛋白质退火的结果 :。
44、 图 8a)OXA11/OXA5/OXA7 的 OUL 3-05-II(SEQ ID NOs 42 和 43), 图 8b)OXA11/OXA5/OXA7 的 OUL 3-05-III(SEQ ID NOs 44 和 45), 图 8c) OXA11/OXA5/OXA7 的 OUL 3-05-IV(SEQ ID NOs46 和 47), 图 8d)OXA11/OXA5/OXA7 的 OUL 3-05-IX(SEQ ID NOs 48 和 49) 和图 8e)OXA 11/OXA5/OXA7 的 OUL3-05-X(SEQ ID NOs 50 和 51)。 0086 OXA5 的核苷酸序列为粗体。
45、, 相应于 OXA7 的核苷酸序列为下划线。非粗体、 没有下 划线的序列相应于 OXA 11。 0087 图 9 : 乳酸克鲁维酵母 (Kluyveromyces lactis)、 酿酒酵母的 ADH1 基因序列和重 组序列 0088 下划线为乳酸克鲁维酵母来源的核苷酸序列。 0089 图 9a) : (SEQ ID NO s 52)ADH 克鲁维酵母菌属, 图 9b) : (SEQID NOs 53) 酵母菌 属, 图9c) : (SEQ ID NO s 54)克隆A02, 图9d) : (SEQ ID NOs 55)A03, 图9e) : (SEQ ID NOs 56)A05, 图 9f)。
46、 : (SEQID NOs 57)A06, 图 9g) : (SEQ ID NOs 58)A 10, 图 9h) : (SEQ IDNO s 59)A11。 具体实施方式 0090 因此, 本发明涉及部分同源 DNA 序列 ( 即相似但不相同序列 ) 的体内重组的新型 高效方法。下文中术语同源重组 ( 当重组部分同源序列时有时称为部分同源重组 ) 是指具 有一定同源性的序列 ( 可以相同也可以不同 ) 的重组。与依靠位点特异性消化和连接的常 说 明 书 CN 102933710 A 10 8/20 页 11 规克隆方法不同, 同源重组比对互补序列并能够在片段之间互换。通过具有错配碱基的序 列的。
47、杂交, 在细胞中产生重组嵌合基因 ( 也称为杂种基因 )。通过该创造性诱变方法, 可以 以时间有效的方式容易地创建适当选择的多样性和目标多肽的重新设计。 0091 具体地, 通过采用体内重组的功能系统, 本发明首次在单个步骤过程中能够有效 的重组和形成嵌合体, 能够使多样性基因多样化和组装。 0092 术语 “单个步骤过程” 指操纵重组体的若干处理步骤, 诸如用基因转化细胞、 基因 重组、 嵌合基因的产生和将基因整合到靶基因组在技术上是在一个方法步骤中进行的。因 此, 在体内重组之前无需 DNA 运载体的活体外重组, 或处理步骤 ( 包含采用减数分裂的那 些 ) 的任何重复循环。有利地, 可避。
48、免使用减数分裂的酵母细胞。 0093 根据本发明的单个步骤过程可甚至包括同时通过宿主表达该工程重组体。 因此将 不需要另外的操作来获得表达产物。 0094 根据本发明的术语 “基因嵌合体” 指具有至少一个交换事件的至少两种不同基因 的结合体。具体地该交换提供 DNA 序列的组合或混合。基因嵌合体可通过基因、 基因内 (intrangenic) 的基因嵌合体和 / 或基因组装的基因内混合, 任选具有基因内和基因间交 换的基因或基因嵌合体的组装来产生。 0095 术语 “交换” 指在两 DNA 链可互换遗传信息的位点, 即至少一个核苷酸处的基因之 间的重组。交换过程导致后代嵌合基因具有来源于亲代基。
49、因的基因或序列的不同组合。 0096 可选地, 可提供不基于交换的其它修复机制, 例如包括链接合后不正确核苷酸的 识别、 切除和 / 或替换的核苷酸切除修复 (excision repair) 或非同源端连接机制。 0097 术语 “侧翼靶序列” 指与目标靶互补的核苷酸序列的区域, 所述目标靶例如基因组 靶整合位点 ( 包括要重组的基因 A 和 / 或其它基因的位点 )、 线性多核苷酸、 以及线性或环 状质粒 YAC 等。由于互补或同源的特定程度, 侧翼靶序列可与靶整合位点杂交并将基因整 合到靶整合位点。 0098 术语细胞的 “基因组” 指完整的生物体遗传信息, 由基因和 DNA 的非编码序列表 示, 或者染色体或非染色体的遗传元件例如线性多核苷酸 ( 例如, 包括要重组的基因 A 和 / 或其它基因 )、。