书签分享收藏举报版权申诉 / 118

立即下载加入VIP,免费下载

当前位置：首页 > 化学；冶金 > 生物化学；啤酒；烈性酒；果汁酒；醋；微生物学；酶学；突变或遗传工程 > 产生基因嵌合体的方法.pdf

产生基因嵌合体的方法.pdf

上传人：bo****18

文档编号：5257605

上传时间：2018-12-30

格式：PDF

页数：118

大小：125.70MB

《产生基因嵌合体的方法.pdf》由会员分享，可在线阅读，更多相关《产生基因嵌合体的方法.pdf（118页完整版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 102933710 A (43)申请公布日 2013.02.13 CN 102933710 A *CN102933710A* (21)申请号 201180028352.2 (22)申请日 2011.04.08 10159515.5 2010.04.09 EP 61/322,680 2010.04.09 US C12N 15/10(2006.01) C12N 15/90(2006.01) (71)申请人艾威艾基克斯有限公司地址法国巴黎 (72)发明人鲁迪潘查伊坦亚历杭德罗卢克 (74)专利代理机构北京林达刘知识产权代理事务所 ( 普通合伙 ) 11277 。

2、代理人刘新宇李茂家 (54) 发明名称产生基因嵌合体的方法 (57) 摘要本发明涉及通过体细胞体内重组来产生基因嵌合体的方法，其包括： e) 在单个步骤过程中 (vii) 用至少一种基因 A 转化细胞，所述至少一种基因 A 与要重组的另外的基因具有小于 99.5% 的序列同源性，所述要重组的另外的基因为所述细胞基因组的整合部或存在于遗传构建体的构架中， (viii) 重组所述基因， (ix) 在靶基因组的整合位点产生所述基因的基因嵌合体，其中所述至少一种基因 A 在 5端或者 3端具有锚定到所述整合位点的 5或 3端的单个侧翼靶序列，和 (f) 选择包含所述基。

3、因嵌合体的克隆，以及产生基因嵌合体的多样性和基因组装的方法。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.12.07 (86)PCT申请的申请数据 PCT/EP2011/055530 2011.04.08 (87)PCT申请的公布数据 WO2011/124693 EN 2011.10.13 (51)Int.Cl. 权利要求书 2 页说明书 20 页序列表 75 页附图 20 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书 2 页说明书 20 页序列表 75 页附图 20 页 1/2 页 2 1. 一种通过体细胞体内重组来产生基因嵌。

4、合体的方法，其包括 c) 在单个步骤过程中 (iv) 用至少一种基因 A 转化细胞，所述至少一种基因 A 与要重组的另外的基因具有小于 99.5% 的序列同源性，所述要重组的另外的基因为所述细胞基因组的整合部或存在于遗传构建体的构架中， (v) 重组所述基因， (vi) 在靶基因组的整合位点产生所述基因的基因嵌合体，其中所述至少一种基因 A 在 5端或者 3端具有锚定到所述整合位点的 5或 3端的单个侧翼靶序列，和 d) 选择包含所述基因嵌合体的克隆。 2. 根据权利要求 1 所述的方法，其中在所述基因嵌合体中使用选择标记物，并根据所述选择标记物的存在来选择所述克隆。 3.。

5、根据权利要求1或2所述的方法，其中所述另外的基因为所述细胞基因组的一部分。 4. 根据权利要求 1 至 3 任一项所述的方法，其中用至少一种基因 A 和至少一种基因 B 共转化所述细胞，其中所述基因 A 的所述单个侧翼靶序列锚定到所述靶基因组上的整合位点的 5端，和其中基因 B 连接到锚定至整合位点 3端的单个侧翼靶序列。 5. 根据权利要求 1 至 4 任一项所述的方法，其中用至少两种不同的基因 A1 和 A2 以及任选的用至少两种不同的基因 B1 和 B2 来共转化所述细胞。 6. 根据权利要求 1 至 5 任一项所述方法，其中共转化至少一种其它基因 C，所述至少一种其。

6、它基因 C 具有与基因 A 和 / 或所述另外的基因的序列杂交的序列以获得所述其它基因 C 到所述基因 A 和 / 或所述另外的基因的组装。 7. 根据权利要求 1 至 6 任一项所述的方法，其中所述基因 A 和 / 或所述另外的基因编码具有活性的多肽或多肽的一部分。 8. 根据权利要求 6 或 7 所述的方法，其中将编码生化途径的多肽的多种基因重组和组装。 9. 根据权利要求 1 至 8 任一项所述的方法，其中所述细胞为修复缺陷细胞。 10.根据权利要求1至9任一项所述的方法，其中所述细胞为真核细胞，或原核细胞，所述真核细胞优选为真菌、哺乳动物或植物细胞。 11. 根据权。

7、利要求 10 所述的方法，其中所述细胞为真菌细胞，所述真菌细胞优选选自由酵母菌属、念珠菌属、克鲁维酵母菌属、汉逊氏酵母菌属、裂殖酵母菌属、耶氏酵母菌属、毕赤酵母菌属和曲霉菌属组成的组。 12. 根据权利要求 1 至 11 任一项所述的方法，其中所述侧翼靶序列为至少 5bp。 13. 根据权利要求 1 至 12 任一项的所述的方法，其中所述侧翼靶序列与所述整合位点的锚定序列具有 30% 至 99.5% 范围内的同源性。 14.根据权利要求1至13任一项所述的方法，其中使用选择标记物，所述选择标记物选自由营养缺陷型标记物、抗生素抗性标记物、荧光标记物、敲入标记物。

8、、活化剂 / 结合结构域标记物和显隐性标记物以及比色标记物组成的组。 15.根据权利要求1至14任一项所述的方法，其中所述基因包含于线性多核苷酸、载体或酵母人工染色体中。 16.根据权利要求1至15任一项所述的方法，其中所述基因为线性多核苷酸，所述线性权利要求书 CN 102933710 A 2 2/2 页 3 多核苷酸优选 300 至 20,000bp。 17. 根据权利要求 1 至 16 任一项所述的方法，其中选择具有基因内基因嵌合体的至少一种克隆。 18. 根据权利要求 1 至 17 任一项所述的方法，其中选择具有基因组装和至少一种基因内基因嵌合体的至少一。

9、种克隆。 19.根据权利要求1至18任一项所述的方法，其中获得至少3至20,000碱基对的基因嵌合体，其优选每 700bp 具有至少 3 个交换事件。 20. 根据权利要求 1 至 19 任一项所述的方法，其中所述基因为非编码序列或者多肽的编码变体，所述多肽选自由酶、抗体或其部分、细胞因子、生长因子、疫苗抗原和肽组成的组。 21. 一种基因变体的细胞展示方法，其包括使用根据权利要求 1 至 20 任一项所述的方法在细胞中创建基因嵌合体的多样性，和将所述多样性展示到所述细胞的表面上，从而获得嵌合体文库。 22.一种基因嵌合体文库，其可通过权利要求1至20任一项所。

10、述的方法获得，其中至少 80% 的基因嵌合体包含于功能性 ORF 中。 23. 根据权利要求 22 所述的文库，其包含含有基因变体的生物体的多样性。 24. 一种生物体，其包含来自根据权利要求 22 或 23 所述的文库的基因变体。权利要求书 CN 102933710 A 3 1/20 页 4 产生基因嵌合体的方法技术领域 0001 本发明涉及通过部分同源 (homeologous) 体内重组来产生基因嵌合体的方法。背景技术 0002 蛋白质设计的主要目的之一是产生具有新的或改善的性质的蛋白质。将所需的活性赋予到蛋白质或酶的能力在化学和制药工业中具有相当大的实际应用。。

11、定向蛋白质进化 (directedprotein evolution) 作为蛋白质工程中强有力的技术平台已经出现，该技术中，试验性搜索变体文库以寻找具有所需性质的克隆。 0003 定向蛋白质进化利用 (harness) 自然选择的力量来使具有自然界中未曾发现的所需性质的蛋白质或核酸进化。已将各种技术用于产生蛋白质突变体和变体以及用于选择所需的功能。重组 DNA 技术使整个通路的单独一种或多种结构基因转移到适当的替代宿主，从而快速增殖和 / 或产生高水平蛋白质。通过反复地突变和筛选通常获得活性或其它性质累加的改善。定向进化的应用主要存在于研究所和工业实验室中以改善蛋白质稳定性。

12、和增强酶和生物体的活性或整体性能，或改变酶底物特异性以及设计新活性。大多数定向进化项目寻求进化使得在农业、医学或工业范围 ( 生物催化 ) 中对人类有用的性质。 0004 由于多数天然和新化合物是通过通路而非通过单个酶来产生的，所以整个代谢通路的进化是特别具有吸引力的概念。代谢通路工程通常需要通路中的所有酶协同操作。新的代谢通路的进化以及生物工艺的增强通常通过重组和筛选或选择的重复循环的工艺以进化单个基因、整个质粒、多基因簇乃至整个基因组来进行。 0005 Shao 等人 (Nucleic Acids Research 37(2):e16 Epub 2008 Dec12) 描。

13、述了通过在 5和 3端包含酿酒酵母 (Saccharomycescerevisiae) 中的相邻片段的 5或 3端的序列的两侧(锚定)区域的体内同源重组来以单个步骤组装编码整个生化途径的大型重组 DNA 或基因组。 0006 Elefanty 等人 (Proc.Natl.Acad.Sci.95,11897-11902(1998) 描述了基因打靶实验以产生突变小鼠，其中已将 lacZ 报告基因敲入到 SCL 基因座 (locus) 中。参考图 1 显示 SCL-lacZ 基因打靶策略采用了两种锚定序列，即在各 5和 3端的那些。 0007 可在活细胞内进行定向进化，也称为体内进化，。

14、或可以根本不涉及细胞 ( 活体外进化)。体内进化具有选择细胞环境中的性质的优点，当将进化的蛋白质或核酸用于活生物体中时这是有用的。酵母的体内同源重组已广泛地用于基因克隆、质粒构建和文库创建。 0008 文库多样性通过诱变或重组来获得。 DNA改组(DNAshuffling)使来自多种基因的有益突变的定向重组。在 DNA 改组中， DNA 序列的群体被随机片段化然后重新组装为全长杂种序列。 0009 为了同源重组的目的，将天然产生的同源基因用作起始多样性的来源。单基因改组文库成员典型地为超过 95% 的同一性。然而，家族改组 (familiy-shuffling) 使序列的。

15、嵌段互换(blockexchange)，其典型地为超过60%的同一性。功能性序列多样性来自经历自然选择的相关的亲代序列；因此，在给定序列中耐受更大数量的突变而不对结构或功能引说明书 CN 102933710 A 4 2/20 页 5 入有害作用。 0010 具有多达 30% 多样性的不同来源的 DNA 片段的重组描述于 WO 1990007576A1 中。通过在错配修复缺陷细菌中或在错配修复(MMR)系统暂时失活的细菌中的属间和/或种间重组来在体内产生杂种基因 (hybrid genes)。由此，避免了修复受损 DNA 的那些过程，这些过程对趋异序列(diverge。

16、nt sequence)之间的重组，即部分同源重组的频率具有抑制作用。 0011 MMR 基本机理的综述由 Kunz 等人提供 (Cell.Mol.Life Sci.66(2009)1021-1038)。 0012 在 MMR 缺陷植物中描述了靶向部分同源重组 (WO2006/134496A2)。靶向具有多达 10% 差异的序列的基因座是可能的。 0013 同源重组到细菌以产生多核苷酸文库公开于 WO03/095658A1。产生多核苷酸的表达文库，在该文库中利用包括与宿主细胞基因组的区域同源的多核苷酸和两侧序列的非复制线性整合盒 (linear integration cassett。

17、e)，将各多核苷酸通过同源重组整合到感受态细菌宿主细胞的基因组中。 0014 文库多样性可通过利用单倍体细胞有效地配对导致形成二倍体生物体的能力来增强。在其无性繁殖 (vegetative) 生命周期中，酿酒酵母细胞具有单倍体基因组，即，每个染色体以单拷贝存在。在某些条件下单倍体细胞可以配对。通过这种方式形成二倍体细胞。二倍体细胞，特别是当没有某些营养素时，可再次形成单倍体细胞。然后它们进行称为减数分裂的过程，随后孢子形成 (sporulation) 以形成四个单倍体孢子。减数分裂期间，亲代基因组的不同染色体重组。减数分裂重组期间， DNA 片段互换产生重组的。

18、 DNA 物质。 0015 WO2005/075654A1 公开了用于在酿酒酵母中产生重组 DNA 序列的系统，该系统基于酿酒酵母的有性生殖周期。杂合二倍体细胞在引起减数分裂和孢子形成过程的条件下生长。通常减数分裂由升高的基因重组频率来表征。因此，减数分裂的产物 ( 其为单倍体细胞或孢子 ) 可包含由于两个趋异的 DNA 序列之间的重组所引起的重组 DNA 序列。通过选择重组的单倍体后代并彼此配对的重复方法，所得二倍体再次生成孢子，并且使它们的后代孢子经受适当的选择条件来鉴定新的重组事件。该过程描述于野生型或错配修复缺陷的酿酒酵母细胞中。因此，将各自在侧面连接有两个选。

19、择标记物的目标基因整合到错配修复缺陷二倍体株的两个姐妹染色体各自的相同基因座。将与必然整合 DNA 的基因座的侧翼 DNA 序列 100% 相同的 DNA 序列添加到新 DNA 片段的 5或 3端。这些侧翼靶序列的长度约为 400-450 个核苷酸。然后使细胞被迫起始孢子形成。在孢子形成期间发生重组过程。所得孢子和重组序列可通过选择适当的侧翼标记物来区别。 0016 酵母有效重组同源 DNA 序列的能力还可被用于增加文库的多样性。当共有 89.9% 同源性的两种基因通过 PCR 突变并被转化到野生型酵母时，通过体内同源重组创建 10e7 的嵌合体文库，其贯穿两种基因显示若干交换 (cr。

20、oss-over) 点 (Swers 等人 NucleicAcids Research 32(3)e36(2004)。 0017 Nicholson 等人描述了有丝分裂部分同源重组的方法 (Genetics 154:133-146(2000)。研究了短反向重复中包含的特定错配对野生型或 MMR- 缺陷株中的重组率的影响。 0018 本发明的目的是提供制备和组装多种基因嵌合体的改进方法，其特别用于重组长说明书 CN 102933710 A 5 3/20 页 6 DNA 片段。结果，可期望地提供变体的相应文库以选择改善的重组体。 0019 通过提供本申。

21、请的实施方案来实现所述目的。发明内容 0020 本发明提供通过体细胞的体内重组来产生基因嵌合体的新方法，其包括 0021 a) 在单个步骤过程中 0022 (i)用至少一种基因A转化细胞，所述至少一种基因A与要重组的另外的基因具有小于 99.5% 的序列同源性，所述要重组的另外的基因为所述细胞基因组的整合部或存在于遗传构建体的构架中， 0023 (ii) 重组所述基因， 0024 (iii) 在靶基因组的整合位点产生所述基因的基因嵌合体，其中所述至少一种基因 A 在 5端或者 3端具有锚定到所述整合位点的 5或 3端的单个侧翼靶序列，和 0025 b) 选择包含所述基因嵌合体。

22、的克隆。 0026 具体地本发明涉及通过体细胞的体内重组产生基因嵌合体的方法，其包括 0027 a) 在单个步骤过程中 0028 (i) 用至少一种基因 A 转化细胞，所述至少一种基因 A 与不同的基因 B 具有小于 99.5% 的序列同源性，所述基因 B 为所述细胞基因组的整合部或存在于遗传构建体的构架或表达盒中， 0029 (ii) 重组所述基因， 0030 (iii)在靶基因组的整合位点产生基因A和B的基因嵌合体，其中所述至少一种基因 A 在锚定到所述整合位点的 5或 3端的遗传构建体的 5端或者 3端连接到单个侧翼靶序列，和 0031 b) 选择包含所述基因嵌合体的克隆。

23、。 0032 具体地优选将选择标记物用于基因嵌合体中，并根据选择标记物的存在来选择克隆。例如，基因嵌合体包含选择标记物，如，其中所述基因 A 连接到选择标记物。可选地，也可通过所得重组体的任何产物的存在，例如通过测定产量或功能特征来进行选择。具体地，可使用一种或多种不同选择标记物来区分基因嵌合体的类型。 0033 具体地，根据本发明的方法采用所述另外的基因，所述另外的基因为靶基因组，例如细胞基因组的一部分。在优选实施方案中，所述另外的基因为作为细胞基因组的一部分的基因 B。 0034 根据可选的优选实施方案，所述另外的基因为从靶基因组分离的遗传构建体，例如。

24、线性多核苷酸，并在重组过程中被任选地整合到靶基因组中。 0035 根据本发明的具体实施方案，用至少一种基因 A 和至少一种基因 B 共转化所述细胞，其中基因 A 的所述单个侧翼靶序列锚定到所述靶基因组上的整合位点的 5端，和其中基因 B 连接到锚定至整合位点 3端的单个侧翼靶序列。 0036 具体地，细胞可共转化有至少一种具有选择标记物的基因 A 和至少一种基团 B，其中基因A的所述单个侧翼靶序列锚定到所述靶基因组上的整合位点的5端，其中基因B连接到不同的选择标记物和锚定到整合位点 3端的单个侧翼靶序列，和其中选择至少两种选择标记物的克隆。说明书 CN 1029。

25、33710 A 6 4/20 页 7 0037 具体地，细胞可共转化有至少两种不同的基因 A1 和 A2 以及任选的至少两种不同的基因 B1 和 B2。 0038 根据具体实施方案，共转化至少一种其它基因 C，其具有与基因 A 和 / 或所述另外的基因的序列杂交的序列以获得所述其它基因 C 到基因 A 和 / 或所述另外的基因的组装 (assembly)。 0039 具体地，共转化至少一种其它基因 C，所述至少一种其它基因 C 具有与基因 A 和 / 或 B，如全长基因 A 或基因 B 的序列或者基因 A 和 / 或基因 B 的部分序列杂交的序列，以获得所述其它基因 C 到。

26、基因 A 和 / 或 B 的重组和组装。 0040 具体地，所述基因C的杂交序列与所述序列具有小于99.5%的序列同源性，并优选至少 30% 的序列同源性。 0041 具体地，选择在基因内具有至少一个核苷酸互换或交换的基因嵌合体，即，具有基因内交换的嵌合体，例如包含基因 A 的部分并组合所述另外的一种或多种基因的部分的那些，将其理解为部分基因的混合物以获得重组的基因内基因嵌合体，例如以不同方式 ( 如具有改善的性质或以改善的产量 ) 适于产物表达的基因。该基因内的基因嵌合体可通过重组和此外优选一系列基因的组装来产生，其中组装的基因中的一种或多种具有该基因内的基因嵌。

27、合体。 0042 根据优选实施方案，可获得至少三种不同基因 A 和 / 或 B 和 / 或 C 的嵌合体。 0043 优选地，所述基因A和/或所述另外的基因编码具有活性的多肽或多肽的一部分。 0044 具体地，本发明的方法采用编码部分具有活性的多肽的基因 A、 B 和 / 或 C。因此，基因例如基因 A 和 / 或 B 和 / 或 C 优选它们本身都不单独编码生物活性多肽，而只编码其一部分，并且仅当基因组装时可引起相应的活性或修饰的活性。 0045 使用本发明的方法，可以组装和重组编码生化途径的多肽的多种基因。 0046 在另外具体的实施方案中，本发明的方法提供产生非编码序列。

28、，例如启动子、非翻译区、核糖体结合位点、终止子等的基因的重组和最终组装。 0047 根据本发明可使用任何重组感受态真核或原核宿主细胞通过体细胞的体内重组来产生基因嵌合体。根据本发明优选的实施方案，细胞为修复缺陷细胞，例如，核酸修复缺陷细胞，如具有 DNA 修复缺陷的细胞，或 MMR 缺陷的细胞。 0048 具体地，细胞为优选真菌、哺乳动物或植物细胞的真核细胞，或原核细胞。 0049 优选细胞为曲霉属 (Aspergillus sp.) 或真菌细胞，优选地，其可选自由酵母菌属、念珠菌属 (Candida)、克鲁维酵母菌属 (Kluyveromyces)、。

29、汉逊氏酵母菌属 (Hansenula)、裂殖酵母菌属 (Schizosaccaromyces)、耶氏酵母菌属 (Yarrowia)、毕赤酵母菌属 (Pichia) 和曲霉菌属组成的组。 0050 优选单倍体株，例如采用单倍体酵母株。 0051 可选地，可使用原核生物，例如大肠杆菌 (E.coli)、杆菌属 (Bacillus)、链霉菌属 (Streptomyces)，或哺乳动物细胞，诸如 HeLa 细胞或 Jurkat 细胞，或植物细胞如拟南芥 (Arabidopsis)。 0052 根据具体实施方案，侧翼靶序列至少为 5bp，优选至少 10bp，更优选至少 2。

30、0bp、 50bp、 100bp 直至 5,000bp 长。具体地，侧翼靶序列连接到所述基因或为所述基因整合的末端部分。优选所述侧翼靶序列具有 30% 至 99.5% 范围内的与所述整合位点的锚定序列杂交说明书 CN 102933710 A 7 5/20 页 8 的同源性，优选小于 95%、小于 90%、小于 80%。 0053 根据本发明当使用锚定至基因组的靶整合位点的至少两种不同侧翼靶序列时，优选它们彼此不重组，优选它们共有小于 30% 的同源性。 0054 对本发明的方法有用的选择标记物可选自由任何已知的营养缺陷型标记物、抗生素抗性标记物、荧光标记物、敲入标。

31、记物、活化剂 / 结合结构域标记物和显隐标记物和比色标记物 (colorimetric markers) 组成的组。优选的标记物可以是暂时失活的或功能性敲除的，并且可以被重新建立以恢复其标记性。另外优选的标记物为可追踪基因，其中标记物为基因序列 A 和 / 或其它基因 ( 例如基因 B) 之一的功能，而无需单独的具有标记物功能的序列，因此基因嵌合体的表达可通过嵌合体本身的检测而直接测定。在这种情况下基因嵌合体是直接可追踪的。 0055 根据具体实施方案，所述基因包含于线性多核苷酸、载体 (vector) 或酵母人工染色体中。具体地，要重组的基因 A 和 / 或其它。

32、基因为线性多核苷酸的形式，优选 300 至 20,000bp。具体地，无需构建体或使用质粒或巨型质粒(megaplasmid)。因此基因可原样使用，即，没有运载体 (carrier)。 0056 用于重组和整合的基因还可包含于任何遗传构建体，例如用作运载所述基因的载体中。因此，所述基因可包含于遗传构建体，例如，线性多核苷酸、载体或酵母人工染色体中。这些优选包括线性多核苷酸、质粒、 PCR 构建体、人工染色体诸如酵母人工染色体、病毒载体或转座元件。 0057 根据本发明的具体实施方案，靶基因组的整合位点位于任何一种基因上，例如，在线性多核苷酸、质粒或。

33、包括人工染色体在内的染色体中。 0058 根据本发明的方法具体地提供具有基因内基因嵌合体的至少一种克隆的选择。具体地，选择具有基因组装和至少一种基因内的基因嵌合体的至少一种克隆。 0059 使用根据本发明的方法，可获得至少 3 个，优选至少 9 个，直至 20,000 个碱基对的基因嵌合体，以及例如，包括至少一种基因内的嵌合体的基因嵌合体，该基因嵌合体基于 700 个碱基对、更优选基于 600bp，基于 500bp 甚至以下具有优选至少 3 个交换事件，优选至少 4、 5 或 10 个交换事件。典型地，交换事件的程度高使重组基因的多样性大，其可用于产生用于选择。

34、适当文库成员的文库。嵌合体或交换事件的程度可理解为该文库的质量参数。 0060 根据本发明的方法修饰的基因可以是对科学或工业目的有用的任何基因。这些基因可以是例如非编码序列，如可用于重组表达系统的那些非编码序列，或者为完整或部分多肽变体，包括那些不编码具有生物活性的多肽的部分序列，所述多肽具体选自由酶、抗体或其部分、细胞因子、疫苗抗原、生长因子或肽组成的组。如果编码非编码序列或作为具有生物活性多肽的部分的氨基酸序列的基因 ( 也称为 “部分基因” ) 被修饰，则可优选该部分基因的组装具有功能特征，例如编码具有生物活性的多肽。优选重组许多不同的基因，例如大小在 3。

35、bp 至 20,000bp 范围内、具体地至少 100bp、优选 300bp 至 20,000、具体多达 10,000bp的不同的部分基因，不同基因的数量为至少2，更具体地至少3、 4、 5、 6、 7、 8、 9或至少 10，以产生非编码或编码重组多肽 ( 例如，具有生物活性的多肽，其被有利地调节为例如具有增强的生物活性 ) 的重组基因序列。在此处使用的术语 “生物活性” 具体指酶活性，例如将特定底物转化为特定产物的活性。根据本发明所多样化的优选基因编码多链多肽。 0061 根据本发明的特定实施方案，提供基因变体的细胞展示方法，其包括使用根据本说明书 CN 。

36、102933710 A 8 6/20 页 9 发明的方法在细胞中创建基因嵌合体的多样性，和将所述多样性展示到所述细胞的表面上，从而获得嵌合体文库。 0062 可通过该优选的展示可获得的文库具体包括在功能性开放阅读框 (ORF) 内的高百分比的、优选至少 80% 的基因嵌合体。 0063 根据本发明的文库具体可以是任何适当的形式，具体地生物文库包括含有基因变体的各种生物体。根据本发明的生物文库可包含于生物体群体和 / 或具体地由生物体群体表达，以创建生物体库 (repertoire)，其中个体生物体包含至少一种文库成员。 0064 根据本发明的具体方面，进一步提供包含来自该。

37、文库的基因变体的生物体，例如选自生物体库的生物体。根据本发明所提供的生物体可用于在适当的表达系统，例如生产宿主细胞中表达基因表达产物。附图说明 0065 图 1 ：非减数分裂体内重组 0066 重组部分同源的基因 A 和 B( 小于 99.5% 的同源性 )。由于标记物序列和侧翼靶序列不同源，所以仅在基因 A 和 B 之间发生重组 / 组装。结果，杂种 / 嵌合体 DNA 包含重组的基因 A 和 B、两种标记物以及两个侧翼靶序列。基因嵌合体整合到靶染色体的靶基因座。已整合整个构建体的克隆在对于两种标记物为选择性的适当培养基上生长。 0067 T5和T3相应于酵母基因组上。

38、的靶序列(小于99.5%的同源性)(大约400bp)，使同源整合定位到染色体位点上。M1 和 M2 为双重选择的侧翼标记物。基因 A 和基因 B 为具有给定同源度(小于99.5%)的相关的部分同源译本(homeologous version)。重叠序列相应于两基因的整个ORF。通过在MMR缺陷型酵母转化体中的部分同源重组来组装后，双重选择使重组体分离。 0068 图 2 ：通过部分同源重组的 DNA 重组和组装 0069 该图示出具体实施方案的示意性介绍，其中细胞共转化有至少两种基因，此处为 DNA 片段 A 和 B，在它们 80bp 的重叠部分上具有小于 99.5% 的。

39、同源性。各 DNA 片段侧面连接有一种选择标记物。 0070 片段 A 包含相应于染色体上 5端恰当整合位点的侧翼靶序列以及与片段 B 重叠的杂交区域，片段 B 包含相应于 3整合位点的侧翼靶序列以及与片段 A 重叠的杂交区域。用所得片段转化错配缺陷型酵母细胞。将所得转化体铺板到两种标记物的选择性培养基上。分离可被两种标记物选择的克隆，通过选择的重组体基因组 DNA 的分子分析来确认基因 A 和 B 的组装 / 整合的簇的整合性以及 ORF 的重构。 0071 T5和T3相应于酵母基因组上的靶序列(小于99.5%的同源性)(大约400bp)，使同源整合定位到染色体位点上。M1 。

40、和 M2 为双重选择的侧翼标记物。DNA 片段 A 和 B 可组装到可被追踪的一种基因 ( 例如 GFP)，或者可代表通过该方法所组装的两种基因。所有基因的重叠序列具有小于 99.5% 的同源性 (120bp)，从而在通过部分同源重组的组装后使得 ORF 的重构。双重选择使得重组体分离并用作组装的主要验证。 0072 图 3 ：基因 A、 B 和 C 的重组和组装 0073 该图示出其它基因 C 的共转化，所述其它基因 C 具有与基因 A 和 / 或 B 的侧翼序列杂交的序列，从而获得所述基因 C 到基因 A 和 B 的组装。说明书 CN 102933710 A 9 7。

41、/20 页 10 0074 T5和T3相应于酵母基因组上的靶序列(小于99.5%的同源性)(大约400bp)，使同源整合定位到染色体位点上。M1 和 M2 为双重选择的侧翼标记物。基因 A、基因 B 和基因 C 为与给定同源度 ( 小于 99.5%) 相关的部分同源译本。重叠序列相应于基因的 5部分和 3部分。基因 B 连接侧翼片段并且通过序列相似性来重构新的 ORF ABC。在通过在 MMR 缺陷型酵母转化体中的部分同源重组的组装后，双重选择使重组体分离。 0075 图 4 ： Oxa 重组底物 0076 四种基因编码 - 内酰胺酶的变体。它们是在 DNA 水平上具有不同同源度 (。

42、从 95% 至 49%) 的相关译本。上图示出基因 ORF 的示意性退火，其含有比对后产生的系统树图 (dendrogramme)。基因大小为约 800bp。ATG 和 TAA 是指起始密码子和终止密码子。下表示出在 DNA 水平上四种基因之间的序列相似性的百分数。 0077 图 5 ：基因和蛋白质嵌合体 OXA11/OXA7 的序列 (SEQ IDNOs 1-14) 0078 OXA7 来源的核苷酸序列为粗体下划线，突变核苷酸序列为粗体斜体。 0079 通过双重选择来分离克隆，并将 DNA 用于扩增和测序。仅使用双链均清晰可读的序列。将所得色谱图用 Clustal 类程序比对。。

43、 0080 图 6 ：基因和蛋白质嵌合体 OXA11/OXA5 的序列 (SEQ IDNOs 15-38) 0081 OXA5 来源的核苷酸序列为粗体下划线，突变核苷酸序列为粗体斜体。 0082 通过双重选择来分离克隆，并将 DNA 用于扩增和测序。仅使用双链均清晰可读的序列。将所得色谱图用 Clustal 类程序比对。 0083 图 7 ：亲代基因 OXA11、 OXA7 和 OXA5 的序列 (SEQ ID NOs39-41) 0084 图 8 ：包含复合嵌合基因的克隆的序列，相应于 OXA11/OXA5/OXA7 的部分同源组装 0085 序列克隆和相应蛋白质退火的结果：。

44、图 8a)OXA11/OXA5/OXA7 的 OUL 3-05-II(SEQ ID NOs 42 和 43)，图 8b)OXA11/OXA5/OXA7 的 OUL 3-05-III(SEQ ID NOs 44 和 45)，图 8c) OXA11/OXA5/OXA7 的 OUL 3-05-IV(SEQ ID NOs46 和 47)，图 8d)OXA11/OXA5/OXA7 的 OUL 3-05-IX(SEQ ID NOs 48 和 49) 和图 8e)OXA 11/OXA5/OXA7 的 OUL3-05-X(SEQ ID NOs 50 和 51)。 0086 OXA5 的核苷酸序列为粗体。

45、，相应于 OXA7 的核苷酸序列为下划线。非粗体、没有下划线的序列相应于 OXA 11。 0087 图 9 ：乳酸克鲁维酵母 (Kluyveromyces lactis)、酿酒酵母的 ADH1 基因序列和重组序列 0088 下划线为乳酸克鲁维酵母来源的核苷酸序列。 0089 图 9a) ： (SEQ ID NO s 52)ADH 克鲁维酵母菌属，图 9b) ： (SEQID NOs 53) 酵母菌属，图9c) ： (SEQ ID NO s 54)克隆A02，图9d) ： (SEQ ID NOs 55)A03，图9e) ： (SEQ ID NOs 56)A05，图 9f)。

46、： (SEQID NOs 57)A06，图 9g) ： (SEQ ID NOs 58)A 10，图 9h) ： (SEQ IDNO s 59)A11。具体实施方式 0090 因此，本发明涉及部分同源 DNA 序列 ( 即相似但不相同序列 ) 的体内重组的新型高效方法。下文中术语同源重组 ( 当重组部分同源序列时有时称为部分同源重组 ) 是指具有一定同源性的序列 ( 可以相同也可以不同 ) 的重组。与依靠位点特异性消化和连接的常说明书 CN 102933710 A 10 8/20 页 11 规克隆方法不同，同源重组比对互补序列并能够在片段之间互换。通过具有错配碱基的序列的。

47、杂交，在细胞中产生重组嵌合基因 ( 也称为杂种基因 )。通过该创造性诱变方法，可以以时间有效的方式容易地创建适当选择的多样性和目标多肽的重新设计。 0091 具体地，通过采用体内重组的功能系统，本发明首次在单个步骤过程中能够有效的重组和形成嵌合体，能够使多样性基因多样化和组装。 0092 术语 “单个步骤过程” 指操纵重组体的若干处理步骤，诸如用基因转化细胞、基因重组、嵌合基因的产生和将基因整合到靶基因组在技术上是在一个方法步骤中进行的。因此，在体内重组之前无需 DNA 运载体的活体外重组，或处理步骤 ( 包含采用减数分裂的那些 ) 的任何重复循环。有利地，可避。

48、免使用减数分裂的酵母细胞。 0093 根据本发明的单个步骤过程可甚至包括同时通过宿主表达该工程重组体。因此将不需要另外的操作来获得表达产物。 0094 根据本发明的术语 “基因嵌合体” 指具有至少一个交换事件的至少两种不同基因的结合体。具体地该交换提供 DNA 序列的组合或混合。基因嵌合体可通过基因、基因内 (intrangenic) 的基因嵌合体和 / 或基因组装的基因内混合，任选具有基因内和基因间交换的基因或基因嵌合体的组装来产生。 0095 术语 “交换” 指在两 DNA 链可互换遗传信息的位点，即至少一个核苷酸处的基因之间的重组。交换过程导致后代嵌合基因具有来源于亲代基。

49、因的基因或序列的不同组合。 0096 可选地，可提供不基于交换的其它修复机制，例如包括链接合后不正确核苷酸的识别、切除和 / 或替换的核苷酸切除修复 (excision repair) 或非同源端连接机制。 0097 术语 “侧翼靶序列” 指与目标靶互补的核苷酸序列的区域，所述目标靶例如基因组靶整合位点 ( 包括要重组的基因 A 和 / 或其它基因的位点 )、线性多核苷酸、以及线性或环状质粒 YAC 等。由于互补或同源的特定程度，侧翼靶序列可与靶整合位点杂交并将基因整合到靶整合位点。 0098 术语细胞的 “基因组” 指完整的生物体遗传信息，由基因和 DNA 的非编码序列表示，或者染色体或非染色体的遗传元件例如线性多核苷酸 ( 例如，包括要重组的基因 A 和 / 或其它基因 )、。

摘要
申请专利号：	CN201180028352.2	申请日：	2011.04.08
公开号：	CN102933710A	公开日：	2013.02.13
当前法律状态：	终止	有效性：	无权
法律详情：	专利权的视为放弃IPC(主分类):C12N 15/10放弃生效日:20160824\|\|\|实质审查的生效IPC(主分类):C12N 15/10申请日:20110408\|\|\|公开
IPC分类号：	C12N15/10; C12N15/90	主分类号：	C12N15/10
申请人：	艾威艾基克斯有限公司
发明人：	鲁迪·潘查伊坦; 亚历杭德罗·卢克
地址：	法国巴黎
优先权：	2010.04.09 EP 10159515.5; 2010.04.09 US 61/322,680
专利代理机构：	北京林达刘知识产权代理事务所(普通合伙) 11277	代理人：	刘新宇;李茂家
PDF完整版下载：	PDF下载

内容摘要

本发明涉及通过体细胞体内重组来产生基因嵌合体的方法，其包括：e)在单个步骤过程中(vii)用至少一种基因A转化细胞，所述至少一种基因A与要重组的另外的基因具有小于99.5%的序列同源性，所述要重组的另外的基因为所述细胞基因组的整合部或存在于遗传构建体的构架中，(viii)重组所述基因，(ix)在靶基因组的整合位点产生所述基因的基因嵌合体，其中所述至少一种基因A在5′端或者3′端具有锚定到所述整合位点的5′或3′端的单个侧翼靶序列，和(f)选择包含所述基因嵌合体的克隆，以及产生基因嵌合体的多样性和基因组装的方法。

权利要求书

权利要求书一种通过体细胞体内重组来产生基因嵌合体的方法，其包括
c)在单个步骤过程中
(iv)用至少一种基因A转化细胞，所述至少一种基因A与要重组的另外的基因具有小于99.5%的序列同源性，所述要重组的另外的基因为所述细胞基因组的整合部或存在于遗传构建体的构架中，
(v)重组所述基因，
(vi)在靶基因组的整合位点产生所述基因的基因嵌合体，其中所述至少一种基因A在5′端或者3′端具有锚定到所述整合位点的5′或3′端的单个侧翼靶序列，和
d)选择包含所述基因嵌合体的克隆。
根据权利要求1所述的方法，其中在所述基因嵌合体中使用选择标记物，并根据所述选择标记物的存在来选择所述克隆。
根据权利要求1或2所述的方法，其中所述另外的基因为所述细胞基因组的一部分。
根据权利要求1至3任一项所述的方法，其中用至少一种基因A和至少一种基因B共转化所述细胞，其中所述基因A的所述单个侧翼靶序列锚定到所述靶基因组上的整合位点的5′端，和其中基因B连接到锚定至整合位点3′端的单个侧翼靶序列。
根据权利要求1至4任一项所述的方法，其中用至少两种不同的基因A1和A2以及任选的用至少两种不同的基因B1和B2来共转化所述细胞。
根据权利要求1至5任一项所述方法，其中共转化至少一种其它基因C，所述至少一种其它基因C具有与基因A和/或所述另外的基因的序列杂交的序列以获得所述其它基因C到所述基因A和/或所述另外的基因的组装。
根据权利要求1至6任一项所述的方法，其中所述基因A和/或所述另外的基因编码具有活性的多肽或多肽的一部分。
根据权利要求6或7所述的方法，其中将编码生化途径的多肽的多种基因重组和组装。
根据权利要求1至8任一项所述的方法，其中所述细胞为修复缺陷细胞。
根据权利要求1至9任一项所述的方法，其中所述细胞为真核细胞，或原核细胞，所述真核细胞优选为真菌、哺乳动物或植物细胞。
根据权利要求10所述的方法，其中所述细胞为真菌细胞，所述真菌细胞优选选自由酵母菌属、念珠菌属、克鲁维酵母菌属、汉逊氏酵母菌属、裂殖酵母菌属、耶氏酵母菌属、毕赤酵母菌属和曲霉菌属组成的组。
根据权利要求1至11任一项所述的方法，其中所述侧翼靶序列为至少5bp。
根据权利要求1至12任一项的所述的方法，其中所述侧翼靶序列与所述整合位点的锚定序列具有30%至99.5%范围内的同源性。
根据权利要求1至13任一项所述的方法，其中使用选择标记物，所述选择标记物选自由营养缺陷型标记物、抗生素抗性标记物、荧光标记物、敲入标记物、活化剂/结合结构域标记物和显隐性标记物以及比色标记物组成的组。
根据权利要求1至14任一项所述的方法，其中所述基因包含于线性多核苷酸、载体或酵母人工染色体中。
根据权利要求1至15任一项所述的方法，其中所述基因为线性多核苷酸，所述线性多核苷酸优选300至20,000bp。
根据权利要求1至16任一项所述的方法，其中选择具有基因内基因嵌合体的至少一种克隆。
根据权利要求1至17任一项所述的方法，其中选择具有基因组装和至少一种基因内基因嵌合体的至少一种克隆。
根据权利要求1至18任一项所述的方法，其中获得至少3至20,000碱基对的基因嵌合体，其优选每700bp具有至少3个交换事件。
根据权利要求1至19任一项所述的方法，其中所述基因为非编码序列或者多肽的编码变体，所述多肽选自由酶、抗体或其部分、细胞因子、生长因子、疫苗抗原和肽组成的组。
一种基因变体的细胞展示方法，其包括使用根据权利要求1至20任一项所述的方法在细胞中创建基因嵌合体的多样性，和将所述多样性展示到所述细胞的表面上，从而获得嵌合体文库。
一种基因嵌合体文库，其可通过权利要求1至20任一项所述的方法获得，其中至少80%的基因嵌合体包含于功能性ORF中。
根据权利要求22所述的文库，其包含含有基因变体的生物体的多样性。
一种生物体，其包含来自根据权利要求22或23所述的文库的基因变体。

说明书

说明书产生基因嵌合体的方法
技术领域
本发明涉及通过部分同源(homeologous)体内重组来产生基因嵌合体的方法。
背景技术
蛋白质设计的主要目的之一是产生具有新的或改善的性质的蛋白质。将所需的活性赋予到蛋白质或酶的能力在化学和制药工业中具有相当大的实际应用。定向蛋白质进化(directedprotein evolution)作为蛋白质工程中强有力的技术平台已经出现，该技术中，试验性搜索变体文库以寻找具有所需性质的克隆。
定向蛋白质进化利用(harness)自然选择的力量来使具有自然界中未曾发现的所需性质的蛋白质或核酸进化。已将各种技术用于产生蛋白质突变体和变体以及用于选择所需的功能。重组DNA技术使整个通路的单独一种或多种结构基因转移到适当的替代宿主，从而快速增殖和/或产生高水平蛋白质。通过反复地突变和筛选通常获得活性或其它性质累加的改善。定向进化的应用主要存在于研究所和工业实验室中以改善蛋白质稳定性和增强酶和生物体的活性或整体性能，或改变酶底物特异性以及设计新活性。大多数定向进化项目寻求进化使得在农业、医学或工业范围(生物催化)中对人类有用的性质。
由于多数天然和新化合物是通过通路而非通过单个酶来产生的，所以整个代谢通路的进化是特别具有吸引力的概念。代谢通路工程通常需要通路中的所有酶协同操作。新的代谢通路的进化以及生物工艺的增强通常通过重组和筛选或选择的重复循环的工艺以进化单个基因、整个质粒、多基因簇乃至整个基因组来进行。
Shao等人(Nucleic Acids Research 37(2):e16 Epub 2008 Dec12)描述了通过在5′和3′端包含酿酒酵母(Saccharomycescerevisiae)中的相邻片段的5′或3′端的序列的两侧(锚定)区域的体内同源重组来以单个步骤组装编码整个生化途径的大型重组DNA或基因组。
Elefanty等人(Proc.Natl.Acad.Sci.95,11897‑11902(1998)描述了基因打靶实验以产生突变小鼠，其中已将lacZ报告基因敲入到SCL基因座(locus)中。参考图1显示SCL‑lacZ基因打靶策略采用了两种锚定序列，即在各5′和3′端的那些。
可在活细胞内进行定向进化，也称为体内进化，或可以根本不涉及细胞(活体外进化)。体内进化具有选择细胞环境中的性质的优点，当将进化的蛋白质或核酸用于活生物体中时这是有用的。酵母的体内同源重组已广泛地用于基因克隆、质粒构建和文库创建。
文库多样性通过诱变或重组来获得。DNA改组(DNAshuffling)使来自多种基因的有益突变的定向重组。在DNA改组中，DNA序列的群体被随机片段化然后重新组装为全长杂种序列。
为了同源重组的目的，将天然产生的同源基因用作起始多样性的来源。单基因改组文库成员典型地为超过95%的同一性。然而，家族改组(familiy‑shuffling)使序列的嵌段互换(blockexchange)，其典型地为超过60%的同一性。功能性序列多样性来自经历自然选择的相关的亲代序列；因此，在给定序列中耐受更大数量的突变而不对结构或功能引入有害作用。
具有多达30%多样性的不同来源的DNA片段的重组描述于WO 1990007576A1中。通过在错配修复缺陷细菌中或在错配修复(MMR)系统暂时失活的细菌中的属间和/或种间重组来在体内产生杂种基因(hybrid genes)。由此，避免了修复受损DNA的那些过程，这些过程对趋异序列(divergent sequence)之间的重组，即部分同源重组的频率具有抑制作用。
MMR基本机理的综述由Kunz等人提供(Cell.Mol.Life Sci.66(2009)1021‑1038)。
在MMR缺陷植物中描述了靶向部分同源重组(WO2006/134496A2)。靶向具有多达10%差异的序列的基因座是可能的。
同源重组到细菌以产生多核苷酸文库公开于WO03/095658A1。产生多核苷酸的表达文库，在该文库中利用包括与宿主细胞基因组的区域同源的多核苷酸和两侧序列的非复制线性整合盒(linear integration cassette)，将各多核苷酸通过同源重组整合到感受态细菌宿主细胞的基因组中。
文库多样性可通过利用单倍体细胞有效地配对导致形成二倍体生物体的能力来增强。在其无性繁殖(vegetative)生命周期中，酿酒酵母细胞具有单倍体基因组，即，每个染色体以单拷贝存在。在某些条件下单倍体细胞可以配对。通过这种方式形成二倍体细胞。二倍体细胞，特别是当没有某些营养素时，可再次形成单倍体细胞。然后它们进行称为减数分裂的过程，随后孢子形成(sporulation)以形成四个单倍体孢子。减数分裂期间，亲代基因组的不同染色体重组。减数分裂重组期间，DNA片段互换产生重组的DNA物质。
WO2005/075654A1公开了用于在酿酒酵母中产生重组DNA序列的系统，该系统基于酿酒酵母的有性生殖周期。杂合二倍体细胞在引起减数分裂和孢子形成过程的条件下生长。通常减数分裂由升高的基因重组频率来表征。因此，减数分裂的产物(其为单倍体细胞或孢子)可包含由于两个趋异的DNA序列之间的重组所引起的重组DNA序列。通过选择重组的单倍体后代并彼此配对的重复方法，所得二倍体再次生成孢子，并且使它们的后代孢子经受适当的选择条件来鉴定新的重组事件。该过程描述于野生型或错配修复缺陷的酿酒酵母细胞中。因此，将各自在侧面连接有两个选择标记物的目标基因整合到错配修复缺陷二倍体株的两个姐妹染色体各自的相同基因座。将与必然整合DNA的基因座的侧翼DNA序列100%相同的DNA序列添加到新DNA片段的5′或3′端。这些侧翼靶序列的长度约为400‑450个核苷酸。然后使细胞被迫起始孢子形成。在孢子形成期间发生重组过程。所得孢子和重组序列可通过选择适当的侧翼标记物来区别。
酵母有效重组同源DNA序列的能力还可被用于增加文库的多样性。当共有89.9%同源性的两种基因通过PCR突变并被转化到野生型酵母时，通过体内同源重组创建10e7的嵌合体文库，其贯穿两种基因显示若干交换(cross‑over)点(Swers等人NucleicAcids Research 32(3)e36(2004))。
Nicholson等人描述了有丝分裂部分同源重组的方法(Genetics 154:133‑146(2000))。研究了短反向重复中包含的特定错配对野生型或MMR‑缺陷株中的重组率的影响。
本发明的目的是提供制备和组装多种基因嵌合体的改进方法，其特别用于重组长DNA片段。结果，可期望地提供变体的相应文库以选择改善的重组体。
通过提供本申请的实施方案来实现所述目的。
发明内容
本发明提供通过体细胞的体内重组来产生基因嵌合体的新方法，其包括
a)在单个步骤过程中
(i)用至少一种基因A转化细胞，所述至少一种基因A与要重组的另外的基因具有小于99.5%的序列同源性，所述要重组的另外的基因为所述细胞基因组的整合部或存在于遗传构建体的构架中，
(ii)重组所述基因，
(iii)在靶基因组的整合位点产生所述基因的基因嵌合体，其中所述至少一种基因A在5′端或者3′端具有锚定到所述整合位点的5′或3′端的单个侧翼靶序列，和
b)选择包含所述基因嵌合体的克隆。
具体地本发明涉及通过体细胞的体内重组产生基因嵌合体的方法，其包括
a)在单个步骤过程中
(i)用至少一种基因A转化细胞，所述至少一种基因A与不同的基因B具有小于99.5%的序列同源性，所述基因B为所述细胞基因组的整合部或存在于遗传构建体的构架或表达盒中，
(ii)重组所述基因，
(iii)在靶基因组的整合位点产生基因A和B的基因嵌合体，其中所述至少一种基因A在锚定到所述整合位点的5′或3′端的遗传构建体的5′端或者3′端连接到单个侧翼靶序列，和
b)选择包含所述基因嵌合体的克隆。
具体地优选将选择标记物用于基因嵌合体中，并根据选择标记物的存在来选择克隆。例如，基因嵌合体包含选择标记物，如，其中所述基因A连接到选择标记物。可选地，也可通过所得重组体的任何产物的存在，例如通过测定产量或功能特征来进行选择。具体地，可使用一种或多种不同选择标记物来区分基因嵌合体的类型。
具体地，根据本发明的方法采用所述另外的基因，所述另外的基因为靶基因组，例如细胞基因组的一部分。在优选实施方案中，所述另外的基因为作为细胞基因组的一部分的基因B。
根据可选的优选实施方案，所述另外的基因为从靶基因组分离的遗传构建体，例如线性多核苷酸，并在重组过程中被任选地整合到靶基因组中。
根据本发明的具体实施方案，用至少一种基因A和至少一种基因B共转化所述细胞，其中基因A的所述单个侧翼靶序列锚定到所述靶基因组上的整合位点的5′端，和其中基因B连接到锚定至整合位点3′端的单个侧翼靶序列。
具体地，细胞可共转化有至少一种具有选择标记物的基因A和至少一种基团B，其中基因A的所述单个侧翼靶序列锚定到所述靶基因组上的整合位点的5′端，其中基因B连接到不同的选择标记物和锚定到整合位点3′端的单个侧翼靶序列，和其中选择至少两种选择标记物的克隆。
具体地，细胞可共转化有至少两种不同的基因A1和A2以及任选的至少两种不同的基因B1和B2。
根据具体实施方案，共转化至少一种其它基因C，其具有与基因A和/或所述另外的基因的序列杂交的序列以获得所述其它基因C到基因A和/或所述另外的基因的组装(assembly)。
具体地，共转化至少一种其它基因C，所述至少一种其它基因C具有与基因A和/或B，如全长基因A或基因B的序列或者基因A和/或基因B的部分序列杂交的序列，以获得所述其它基因C到基因A和/或B的重组和组装。
具体地，所述基因C的杂交序列与所述序列具有小于99.5%的序列同源性，并优选至少30%的序列同源性。
具体地，选择在基因内具有至少一个核苷酸互换或交换的基因嵌合体，即，具有基因内交换的嵌合体，例如包含基因A的部分并组合所述另外的一种或多种基因的部分的那些，将其理解为部分基因的混合物以获得重组的基因内基因嵌合体，例如以不同方式(如具有改善的性质或以改善的产量)适于产物表达的基因。该基因内的基因嵌合体可通过重组和此外优选一系列基因的组装来产生，其中组装的基因中的一种或多种具有该基因内的基因嵌合体。
根据优选实施方案，可获得至少三种不同基因A和/或B和/或C的嵌合体。
优选地，所述基因A和/或所述另外的基因编码具有活性的多肽或多肽的一部分。
具体地，本发明的方法采用编码部分具有活性的多肽的基因A、B和/或C。因此，基因例如基因A和/或B和/或C优选它们本身都不单独编码生物活性多肽，而只编码其一部分，并且仅当基因组装时可引起相应的活性或修饰的活性。
使用本发明的方法，可以组装和重组编码生化途径的多肽的多种基因。
在另外具体的实施方案中，本发明的方法提供产生非编码序列，例如启动子、非翻译区、核糖体结合位点、终止子等的基因的重组和最终组装。
根据本发明可使用任何重组感受态真核或原核宿主细胞通过体细胞的体内重组来产生基因嵌合体。根据本发明优选的实施方案，细胞为修复缺陷细胞，例如，核酸修复缺陷细胞，如具有DNA修复缺陷的细胞，或MMR缺陷的细胞。
具体地，细胞为优选真菌、哺乳动物或植物细胞的真核细胞，或原核细胞。
优选细胞为曲霉属(Aspergillus sp.)或真菌细胞，优选地，其可选自由酵母菌属、念珠菌属(Candida)、克鲁维酵母菌属(Kluyveromyces)、汉逊氏酵母菌属(Hansenula)、裂殖酵母菌属(Schizosaccaromyces)、耶氏酵母菌属(Yarrowia)、毕赤酵母菌属(Pichia)和曲霉菌属组成的组。
优选单倍体株，例如采用单倍体酵母株。
可选地，可使用原核生物，例如大肠杆菌(E.coli)、杆菌属(Bacillus)、链霉菌属(Streptomyces)，或哺乳动物细胞，诸如HeLa细胞或Jurkat细胞，或植物细胞如拟南芥(Arabidopsis)。
根据具体实施方案，侧翼靶序列至少为5bp，优选至少10bp，更优选至少20bp、50bp、100bp直至5,000bp长。具体地，侧翼靶序列连接到所述基因或为所述基因整合的末端部分。优选所述侧翼靶序列具有30%至99.5%范围内的与所述整合位点的锚定序列杂交的同源性，优选小于95%、小于90%、小于80%。
根据本发明当使用锚定至基因组的靶整合位点的至少两种不同侧翼靶序列时，优选它们彼此不重组，优选它们共有小于30%的同源性。
对本发明的方法有用的选择标记物可选自由任何已知的营养缺陷型标记物、抗生素抗性标记物、荧光标记物、敲入标记物、活化剂/结合结构域标记物和显隐标记物和比色标记物(colorimetric markers)组成的组。优选的标记物可以是暂时失活的或功能性敲除的，并且可以被重新建立以恢复其标记性。另外优选的标记物为可追踪基因，其中标记物为基因序列A和/或其它基因(例如基因B)之一的功能，而无需单独的具有标记物功能的序列，因此基因嵌合体的表达可通过嵌合体本身的检测而直接测定。在这种情况下基因嵌合体是直接可追踪的。
根据具体实施方案，所述基因包含于线性多核苷酸、载体(vector)或酵母人工染色体中。具体地，要重组的基因A和/或其它基因为线性多核苷酸的形式，优选300至20,000bp。具体地，无需构建体或使用质粒或巨型质粒(megaplasmid)。因此基因可原样使用，即，没有运载体(carrier)。
用于重组和整合的基因还可包含于任何遗传构建体，例如用作运载所述基因的载体中。因此，所述基因可包含于遗传构建体，例如，线性多核苷酸、载体或酵母人工染色体中。这些优选包括线性多核苷酸、质粒、PCR构建体、人工染色体诸如酵母人工染色体、病毒载体或转座元件。
根据本发明的具体实施方案，靶基因组的整合位点位于任何一种基因上，例如，在线性多核苷酸、质粒或包括人工染色体在内的染色体中。
根据本发明的方法具体地提供具有基因内基因嵌合体的至少一种克隆的选择。具体地，选择具有基因组装和至少一种基因内的基因嵌合体的至少一种克隆。
使用根据本发明的方法，可获得至少3个，优选至少9个，直至20,000个碱基对的基因嵌合体，以及例如，包括至少一种基因内的嵌合体的基因嵌合体，该基因嵌合体基于700个碱基对、更优选基于600bp，基于500bp甚至以下具有优选至少3个交换事件，优选至少4、5或10个交换事件。典型地，交换事件的程度高使重组基因的多样性大，其可用于产生用于选择适当文库成员的文库。嵌合体或交换事件的程度可理解为该文库的质量参数。
根据本发明的方法修饰的基因可以是对科学或工业目的有用的任何基因。这些基因可以是例如非编码序列，如可用于重组表达系统的那些非编码序列，或者为完整或部分多肽变体，包括那些不编码具有生物活性的多肽的部分序列，所述多肽具体选自由酶、抗体或其部分、细胞因子、疫苗抗原、生长因子或肽组成的组。如果编码非编码序列或作为具有生物活性多肽的部分的氨基酸序列的基因(也称为“部分基因”)被修饰，则可优选该部分基因的组装具有功能特征，例如编码具有生物活性的多肽。优选重组许多不同的基因，例如大小在3bp至20,000bp范围内、具体地至少100bp、优选300bp至20,000、具体多达10,000bp的不同的部分基因，不同基因的数量为至少2，更具体地至少3、4、5、6、7、8、9或至少10，以产生非编码或编码重组多肽(例如，具有生物活性的多肽，其被有利地调节为例如具有增强的生物活性)的重组基因序列。在此处使用的术语“生物活性”具体指酶活性，例如将特定底物转化为特定产物的活性。根据本发明所多样化的优选基因编码多链多肽。
根据本发明的特定实施方案，提供基因变体的细胞展示方法，其包括使用根据本发明的方法在细胞中创建基因嵌合体的多样性，和将所述多样性展示到所述细胞的表面上，从而获得嵌合体文库。
可通过该优选的展示可获得的文库具体包括在功能性开放阅读框(ORF)内的高百分比的、优选至少80%的基因嵌合体。
根据本发明的文库具体可以是任何适当的形式，具体地生物文库包括含有基因变体的各种生物体。根据本发明的生物文库可包含于生物体群体和/或具体地由生物体群体表达，以创建生物体库(repertoire)，其中个体生物体包含至少一种文库成员。
根据本发明的具体方面，进一步提供包含来自该文库的基因变体的生物体，例如选自生物体库的生物体。根据本发明所提供的生物体可用于在适当的表达系统，例如生产宿主细胞中表达基因表达产物。
附图说明
图1：非减数分裂体内重组
重组部分同源的基因A和B(小于99.5%的同源性)。由于标记物序列和侧翼靶序列不同源，所以仅在基因A和B之间发生重组/组装。结果，杂种/嵌合体DNA包含重组的基因A和B、两种标记物以及两个侧翼靶序列。基因嵌合体整合到靶染色体的靶基因座。已整合整个构建体的克隆在对于两种标记物为选择性的适当培养基上生长。
T5′和T3′相应于酵母基因组上的靶序列(小于99.5%的同源性)(大约400bp)，使同源整合定位到染色体位点上。M1和M2为双重选择的侧翼标记物。基因A和基因B为具有给定同源度(小于99.5%)的相关的部分同源译本(homeologous version)。重叠序列相应于两基因的整个ORF。通过在MMR缺陷型酵母转化体中的部分同源重组来组装后，双重选择使重组体分离。
图2：通过部分同源重组的DNA重组和组装
该图示出具体实施方案的示意性介绍，其中细胞共转化有至少两种基因，此处为DNA片段A和B，在它们80bp的重叠部分上具有小于99.5%的同源性。各DNA片段侧面连接有一种选择标记物。
片段A包含相应于染色体上5′端恰当整合位点的侧翼靶序列以及与片段B重叠的杂交区域，片段B包含相应于3′整合位点的侧翼靶序列以及与片段A重叠的杂交区域。用所得片段转化错配缺陷型酵母细胞。将所得转化体铺板到两种标记物的选择性培养基上。分离可被两种标记物选择的克隆，通过选择的重组体基因组DNA的分子分析来确认基因A和B的组装/整合的簇的整合性以及ORF的重构。
T5′和T3′相应于酵母基因组上的靶序列(小于99.5%的同源性)(大约400bp)，使同源整合定位到染色体位点上。M1和M2为双重选择的侧翼标记物。DNA片段A和B可组装到可被追踪的一种基因(例如GFP)，或者可代表通过该方法所组装的两种基因。所有基因的重叠序列具有小于99.5%的同源性(120bp)，从而在通过部分同源重组的组装后使得ORF的重构。双重选择使得重组体分离并用作组装的主要验证。
图3：基因A、B和C的重组和组装
该图示出其它基因C的共转化，所述其它基因C具有与基因A和/或B的侧翼序列杂交的序列，从而获得所述基因C到基因A和B的组装。
T5′和T3′相应于酵母基因组上的靶序列(小于99.5%的同源性)(大约400bp)，使同源整合定位到染色体位点上。M1和M2为双重选择的侧翼标记物。基因A、基因B和基因C为与给定同源度(小于99.5%)相关的部分同源译本。重叠序列相应于基因的5′部分和3′部分。基因B连接侧翼片段并且通过序列相似性来重构新的ORF ABC。在通过在MMR缺陷型酵母转化体中的部分同源重组的组装后，双重选择使重组体分离。
图4：Oxa重组底物
四种基因编码β‑内酰胺酶的变体。它们是在DNA水平上具有不同同源度(从95%至49%)的相关译本。上图示出基因ORF的示意性退火，其含有比对后产生的系统树图(dendrogramme)。基因大小为约800bp。ATG和TAA是指起始密码子和终止密码子。下表示出在DNA水平上四种基因之间的序列相似性的百分数。
图5：基因和蛋白质嵌合体OXA11/OXA7的序列(SEQ IDNOs 1‑14)
OXA7来源的核苷酸序列为粗体下划线，突变核苷酸序列为粗体斜体。
通过双重选择来分离克隆，并将DNA用于扩增和测序。仅使用双链均清晰可读的序列。将所得色谱图用Clustal类程序比对。
图6：基因和蛋白质嵌合体OXA11/OXA5的序列(SEQ IDNOs 15‑38)
OXA5来源的核苷酸序列为粗体下划线，突变核苷酸序列为粗体斜体。
通过双重选择来分离克隆，并将DNA用于扩增和测序。仅使用双链均清晰可读的序列。将所得色谱图用Clustal类程序比对。
图7：亲代基因OXA11、OXA7和OXA5的序列(SEQ ID NOs39‑41)
图8：包含复合嵌合基因的克隆的序列，相应于OXA11/OXA5/OXA7的部分同源组装
序列克隆和相应蛋白质退火的结果：图8a)OXA11/OXA5/OXA7的OUL 3‑05‑II(SEQ ID NOs 42和43)，图8b)OXA11/OXA5/OXA7的OUL 3‑05‑III(SEQ ID NOs 44和45)，图8c)OXA11/OXA5/OXA7的OUL 3‑05‑IV(SEQ ID NOs46和47)，图8d)OXA11/OXA5/OXA7的OUL 3‑05‑IX(SEQ ID NOs 48和49)和图8e)OXA 11/OXA5/OXA7的OUL3‑05‑X(SEQ ID NOs 50和51)。
OXA5的核苷酸序列为粗体，相应于OXA7的核苷酸序列为下划线。非粗体、没有下划线的序列相应于OXA 11。
图9：乳酸克鲁维酵母(Kluyveromyces lactis)、酿酒酵母的ADH1基因序列和重组序列
下划线为乳酸克鲁维酵母来源的核苷酸序列。
图9a)：(SEQ ID NO s 52)ADH克鲁维酵母菌属，图9b)：(SEQID NOs 53)酵母菌属，图9c)：(SEQ ID NO s 54)克隆A02，图9d)：(SEQ ID NOs 55)A03，图9e)：(SEQ ID NOs 56)A05，图9f)：(SEQID NOs 57)A06，图9g)：(SEQ ID NOs 58)A 10，图9h)：(SEQ IDNO s 59)A11。
具体实施方式
因此，本发明涉及部分同源DNA序列(即相似但不相同序列)的体内重组的新型高效方法。下文中术语同源重组(当重组部分同源序列时有时称为部分同源重组)是指具有一定同源性的序列(可以相同也可以不同)的重组。与依靠位点特异性消化和连接的常规克隆方法不同，同源重组比对互补序列并能够在片段之间互换。通过具有错配碱基的序列的杂交，在细胞中产生重组嵌合基因(也称为杂种基因)。通过该创造性诱变方法，可以以时间有效的方式容易地创建适当选择的多样性和目标多肽的重新设计。
具体地，通过采用体内重组的功能系统，本发明首次在单个步骤过程中能够有效的重组和形成嵌合体，能够使多样性基因多样化和组装。
术语“单个步骤过程”指操纵重组体的若干处理步骤，诸如用基因转化细胞、基因重组、嵌合基因的产生和将基因整合到靶基因组在技术上是在一个方法步骤中进行的。因此，在体内重组之前无需DNA运载体的活体外重组，或处理步骤(包含采用减数分裂的那些)的任何重复循环。有利地，可避免使用减数分裂的酵母细胞。
根据本发明的单个步骤过程可甚至包括同时通过宿主表达该工程重组体。因此将不需要另外的操作来获得表达产物。
根据本发明的术语“基因嵌合体”指具有至少一个交换事件的至少两种不同基因的结合体。具体地该交换提供DNA序列的组合或混合。基因嵌合体可通过基因、基因内(intrangenic)的基因嵌合体和/或基因组装的基因内混合，任选具有基因内和基因间交换的基因或基因嵌合体的组装来产生。
术语“交换”指在两DNA链可互换遗传信息的位点，即至少一个核苷酸处的基因之间的重组。交换过程导致后代嵌合基因具有来源于亲代基因的基因或序列的不同组合。
可选地，可提供不基于交换的其它修复机制，例如包括链接合后不正确核苷酸的识别、切除和/或替换的核苷酸切除修复(excision repair)或非同源端连接机制。
术语“侧翼靶序列”指与目标靶互补的核苷酸序列的区域，所述目标靶例如基因组靶整合位点(包括要重组的基因A和/或其它基因的位点)、线性多核苷酸、以及线性或环状质粒YAC等。由于互补或同源的特定程度，侧翼靶序列可与靶整合位点杂交并将基因整合到靶整合位点。
术语细胞的“基因组”指完整的生物体遗传信息，由基因和DNA的非编码序列表示，或者染色体或非染色体的遗传元件例如线性多核苷酸(例如，包括要重组的基因A和/或其它基因)、病毒、自我复制的运载体和载体、质粒和转座元件，包括人工染色体等。人工染色体为包含导入细胞时对稳定保持所必需的全部序列的线性或环状DNA分子，其中它们的行为类似于天然染色体，并因此被认为是基因组的部分。
术语“同源性”表示两种以上的核苷酸序列在相应位置具有相同或保守的碱基对(在一定程度上，达100%)。如根据本发明所使用的同源序列也称为互补、相应或匹配序列，优选与同源对应序列(homologous counterpart sequence)杂交，例如，相对于本文所公开的全长天然DNA序列或DNA序列的片段，相应互补序列具有至少30%的序列同一性，但小于99.5%的序列同一性，可能小于95%、小于90%、小于85%或小于80%。优选地，同源序列将具有至少约30%的核苷酸序列同一性，优选至少约40%的同一性，更优选至少约50%的同一性，更优选至少约60%的同一性，更优选至少约70%的同一性，更优选至少约80%的同一性，更优选至少约90%的同一性，更优选至少约95%的同一性。如上所述优选的上下限范围在30%和99.5%相应序列同一性的范围之内。如本文所使用的，同一性程度始终还是指互补序列。
关于基因的核苷酸序列的“同一性的百分数(%)”定义为在比对序列和必要时引入缺口(gap)以达到最大序列同一性的百分数后，在与DNA序列中的核苷酸相同的候补DNA序列中核苷酸的百分数，并且不考虑任何保守性替换作为序列同一性的部分。以确定核苷酸序列同一性的百分数为目的的比对可通过本领域内熟知的各种方式，例如使用公众可获得的计算机软件来实现。本领域熟练技术人员可确定测量比对的适当参数，包括为达到相对于要比较的序列全长的最大对比所需的任何算法。
术语“锚定”指通过具有部分或完整序列同源性的称为“锚定序列”的片断将基因或基因嵌合体结合到整合序列，从而能够使该基因或基因嵌合体整合到基因组的整合位点。具体地，锚定序列可以是与基因组序列的整合位点同源或部分同源的侧翼靶区域。优选的锚定序列与靶整合位点具有优选至少约70%的序列同源性，更优选至少80%、90%、95%直至99.55%或与基因组的杂交部完全匹配。
整合位点可被适当地定义为在宿主基因组上的基因座，该基因座将发生高频重组事件。优选的基因座为例如，酿酒酵母III号染色体上的BUD31‑HCM1基因座。通常，优选显示高频重组但细胞生活力没有变化的酵母染色体上的任何另外的基因座。
术语“表达”或“表达系统”或“表达盒”指包含可操作连接的所需编码序列和控制序列(control sequence)，从而使转化或转染有这些序列的宿主能够产生编码的蛋白质的核酸分子。为了实现转化，表达系统可包含于载体上；然而，相关的DNA也可整合到宿主染色体中。
术语“基因”还将包含基因的DNA片段，特别是部分基因的DNA片段。片段还可包含若干开放阅读框，或者为相同ORF的重复或不同ORF的重复。该术语将具体地包括为非编码的核苷酸序列例如非转录或非翻译序列，或者编码整个或部分多肽的核苷酸序列。
如根据本发明所使用的术语“基因A”将指非编码序列或编码一种或多种目标多肽的序列的任何核苷酸序列。基因A的特征在于存在于遗传构建体，例如表达盒、线性多核苷酸、质粒或载体的构架中，其优选至少合并标记物序列并在基因A或遗传构建体的5′端或3′端具有单个侧翼靶序列。在根据本发明的方法中，基因A典型地为要重组以形成基因嵌合体的一系列基因中的第一基因。基因A与要重组的另外的基因同源，其最终或者为基因A的变体，或者视情况而定为基因B、C、D、E、F、G、H等的任何基因。因此为了最大保真度目的而典型地设计为每种基因A仅一个侧翼靶序列。基因A的变体称为基因A 1、A2、A3等，它们具有一定程度的序列同源性，并任选的具有相似的功能特征。术语“至少一种基因A”将指至少基因A和任选的基因A的变体。
如根据本发明所使用的术语“基因B”将指非编码序列或编码一种或多种目标多肽的序列的任何核苷酸序列，将其选择为用于与要重组的另外的基因(视情况而定其最终或者为基因A、基因B的变体或基因C、D、E、F、G、H等的任何基因)形成基因嵌合体。基因B与基因A或其它基因在一定程度上同源从而能够与要重组的基因A或其它基因形成嵌合体。在根据本发明的方法中，基因B典型地为要重组以形成基因嵌合体的一系列基因中的最后的基因。基因B可以是细胞基因组的整合部，或存在于遗传构建体例如表达盒、线性多核苷酸、质粒或载体的构架中，其优选至少合并标记物序列并在基因B或遗传构建体的5′端或3′端具有单个侧翼靶序列，作为基因A的侧翼靶序列的相应物(是指在基因的另一端)。如果基因A的侧翼靶序列在基因A的5′端，则基因B将典型地在3′端具有其侧翼靶序列，反之亦然。因此为了最大保真度目的而典型地设计为每种基因B仅一个侧翼靶序列。基因B可以是基因A的变体。基因B的变体称为基因B1、B2、B3等，它们具有一定程度的序列同源性，并任选的具有相似的功能特征。术语“至少一种基因B”将指至少基因B和任选的基因B的变体。
如根据本发明所使用的术语“基因C”将指非编码序列或编码目标多肽的序列的任何核苷酸序列。基因C的特征在于存在于遗传构建体，例如表达盒、线性多核苷酸、质粒或载体的构架中，其任选地合并标记物序列，并且另外的特征在于其核苷酸序列的片断视情况而定与基因A和/或基因B、基因C的变体或最终其它基因D、E、F、G、H等的序列同源。基因C优选在基因C的5′端或者3′端具有单个侧翼靶序列，或者在两侧均具有侧翼靶序列。因此基因C可与基因A和/或其它基因部分或完全杂交以重组、连接和组装所述基因。根据本发明的方法中，基因C典型地为要重组以形成基因嵌合体的一系列基因中继基因A之后的第二基因。基因C的变体称为C1、C2、C3等，它们具有一定程度的序列同源性，并任选地具有相似的功能特征。
另外的基因D可视情况而定通过与基因C、基因D的变体或最终的其它基因A、B、E、F、G、H等的序列同源的其核苷酸序列的杂交或其核苷酸序列的片断来另外地重组和组装以提供相应地重组和连接。基因D优选在基因D的5′端或者3′端具有单个侧翼靶序列，或者在两侧均具有侧翼靶序列。在根据本发明的方法中，基因D典型地为要重组以形成基因嵌合体的一系列基因中继基因C之后的下一基因。基因D的变体称为D1、D2、D3等，它们具有一定程度的序列同源性，并具有任选地相似的功能特征。
另外的基因E可视情况而定通过与基因D、基因E的变体或最终的其它基因A、B、C、F、G、H等的序列同源的其核苷酸序列的片断来另外地重组和组装以提供相应地重组和连接。基因E优选在基因E的5′端或者3′端具有单个侧翼靶序列，或者在两侧具有侧翼靶序列。在根据本发明的方法中，基因E典型地为要重组以形成基因嵌合体的一系列基因中继基因D之后的下一基因。基因E的变体称为E1、E2、E3等，它们具有一定程度的序列同源性，并具有任选地相似的功能特征。
可相应地使用另外的基因F、G、H等。另外的基因的顺序不理解为受字母表字母的限制。目标基因的最终链将通过连接到基因A和B以在基因组的整合位点获得基因组装来获得。由此组装的目标基因可被操作性地连接，从而支持相应的目标多肽和代谢物的各自表达。具体的组装方法采用通过体内重组以组装甚至大量DNA片段以获得所需的大尺寸DNA分子的盒的组合。表示重叠序列的盒适当地设计为覆盖整个所需序列。在一个实施方案中，优选的重叠序列为至少约5bp，优选至少约10bp。在其它实施方案中，重叠序列可为至少15、优选至少20至1,000bp。
在一个优选实施方案中，将某些盒设计为包含允许识别的标记物序列。典型地标记物序列位于容许转座子插入的位点，从而最小化在最终所需的核酸序列上的生物效应。
在具体实施方案中，在宿主细胞中通过用所述基因或片段的混合物共转化并培养转化有重组或组装的序列的所述宿主宿主，所述宿主细胞能够重组或组装具有甚至大量具有重叠序列的基因或核酸的DNA片段，例如至少2种，优选至少3、4、5、6、7、8、9种，更优选至少10种基因或核酸片段。
根据本发明要使用的基因或DNA片段作为整个基因或部分基因可为双链或单链。双链核酸序列通常为300‑20,000碱基对，单链片段通常较短并可在40至10,000核苷酸范围内。例如，可在酵母中组装多达2Mb直至500Mb的组装(assembly)。
来自大量生物体的基因组序列为公众可获得的，并且可用于根据本发明的方法中。这些基因组序列优选包含从宿主细胞的不同株或不同物种获得的信息，从而提供具有特定多样性的同源序列。
用作重组底物的初始基因通常为包括基因变体形式的多核苷酸的集合。变体形式显示彼此相当大的序列同一性，足以允许底物之间同源重组。多核苷酸之间的多样性可以为天然型例如等位或物种变体(species variants)，诱导型例如易错PCR或易错循环序列重组(error‑prone recursive sequence recombination)，或活体外重组的结果。多样性还可由具有选择性密码子用途(codon usage)的编码天然蛋白质的基因的再合成而产生。在底物之间应当有至少充足的多样性，从而使重组可以产生比原材料更加多样的产物。必须有至少两种底物在至少一个以上的位置不同。多样性的程度取决于要重组的底物的长度以及要进化的功能改变的程度。高达69%的位置的多样性是典型的。
根据本发明的方法，优选基因A、B、C和另外的基因至少在设计为杂交的具体片断(其包括全长基因)处共有至少30%的同源性。优选的同源性百分数为至少40%，更优选至少50%，更优选至少60%，更优选至少70%，更优选至少80%，更优选至少90%，甚至更优选至少95%至小于99.5%。
根据该方法，也可期望简单地组装，例如使该基因与基因变体串联起来并任意地混合，从而多样化较大的基因(例如，单个代谢途径的成员)或组装多个代谢通路。可以该方式来构造自然界中不存在的代谢通路。因此，通过构造为获得重组酶的基因或部分基因的组装体，可在一种生物体中编码在该生物体中存在的、作用于由缺乏该下游酶的不同生物体所产生的期望底物的酶。由此可包含多种酶以构建复合代谢通路。如果应当将一组多肽或部分多肽按其在通路内的生化功能排列，则这是有利的。示例性目标基因通路编码用于合成工业感兴趣的次级代谢物，例如黄酮醇、大环内酯、聚酮化合物等的酶。
另外，可通过混合片段来制备组合文库(combinatoriallibraries)，其中编码酶或其它蛋白质的一种或多种所述片段设置有相同的杂交序列，而非不同的间插序列(interveningsequence)。
可以以组合方式构建遗传通路，从而使组合文库中的各成员具有基因变体的不同组合。例如，变体的组合文库可由单种DNA元件(其中将重组和组装不同的片段，其中每一种不同的片段具有若干变体)构建。代谢通路的重组和组装可以不需要证明成功操纵(engineering)的标记物序列的存在。代谢物以期望方式的表达已描述于实施例。代谢通路的成功重组和组装可例如通过检测细胞培养基中的次级代谢物来测定。
原核和真核宿主细胞均预期用于所公开的方法，包含细菌宿主细胞诸如大肠杆菌或芽孢杆菌，酵母宿主细胞例如酿酒酵母，昆虫宿主细胞例如草地贪夜蛾(Spodooptera frugiperda)或人宿主细胞例如HeLa和Jurkat。
优选的宿主细胞为例如来自念珠菌属(Candida sp.)、毕赤酵母菌属(Pichia sp.)和酵母菌属(Saccharomyces sp.)的单倍体细胞。
本发明的方法将不利用有性周期或减数分裂重组。DNA片段可被转化到单倍体细胞中。转化体可被立即划线(streak)到选择性平板上。然后重组体将通过PCR或其它手段，诸如缺口修复来分离。
本发明的方法可在任何野生型或修复缺陷的原核或真核细胞，包括核酸修复如DNA修复或RNA修复缺陷的那些细胞中进行。在野生型细胞中，选择允许部分同源重组的适当的整合位点。当在野生型细胞中进行时根据本发明的方法优选提供基因，例如具有至少80%，优选至少90%序列同一性的基因A和B的重组。虽然受损和错配DNA的修复和重组通常受到抑制，但令人惊讶地发现在该野生型细胞中也可以在整合位点的部分同源重组。
错配修复(MMR)系统的突变或修饰将增加细胞中的重组频率。可选地，可使用其它修复缺陷系统，例如可增强重组的DNA修复基因rad 1、recQ的完全或暂时性敲除。
优选将DNA修复缺陷细胞用于根据本发明的方法中。作为实例，可完全或暂时性敲除错配修复，或可以通过向其中在进行靶重组期间或之后培养细胞的细胞培养基中添加特定的底物来条件性或诱导错配修复。具体地，细胞的MMR缺陷可通过如下任何策略来实现：瞬时或永久性损害错配修复，包括参与错配修复的基因的突变，用UV光处理，用化学物例如2‑氨基嘌呤处理，参与错配修复的基因例如通过允许瞬时失活和活化的可调节启动子的诱导表达或阻遏。
已广泛研究了细菌的错配修复系统。在其它系统例如酵母中，已鉴定了若干基因，其产物与细菌错配修复蛋白质共有同源性，例如，酿酒酵母中的MutS蛋白质的类似物，即Msh1、Msh2p、Msh3p、Msh4、Msh5、Msh6p，和MutL蛋白质的类似物，即Mlh1p、Mlh2p、Mlh3p和Pms1。
优选的错配修复缺陷细胞的实例为特定的酵母细胞，例如，具有缺陷或(暂时性)失活的MSH2的酿酒酵母株，如工程化W303、BY、SK1株如MXY47(MSH2被破坏的W303)株。
MMR另外优选的系统为熟知菌株的选择，例如US5912119中所述的那些，例如诸如mutS或mutL型的酶促MutHLS错配修复系统的缺陷株，其对于参与错配识别的蛋白质MutS和MutL为缺陷型。优选株例如为利用F‑mutL或大肠杆菌Hfr/鼠伤寒沙门氏菌(S.Typhimurium)F‑mutL的重组体的鼠伤寒沙门氏菌。
此外，根据本发明优选使用其它真核错配修复缺陷细胞，诸如HeLa和Jurkat细胞。
根据本发明的方法主要采用标记物来辅助选择成功重组的产物。工具例如分子标记物或DNA指纹的使用可绘制目标基因。这允许筛选大细胞库以实现具有目标特性的细胞选择。所述筛选基于是否存在某基因。
如根据本发明所使用的术语“选择标记物”指在成功整合时提供标记的蛋白质编码或非编码DNA序列。具体地，蛋白质编码标记物序列选自营养标记物、色素标记物、抗生素抗性标记物、抗生素敏感标记物、荧光标记物、敲入标记物、活化剂/结合结构域标记物和显隐性标记物、比色标记物和只有当两种以上的亚基在同一细胞内表达时才起作用的酶的不同亚基的编码序列的组。所述术语还指重组的可追踪基因，其提供基因嵌合体的直接测定，而无需使用单独的标记物序列。
“营养标记物”为编码可补偿细胞的营养缺陷并由此将原养型赋予到营养缺陷型细胞的基因产物的标记物序列。根据本发明术语“营养缺陷”指细胞必须生长于含有由营养缺陷型细胞本身不能产生的必需营养素(essential nutrients)的培养基中。营养标记物基因的基因产物促进营养缺陷型细胞中缺少的该必需营养素的合成。通过成功表达营养标记物基因，则其无需将该必需营养素添加到细胞生长的培养基中。
优选的标记物序列为URA3、LEU2、CAN1、CYH2、TRP1、ADE1和MET5。
编码“色素标记物”的基因编码参与色素合成的基因产物，所述色素在表达时可使细胞染色。由此提供成功表达色素标记物的细胞的快速表型检测。
“抗生素抗性标记物”为编码如下基因产物的基因，该基因产物在抗生素以不表达所述产物的细胞不能生长的浓度存在时使细胞生长。
“抗生素敏感标记物”为其中基因产物在存在抗生素时抑制表达所述标记物的细胞生长的标记物基因。
“敲入”标记物被理解为代表为至敲除细胞的缺少环节(missing link)的核苷酸序列，由此在成功重组和操作时引起细胞生长。敲除细胞为基因工程细胞，其中通过靶向突变已关闭一种以上的基因。该缺失基因可适当地用作敲入标记物。
“荧光标记物”指编码通过发射相应的荧光信号而可检测的荧光基团的核苷酸序列。通过基于差示荧光标记的流式细胞术的熟知技术可以容易地将细胞分类。
用于多样化或重组的基因可以是非编码序列或编码多肽的序列或蛋白质编码序列或具有足以使重组事件成功的序列长度的其部分或片段。更具体地，所述基因具有3bp，优选至少100bp，更优选至少300bp的最小长度。
根据本发明获得的优选的基因嵌合体具有至少3个，优选多达20,000个碱基对，优选的范围将为300–10,000bp的范围；特别优选的是至少500bp或至少1,000bp的大DNA序列。
具体优选的基因嵌合体的特征在于每700个碱基对至少3个交换事件，优选每700个碱基对至少4个交换，更优选每700个碱基对或每500个碱基对至少5、6或7个交换，其包括单个核苷酸，或至少1个、优选至少2、3、4、5、10、20至更多个核苷酸序列的片断的交换。
根据本发明的方法在一个单独的重组基因中可获得不仅是奇数个而且还是偶数个重组事件。这相对于减数分裂的体内重组是特别优异的。
通过本发明的方法可获得重组体嵌合现象的复杂模式(Complex patterns)，在一个单独的分子内延伸出大量不同长度的重组序列嵌段。另外，可获得相应于链模板之一的核苷酸的点状置换(point‑like replacement)，作为关于开放阅读框的读码框(frame)的多样性的重要来源。嵌合现象和点状交换在蛋白质水平并非必然保守。的确，重组后可以产生具有不同极性的新氨基酸，将新型潜在的酶促蛋白质性质赋予到由该方法衍生的重组蛋白质。
优选地，基因为编码治疗或工业应用的酶或蛋白质的蛋白质编码序列或其片段的部分。以下术语“多肽”将包括具有优选至少2种氨基酸，优选至少3种多肽和蛋白质的目标肽。目标多肽优选选择，但不局限于酶、免疫球蛋白超家族成员如抗体和抗体结构域或片段、细胞因子、疫苗抗原、生长因子和肽。
酶催化剂由于其高选择性而被适当地用于许多工业过程。如根据本发明用于多样化的优选酶包括蛋白水解酶，例如枯草杆菌蛋白酶；纤维素分解酶，例如用于纸浆造纸工业中的细胞壁松弛酶、内切葡聚糖酶、淀粉蔗糖酶、醛缩酶、糖激酶(sugarkinase)、纤维素、淀粉酶、木聚糖酶、葡糖脱氢酶和β‑萄糖苷酶、漆酶；用于精细化学品、农用化学品和药品合成的脂肪酶；酯酶，如用于生物质燃料生产的酯酶。酶改善的优选实例为具有改善的热稳定性的乙醇脱氢酶的生产。
可以看出即使编码具有复杂结构和折叠的多链多肽的基因也可被重组和组装。优选的实例为免疫球蛋白超家族成员，其中免疫球蛋白和共有免疫球蛋白结构特征的多肽具有被称为免疫球蛋白结构域的结构域或折叠，包括细胞表面抗原受体、免疫系统的共同受体和共同剌激分子、参与抗原呈递到淋巴细胞的分子、细胞粘附分子、某些细胞因子受体和胞内肌肉蛋白质。优选重组和组装抗体或抗体片段，例如Fab、Fv或scFv。
可选地，嵌合基因还可以是非蛋白质编码序列，诸如参与蛋白质编码序列表达调节的序列，甚至是如长和短型非编码RNA的调节序列。这些可以是但不局限于启动子序列、内含子序列、编码多聚腺苷酸化信号的序列。
在本发明优选的实施方案中，嵌合基因的组装、其与宿主基因组的重组以及嵌合基因的进一步表达以产生目标重组多肽或所述宿主细胞的代谢物是在单个步骤过程中进行的。
根据本发明可采用本领域熟知的常规分子生物学、微生物学和重组DNA技术。这些技术充分的说明于文献中。参见，例如，Maniatis,Fritsch & Sambrook,"Molecular Cloning:ALaboratory Manual(1982)。
对于体内重组，使用标准转染技术将要与基因组或其它基因重组的基因用于转染宿主。在适当的实施方案中，提供复制起点的DNA包含于构建体中。复制起点可由本领域熟练技术人员适当地选择。根据基因的性质，如果序列已提供有如复制起点自身那样可操作的基因或基因组，则可以不需要辅助的复制起点。
可以以线性多核苷酸、质粒、巨型质粒、合成或人工染色体例如植物、细菌、哺乳动物或酵母人工染色体的形式产生合成的核酸序列或盒和亚型。
可由当外源或异种DNA被导入细胞内部时的该DNA来转化细胞。转化DNA可以整合或可以不整合，即共价连接到细胞的基因组。例如在原核生物、酵母和哺乳动物细胞中，转化DNA可保持于附加型元件如质粒上。关于真核细胞，稳定转化的细胞为其中转化DNA已整合到染色体，从而通过染色体复制经由子代细胞使其遗传的细胞。通过真核细胞建立由包含转化DNA的子代细胞群体组成的细胞系或克隆的能力来表示该稳定性。
可将多种基因底物并入到质粒。质粒为通常的标准克隆载体，例如，细菌多拷贝质粒。底物可并入到相同或不同质粒中。通常使用至少两种具有不同类型的选择性标记物的不同类型的质粒来允许包含至少两种载体的细胞的选择。
起初通过任何方法(例如，化学转化、自然感受态、电穿孔、生物射弹(biolistics)、包装到噬菌体或病毒系统)将包含多种基因底物的质粒导入到细胞。通常，质粒以饱和浓度或接近饱和浓度存在(相对于最大转染能力)，从而增加超过一种质粒进入相同细胞的概率。包含各种底物的质粒可同时或以多个循环转染。例如，在后面的方法中可用第一等分的质粒、选择和增殖的转染剂转染细胞，然后用第二等分的质粒转染。优选的质粒为例如，pUC和pBluscribe衍生物如pMXY9、pMXY12和pMIX‑LAM，或YAC衍生物如YCp50。
可通过允许全部基因底物参与重组来增加进化率。这可通过使转染的细胞进行电穿孔来实现。电穿孔的条件与传统用于将外源DNA导入到细胞的那些相同。还可通过融合细胞以诱导质粒或染色体互换来增加进化率。可通过化学试剂例如PEG，或病毒蛋白质例如流感病毒血凝素HSV‑1 gB和gD来诱导融合。还可通过使用增变株宿主细胞(例如，细菌中的MutL、S、D、T、H，酵母中的类似突变株，和共济失调毛细血管扩张症(Ataxiatelangiectasia)的人类细胞系)来增加进化率。
对产生重组基因的细胞进行期望功能的筛选或选择。例如，如果要进化的底物包含耐药性基因，则将选择耐药性细胞。
典型地，在本发明的重组方法中，已获得期望表型的重组终产物在0.1%‑50%的位置处不同于起始底物，并且以超过天然获得的突变率的数量级的速率(例如，至少10倍、100倍、1,000倍或10,000倍)进化。最终基因嵌合体产物可被转移到更期望将改组DNA(shuffled DNA)用于生产目的的另外的宿主。
在根据本发明优选的方法中，宿主细胞使用熟知的细胞展示系统将基因嵌合体展示于细胞表面上。通过经由该杂交的多样化，产生可适当展示的基因变体库以创建该变体的文库。
合适的展示方法包括酵母展示和细菌细胞展示。特别优选的文库为酵母表面展示文库，正如其在蛋白质工程和文库筛选中具有许多应用一样。该文库提供对相对于野生型多肽的表型性质具有增强的表型性质的多肽变体的适当选择。优选使用基于细胞的选择方法，例如，针对表面固定的配体。通常使用的选择技术包括分析和比较由该文库获得的突变多肽的性质与野生型多肽的性质。改善的期望性质将包括能够结合到受体的配体多肽结合性的特异性或亲和性的变化。多肽亲和性突变为本发明特别优选的实施方案。变体另外期望的性质是指稳定性，例如，目标重组多肽的热稳定性、pH稳定性、蛋白酶稳定性、溶解度、产率或分泌水平。
根据本发明的方法获得的文库包含高百分数的功能嵌合基因的潜在前导候选，该基因可在功能性ORF中表达。优选的文库具有在功能性ORF内包含的至少80%的基因嵌合体，优选至少85%、至少90%，甚至至少95%。如根据本发明提供的文库具体地进一步的特征在于存在指示高百分比成功杂交的标记物序列。根据本发明不仅获得奇数而且还获得偶数个嵌合碎片(mosaic patch)，增加由所述方法生产的重组体文库中的变体或文库成员数。
通常根据本发明的文库包含至少10种基因嵌合体的变体，优选至少100种，更优选至少1,000种，更优选至少104种，更优选至少105种，更优选至少106种，更优选至少107种，更优选至少108种，更优选至少109种，更优选至少1010种，更优选至少1011种，至1012种，甚至更高的数目也是可行的。
根据本发明的方法可提供包含至少102种表达基因嵌合体的功能变体的独立克隆。根据本发明，还提供预选的独立克隆(其为例如，亲和性成熟的(maturated))的集合体(pool)，该集合体包含优选至少10种，更优选至少100种，更优选至少1,000种，更优选至少10,000种，甚至多于100,000种独立克隆。包含预选集合体的那些文库根据本发明优选为选择高亲和性变体的来源。
如根据本发明所使用的文库优选包括至少102种文库成员，更优选至少103种，更优选至少104种，更优选至少105种，更优选至少106种文库成员，更优选至少107种，更优选至少108种，更优选至少109种，更优选至少1010种，更优选至少1011种，至1012种文库成员，所述文库成员优选来源于亲代基因以将新性质工程化到相应的目标多肽。
优选文库为酵母文库，和酵母宿主细胞优选在细胞的表面上展示具有生物活性的目标多肽。可选地，产物保留于细胞内或分泌到细胞外。酵母宿主细胞优选选自酵母菌属、毕赤酵母菌属、汉逊氏酵母菌属、裂殖酵母菌属、克鲁维酵母菌属、耶氏酵母菌属和念珠菌属。最优选，宿主细胞为酿酒酵母。
此处所述的实例为本发明的示例，并非意欲对其限定。根据本发明已描述了本发明的不同实施方案。在不背离本发明的精神和范围的情况下可对此处描述和说明的技术进行多种改良和改造。因此，应理解实施例仅为说明性并非限定本发明的范围。
实施例
实施例1
说明
在我们的试验安排中，我们使用OXA类的β内酰胺酶基因作为要重组的底物。OXA基因的优点在于存在可获得的不同多样性(5‑50%)的部分同源基因。这些基因因此是试验体内重组多样性极限的良好候选。所述基因也是易于处理的(约800bp长)。
图4示于OXA重组底物：基因和同源性
表1：Oxa基因的序列同一性
Oxa 7Oxa 11Oxa 5Oxa 1Oxa 7100%   Oxa 1195%100%  Oxa 577%78%100% Oxa 150%49%50%100%
在第一试验中，Oxa11分别与Oxa7(95%同一性)、Oxa5(77%同一性)和Oxa1(49%同一性)重组。
我们使用来源于菌株保藏中心(EUROSCARF)的酵母株BY47，其包含营养缺陷型(‑ura3、‑leu2)标记物基因和msh2的敲除。尿嘧啶和亮氨酸生物合成通路中的基因缺陷导致营养缺陷，即必须将尿嘧啶和亮氨酸添加到生长培养基。
在第一步骤中，将基因片段设计为一方面包含标记物URA3和OXA11，或另一方面包含分别具有另外的标记物LEU2的OXA5/7/1。邻接URA‑OXA11片段的5′端插入约400bp的DNA片段(5′侧翼靶序列)，其相应于酵母染色体BUD31区域中的5′插入位点。在OXA5/7/1的3′端，约400bp的DNA片段(3′侧翼靶序列)相应于染色体上相邻的3′位点(见图3)。所有片段根据Geneart(德国)的标准规程合成。
通过PCR扩增合成的片段，并用于转化。
将URA3‑OXA11片段和其它OXA‑LEU2片段之一转化到野生型(二倍体BY26240，Euroscarf)和错配缺陷株(单倍体母代(a‑mater)BY06240、msh2‑，Euroscarf)。转化规程参照Gietz[Gietz,R.D.和R.A.Woods.(2002)TRANSFORMATIONOF YEAST BY THE Liac/SS CARRIER DNA/PEG METHOD.Methods in Enzymology 350:87‑96]。将转化体涂布到含有用于选择适当标记物的选择性培养基(没有尿嘧啶、亮氨酸)的平板上。72小时后可观察到菌落。
表2：转化/选择后获得的克隆数

(1)同源对照
(2)DNA水平上5%的趋异性
(3)DNA水平上23%的趋异性
(4)DNA水平上51%的趋异性
(5)每ml转化混合物和μgDNA在选择性培养基(–ura–leu)上估算的cpu数。
将由BY06240转化得到的共计48个菌落分离并进行菌落PCR(lysis and Herculase PCR based on Cha and Thilly protocol：Specificity,Efficiency  and fidelity of PCR,in PCR primer:Alaboratory Manual,Dieffenbach and Dveksler eds.1995,pp37)。进行不同的PCR反应以验证片段正确插入靶区域。48个克隆中有37个显示正确的插入谱。在这37个中，31个给出清晰可用的测序用扩增产物。如果实际组装OXA序列，则使用侧翼OxaORF的两个特异性引物的反应仅允许真正重组体的扩增。另外，所得产物为用于直接测序的正确底物。因此，测序阳性扩增产物(GATC)。
测序结果
测序31中的24个克隆(具有更清晰的阳性扩增信号)。它们相应于：
同源对照Oxa11/Oxa11(SEQ ID NO  39)，同源对照Oxa07/Oxa07(SEQ ID NO.40)，同源对照Oxa05/Oxa05(SEQ IDNO 41)Fe02至fe06、fe09和fe11：Oxa11/Oxa07(SEQ ID NO.1至SEQ ID NO.14)fe09和fe13、fe14、fe16至fe24：Oxa11/Oxa5(SEQID NO.15至SEQ ID NO.38)
对于全部克隆的测序结果参见图5和6以及SEQ ID NOs1至38。
对于Oxa11/Oxa07克隆的DNA退火参见图5、SEQ IDNOs.1、3、5、7、9、11和13。
对于Oxa 11/Oxa05克隆的DNA退火参见图6、SEQ ID NOs.15、17、19、21、23、25、27、29、31、33、35和37)。
对于OXA11/Oxa07的蛋白质退火参见图5、SEQ ID NOs.2、4、6、8、10、12和14。
对于Oxa11/Oxa05的蛋白质退火参见图6、SEQ ID NOs.16、18、20、22、24、26、28、30、32、34、36和38。
实施例2
说明
作为产生复杂嵌合基因文库的第二选择，组装和重组三个不同但相关基因序列。如实施例1中那样，在MMR缺陷酵母中将OXA基因序列用于其组装(关于OXA基因同一性参见图4)。如图3所示的那样，嵌合体产生的原理是基于使用与OXA5(基因C)的整个ORF杂交的OXA11(基因A)和OXA7(基因B)的各截短序列。因此，只有共有营养缺陷型标记物的组装和整合的盒A‑B‑C将在转化后被选择。
如实施例1中那样，我们使用来源于菌株保藏中心(EUROSCARF)的酵母株BY47，其包含营养缺陷型(‑ura3、‑leu2)标记物基因的敲除和msh2的缺失。尿嘧啶和亮氨酸生物合成通路中的基因缺陷导致营养缺陷：即必须将尿嘧啶和亮氨酸添加到生长培养基。
包含截短基因A和B的新基因片段通过特异性PCR由已在实施例1中所述的片段：URA‑Oxa11(在Oxa11 ORF的核苷酸386‑406上退火的反向引物)和Oxa7‑Leu(在Oxa7 ORF的核苷酸421‑441上退火的正向引物)来获得。OXA5基因的整个ORF通过PCR由OXA5‑Leu片段来获得。如实施例1中那样，使用片段END‑Leu。将纯化的PCR片段用于转化。
转化规程参照Gietz[Gietz,R.D.and R.A.Woods.(2002)Transformation of Yeast by the Liac/SS Carrier DNA/PEGMethod.Methods in Enzymology 350:87‑96]。将转化体涂布到含有用于选择适当标记物的选择性培养基(没有尿嘧啶、亮氨酸)的平板上。72小时后可观察到菌落。
表3：转化/选择后获得的菌落数
酵母/转Oxa11/Oxa5/Oxa7(1)Oxa11/Oxa07(2)BY26240(二倍体msh2+)<101(3)ND(5)BY06240(单倍体msh2)1.4×104(4)<5
(6)三个OXA序列组装
(7)中间序列OXA5缺失(阴性对照)
(8)MMR精通酵母(MMR proficient yeast)中的部分同源重组背景
(9)MMR缺陷酵母中的部分同源重组背景
(10)ND=未检测到菌落
将由BY06240转化得到的共计8个菌落随机分离并进行菌落PCR(lysis and Herculase PCR based on Cha and Thillyprotocol：Specificity,Efficiency and fidelity of PCR,in PCRprimer:Alaboratory Manual,Dieffenbach and Dveksler eds.1995,pp 37)。进行不同的PCR反应以验证片段正确插入靶区域。8个克隆中有7个显示正确的插入谱。由这7个给出清晰可用的测序用扩增产物。如果实际组装Oxa序列，则使用侧翼Oxa ORF的两个特异性引物的反应仅允许真正重组体的扩增。另外，所得产物为用于直接测序的正确底物。因此，测序阳性扩增产物(GATC)。
测序结果
测序8个克隆中的7个(其具有更清晰的阳性扩增信号)，获得5个可用序列。它们全部相应于来源于克隆OUL3‑05‑II、OUL3‑05‑III、OUL3‑05‑IV、OUL3‑05‑IX和OUL3‑05‑X的部分同源组装OXA11/OXA5/OXA7。
对于全部克隆以及退火的蛋白质的测序结果参见图8：OXA11/OXA5/OXA7的OUL3‑05‑II(SEQ ID NOs 42和43)、OUL3‑05‑III(SEQ ID NOs 44和45)、OUL3‑05‑IV(SEQ ID NOs46和47)、OUL3‑05‑IX(SEQ ID NOs 48和49)和OUL3‑05‑X(SEQID NOs 50和51)。
讨论
已证明该用趋异序列作为细胞组装的模板的有丝分裂MMR缺陷细胞和通过体内重组产生多样性的简单转化方法(图5、6和8)。
通过实施例1中所述的方法获得重组嵌合的复合模式，将至少17个不同长度的碎片延伸为800bp的一个单独的分子(即，克隆fe19(SEQ ID NO 27)和fe20(SEQ ID NO.28)。重组事件似乎发生在全部序列长度上。
另外，观察到相应于链模板之一的点状核苷酸置换作为关于ORF的读码框的多样性的重要来源(克隆fe19(SEQ ID NO.27)和fe20(SEQ ID NO.29)。
另外，如实施例2所示通过同时使用来自三个相关基因(OXA11、OXA7和OXA5)的序列，该重组方法产生来自超过两个相关基因的嵌合体(即，克隆OUL3‑05‑III和OUL3‑05‑IX)。这是重组来自若干基因的目标区域的高效方式，并代表基于体内嵌合基因文库的产生的新的趋异性来源。
没有一个重组克隆产生如通过翻译的DNA的电脑模拟分析(in silico analysis)所验证的截短的蛋白产物(图5、6和8)。
21个克隆中仅1个(fe15)显示亲代谱(数据未示出)。
嵌合现象和点状交换在蛋白质水平并非必然保守。的确，在重组后产生具有不同极性的新氨基酸，将新型潜在酶促蛋白质性能赋予到重组突变蛋白(即，克隆fe19(SEQ ID NO.27)和fe20(SEQ ID NO.29)。
与仅可以将奇数事件表现到文库的减数分裂重组方法相比，通过该方法产生重组体以使重组体文库更加丰富的一个非常吸引人的特性是不仅可以获得奇数个而且还可以获得偶数个重组事件(即，fe06(SEQ ID NO 7)、fe11(SEQ ID NO 13)、fe13(SEQ ID NO 17)、fe19(SEQ ID NO 27))。
在少许序列中观察到不涉及到亲代模板的一些点突变(即，fe16(SEQ ID NO 21)和fe17(SEQ ID NO 23)。在所有这些情况中，突变不改变所得ORF的阅读框。
实施例3
ADH 1
在第二实施例中，我们选择内源性DNA作为用于重组的靶标。乙醇脱氢酶1(ADH1)为在酵母酿酒酵母中生产乙醇的关键酶。其具有产生改善的Adh1变体的工业意义。
将来自Euroscarf的株BY06246和来自Euroscarf的W303用于该试验。
酿酒酵母ADH1基因已位于染色体XV上。因此，仅导入一种部分同源基因对于重组便是足够的。为了确保重组的重组体将不进一步突变，我们还再建了错配修复野生型。因此，我们另外地添加了包含功能性MSH2基因及其启动子和终止子区域的片段。
作为体细胞基因重组的伴侣，我们选择耐热克鲁维酵母菌(Kluyveromyces thermotholerans/Lachancea thermotolerans)的ADH1基因，其与酿酒酵母基因具有82%的同源性。设计两种片段。一种片段包含耐热克鲁维酵母菌ADH1基因的开放阅读框。在其3′端，设计包含来自TRP1基因的296bp终止子区域、包含283bp启动子的盒以及来自乳酸克鲁维酵母菌的第一743bp的URA3 ORF的片段。乳酸克鲁维酵母菌的URA3基因产物可互补酿酒酵母中ura3的缺陷。第二片段包括其余的160bp的URA3和URA3的223bp的终止子区域。该序列后面有468bp的内源性MSH2启动子和MSH2 ORF(2894bp)和242bp的TEF1终止子。所述片段通过403bp的序列(其与染色体XV上的插入位点的序列相同)侧连于3′侧。所有片段在Geneart合成。
由于ADH1‑URA3片段的3′端和URA3‑MSH2片段的5′端同源，所以两片段可以组装。组装后，发生与酿酒酵母ADH1基因的重组和整合步骤。
转化后随机分离若干克隆并制备DNA。测序ADH重组体的DNA。下划线的序列来源于ADH乳酸克鲁维酵母菌，其余来自于ADH酿酒酵母(参见图9)。