《ARYLOMYCINSA生物合成基因簇.pdf》由会员分享,可在线阅读,更多相关《ARYLOMYCINSA生物合成基因簇.pdf(60页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103160521 A (43)申请公布日 2013.06.19 CN 103160521 A *CN103160521A* (21)申请号 201110422201.7 (22)申请日 2011.12.15 CGMCC No.4027 2010.07.20 C12N 15/52(2006.01) C12N 15/53(2006.01) C12N 15/54(2006.01) C12N 15/31(2006.01) C12R 1/465(2006.01) (71)申请人 上海来益生物药物研究开发中心有 限责任公司 地址 201203 上海市浦东新区张江高科技园 区牛顿。
2、路 200 号 8 号楼 5 楼 申请人 上海交通大学 (72)发明人 靳旭 饶敏 魏维 戈梅 朱丽 陈玲玲 万明玉 (74)专利代理机构 上海华工专利事务所 31104 代理人 应云平 (54) 发明名称 arylomycins A 生物合成基因簇 (57) 摘要 本 发 明 公 开 了 由 Streptomyces parvus CGMCC No.4027 菌株产生的具有抗菌活性的抗生 素 -arylomycins A 的生物合成基因簇。整个 基因簇共包含 8 个基因 : 3 个 NRPS 基因 (aryA、 aryB、 aryD) ; 1 个后修饰基因 (aryC) ; 3 个前体合 成。
3、基因 (aryF、 aryG、 aryH) 以及 1 个 MbtH 基因 (aryE)。通过对上述生物合成基因的遗传操作可 阻断arylomycin A2和 arylomycinA4的合成。 本 发明所提供的基因也可以用来寻找和发现可用于 医药、 工业或农业的化合物或基因、 蛋白。 (83)生物保藏信息 (51)Int.Cl. 权利要求书 1 页 说明书 10 页 序列表 30 页 附图 18 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书10页 序列表30页 附图18页 (10)申请公布号 CN 103160521 A CN 103160521 A *。
4、CN103160521A* 1/1 页 2 1. 抗生素 arylomycins A 的生物合成基因簇, 其特征在于, 所述基因簇包含 8 个基因 : aryA 编码非核糖体肽合成酶 NRPS ; aryB 编码非核糖体肽合成酶 NRPS ; aryC 编码 P450 酶 ; aryD 编码非核糖体肽合成酶 NRPS ; aryE 编码 MbtH 家族蛋白 ; aryF 编码羟基扁桃酸合酶 Hmas ; aryG 编码羟基扁桃酸氧化酶 Hmo ; aryH 编码羟基苯甘氨酸氨基转移酶 HpgT。 2. 如权利要求 1 所述的基因簇, 其特征在于, 所述基因 aryA 位于 SEQ ID NO 。
5、: 1 所示的 核苷酸序列的第 3739-5493 个碱基处, 长度为 1755 个碱基对, 编码 584 个氨基酸。 3. 如权利要求 1 所述的基因簇, 其特征在于, 所述基因 aryB 位于 SEQ ID NO : 1 所示的 核苷酸序列的第 5481-15938 个碱基处, 长度为 10458 个碱基对, 编码 3485 个氨基酸。 4. 如权利要求 1 所述的基因簇, 其特征在于, 所述基因 aryC 位于 SEQ ID NO : 1 所示的 核苷酸序列的第 16567-17736 个碱基处, 长度为 1170 个碱基对, 编码 389 个氨基酸。 5. 如权利要求 1 所述的基因簇。
6、, 其特征在于, 所述基因 aryD 位于 SEQ ID NO : 1 所示的 核苷酸序列的第 17795-30688 个碱基处, 长度为 12894 个碱基对, 编码 4297 个氨基酸。 6. 如权利要求 1 所述的基因簇, 其特征在于, 所述基因 aryE 位于 SEQ ID NO : 1 所示的 核苷酸序列的第 30714-30935 个碱基处, 长度为 222 个碱基对, 编码 73 个氨基酸。 7. 如权利要求 1 所述的基因簇, 其特征在于, 所述基因 aryF 位于 SEQ ID NO : 1 所示的 核苷酸序列的第 30983-32047 个碱基处, 长度为 1065 个碱基。
7、对, 编码 354 个氨基酸。 8. 如权利要求 1 所述的基因簇, 其特征在于, 所述基因 aryG 位于 SEQ ID NO : 1 所示的 核苷酸序列的第 32044-33159 个碱基处, 长度为 1116 个碱基对, 编码 371 个氨基酸。 9. 如权利要求 1 所述的基因簇, 其特征在于, 所述基因 aryH 位于 SEQ ID NO : 1 所示的 核苷酸序列的第 33152-34501 个碱基处, 长度为 1350 个碱基对, 编码 449 个氨基酸。 10.如权利要求1所述的基因簇, 其特征在于, 所述基因簇的核苷酸序列如SEQ ID NO : 1 所示。 权 利 要 求 。
8、书 CN 103160521 A 2 1/10 页 3 arylomycins A 生物合成基因簇 技术领域 0001 本发明属于微生物基因工程领域, 具体地说, 是关于抗生素arylomycins A的生物 合成基因簇。 背景技术 0002 随着致病菌耐药性问题的日益严峻, 临床上对新抗生素的需求也显得更为迫切。 为了应对这一局面, 人们一方面对已有抗生素进行改造, 另一方面也加快了新型抗生素筛 选的步伐。Alexandra 等在 2002 年从 Streptomyces sp.T6075 分离得到了两组脂 肽类化合物 arylomycins, 包括 arylomycins A 和 aryl。
9、omycins B(Schimana, Gebhardt et al.2002)。 它们都属于六肽化合物, 含有相同肽链(D-Me-Ser-D-Ala-Gly-L-Me-Hpg-L-Ala- L-Tyr), 不同的是, arylomycins B 中的 Tyr 含有 -NO2取代基。最近, 我们从 Streptomyces parvus CGMCC No.4027 的发酵液中分离到了 arylomycin A2 和 arylomycin A4, 结构如图 1 所示。 0003 2004年, Mark Paetzel等获得了arylomycin A2与Escherichia coli I型信号肽。
10、 酶结合复合物 分辨率的晶体结构, 研究发现arylomycin A2的C端可与信号肽酶催化 活性中心的Ser和Lys残基侧链形成氢键, 同时arylomycin A2形成-折叠结构模拟信号 肽酶底物的结合(Paetzel, Goodall et al.2004)。 I型信号肽酶(SPase I, EC 3.4.21.89) 是一种广泛存在于真细菌细胞膜中的丝氨酸蛋白酶, 负责将前蛋白 N- 端的信号肽切除, 对 细菌的生存和生长至关重要。SPase I 被抑制后, 会造成分泌蛋白在细胞膜上的大量积累 并最终导致细菌死亡 (Dalbey and Wickner 1985)。一直以来, 病原菌蛋。
11、白酶抑制剂被认 为药物发展的一个方向, 但是对人体的毒害性降低了这些抑制剂最终成药的可能性。区别 于经典的 Ser/His/Asp 催化机制, SPase I 利用独特的 Ser/Lys 催化二元体机制, 这就意味 着 SPase I 抑制剂有着更高的特异性, 对真核细胞有着更低的毒性。同时, 由于催化活性中 心位于细胞膜外侧, I 型信号肽酶被认为是一种很有潜力的抗生素筛选靶标。虽然已经得 到了arylomycin A2与Escherichia coli SPase I结合复合物的晶体结构, 但在最初生物 活性研究中, arylomycins 只对 Streptococcuspneumoni。
12、a、 Staphylococcus epidermidis 及土壤微 生物 Rhodococcus opacus、 Brevibacillus brevis 有抗菌活性, 而对大多的病 原菌如 Staphylococcus aureus、 Escherichia coli 和 Pseudomonas aeruginosa 没有活 性, 这大大限制了其成为药物的可能性。但 2010 年有研究发现, Staphylococcus aureus、 Escherichia coli和Pseudomonas aeruginosa之所以对arylomycins表现出耐药性, 是由 于这些病原菌的SPase。
13、 I催化活性中心的Ser突变为Pro从而导致两者的亲和力降低。 通过 对自然界中厚壁菌门、 放线菌们、 变形菌门、 拟杆菌门及疣微菌门衣原体属中 SPase I 相应 位置 Pro 突变的分布研究表明, 很多自然界中的细菌不存在 Pro 突变而对 arylomycins 表 现为敏感, 如革兰氏阳性边病原菌 Streptococcus pneumoniae、 Streptococcus pyogenes、 S.haemolyticus 及革兰氏阴性病原菌 Chlamydia trachomatis 等 (Smith, Roberts et al.2010)。因此 arylomycins 作为广。
14、谱性抗生素有着广阔的应用前景。 说 明 书 CN 103160521 A 3 2/10 页 4 0004 除了加工与生存及生长相关蛋白, I 型信号肽酶与其它生命活动如细菌耐药性、 细 菌毒素的分泌等, 也有着密切关系。例如, 一些病原菌由于能分泌 - 内酰胺酶而对 - 内 酰胺类抗生素产生耐药性, 而研究表明 arylomycins 类似物 lipoglycopeptides 能抑制 S.aureus - 内酰胺酶的分泌 (Kulanthaivel, Kreuzman et al.2004)。因此除了直接作 为抗生素使用, arylomycins 还能够调节细菌毒性或者使得病原菌变得对其它抗。
15、生素敏感, 这将大大扩大 arylomycins 应用范围 (Roberts, Smith et al.2007)。 0005 迄今为止, 还没有 arylomycins 生物合成基因簇相关研究的报道。 发明内容 0006 本发明的目的是提供由Streptomyces parvus CGMCC No.4027菌株产生的具有抗 菌活性的抗生素 -arylomycins A 的生物合成基因簇。 0007 根据本发明, 抗生素 arylomycins A 的生物合成基因簇包含 8 个基因 : 0008 aryA 编码非核糖体肽合成酶 NRPS ; 0009 aryB 编码非核糖体肽合成酶 NRPS 。
16、; 0010 aryC 编码 P450 酶 ; 0011 aryD 编码非核糖体肽合成酶 NRPS ; 0012 aryE 编码 MbtH 家族蛋白 ; 0013 aryF 编码羟基扁桃酸合酶 Hmas ; 0014 aryG 编码羟基扁桃酸氧化酶 Hmo ; 0015 aryH 编码羟基苯甘氨酸氨基转移酶 HpgT。 0016 根据本发明, 所述基因 aryA 位于 SEQ ID NO : 1 所示的核苷酸序列的第 3739-5493 个碱基处, 长度为 1755 个碱基对, 编码 584 个氨基酸。 0017 根据本发明, 所述基因aryB位于SEQ ID NO : 1所示的核苷酸序列的第。
17、5481-15938 个碱基处, 长度为 10458 个碱基对, 编码 3485 个氨基酸。 0018 根 据 本 发 明, 所 述 基 因 aryC 位 于 SEQ ID NO : 1 所 示 的 核 苷 酸 序 列 的 第 16567-17736 个碱基处, 长度为 1170 个碱基对, 编码 389 个氨基酸。 0019 根 据 本 发 明, 所 述 基 因 aryD 位 于 SEQ ID NO : 1 所 示 的 核 苷 酸 序 列 的 第 17795-30688 个碱基处, 长度为 12894 个碱基对, 编码 4297 个氨基酸。 0020 根 据 本 发 明, 所 述 基 因 a。
18、ryE 位 于 SEQ ID NO : 1 所 示 的 核 苷 酸 序 列 的 第 30714-30935 个碱基处, 长度为 222 个碱基对, 编码 73 个氨基酸。 0021 根 据 本 发 明, 所 述 基 因 aryF 位 于 SEQ ID NO : 1 所 示 的 核 苷 酸 序 列 的 第 30983-32047 个碱基处, 长度为 1065 个碱基对, 编码 354 个氨基酸。 0022 根 据 本 发 明, 所 述 基 因 aryG 位 于 SEQ ID NO : 1 所 示 的 核 苷 酸 序 列 的 第 32044-33159 个碱基处, 长度为 1116 个碱基对, 编。
19、码 371 个氨基酸。 0023 根 据 本 发 明, 所 述 基 因 aryH 位 于 SEQ ID NO : 1 所 示 的 核 苷 酸 序 列 的 第 33152-34501 个碱基处, 长度为 1350 个碱基对, 编码 449 个氨基酸。 0024 根据本发明, 所述基因簇的核苷酸序列如 SEQ ID NO : 1 所示。 0025 本发明所提供的包含arylomycins A生物合成相关的所有基因和蛋白信息可以帮 助人们理解 arylomycins 类天然产物的生物合成机制, 为进一步遗传改造提供了材料和知 说 明 书 CN 103160521 A 4 3/10 页 5 识。 本发。
20、明所提供的基因也可以用来寻找和发现可用于医药、 工业或农业的化合物或基因、 蛋白。 附图说明 0026 图 1 为 arylomycin A2 及 arylomycin A4 的化学结构示意图。 0027 图 2 为本发明的 arylomycins A 生物合成基因簇结构示意图。 0028 图 3 为原始菌株及各突变株发酵液 HPLC 分析结果图。其中, I 为原始菌株, II 为 orf-1 敲除突变株, III 为 orf1 敲除突变株, IV 为 orf2 敲除突变株, V 为 aryA 敲除突变株, VI 为 aryB 敲除突变株, VII 为 aryC 敲除突变株, VIII 为 a。
21、ryD 敲除突变株。 0029 图 4 为 arylomycins A 中非天然氨基酸 HPG 的生物合成途径示意图。 0030 图 5 为原始菌株、 突变株及 HPG 补料后各菌株发酵液 HPLC 分析结果图。其中, I 为原始菌株, II 为 aryF 敲除突变株, III 为 aryG 敲除突变株, IV 为 aryH 敲除突变株, V 为 aryF 敲除突变株 HPG 补料, VI 为 aryG 敲除突变株 HPG 补料, VII 为 aryH 敲除突变株 HPG 补料。 0031 图 6 为 arylomycin A2 和 arylomycin A4 的生物合成过程示意图。 具体实施。
22、方式 0032 以下通过具体实施例对本发明作进一步说明。应理解, 以下实施例仅用于说明本 发明, 而不用于限定本发明的范围。 0033 本发明所用的菌种为Streptomycesparvus, 于2010年07月20日保藏于中国微生 物菌种保藏管理委员会普通微生物中心 (CGMCC), 保藏地址为北京市朝阳区北辰西路 1 号 院 3 号, 保藏号 CGMCC No.4027。 0034 本 发 明 中 所 涉 及 的 分 子 生 物 学 操 作 参 照 Practical Streptomyces Genetics(Norwich : John Innes Foundation, 2000)和。
23、 分子克隆 : 实验室手册 (New York : Cold Spring Harbor Laboratory, 2001) 等进行。 0035 实施例 1、 arylomycins 生物合成基因簇的克隆 0036 1.1、 Streptomyces parvus CGMCC No.4027 总 DNA 提取 0037 将新鲜S.parvus CGMCC No.4027斜面孢子接种到3ml TSB培养基中, 28, 220rpm 振荡培养 30h。取 2ml 至 2ml 离心管中, 12000rpm 离心 10min, 用无菌水洗涤一次, 菌丝体 重悬于 250l SET, 并加入溶菌酶至终浓。
24、度 4mg/ml, 37水浴 40 60min。加入 50l 10 SDS 和 2.5l 10mg/ml 蛋白酶 K, 于 55水浴 2h, 期间不断震荡。然后加入 200l 5mol/LNaCl 和 500l 氯仿, 混匀, 室温放置 30min, 12000rpm 离心 15min。取上清, 加入 1ml 异丙醇, 12000rpm 离心 5min, 沉淀用 70乙醇洗涤一次并抽干, 加入 100l TE 缓冲溶液 于 -20保存。 0038 1.2、 arylomycins 生物合成基因簇的克隆 0039 微生物代谢具有多样性, 随着越来越多次级代谢产物生物合成基因簇的获得, 发现不同的。
25、微生物的基因组中也会含有相同化合物的合成基因簇。如 A21978C 产生菌 Streptomyces roseosporus NRRL 15998 虽然没有报道其能够产生核苷肽类抗生素, 但在 其基因组中发现了类似负责Pacidamycin生物合成的基因簇(Zhang, Ostash et al.2010)。 说 明 书 CN 103160521 A 5 4/10 页 6 0040 已知Streptomycesparvus CGMCC No.4027也能够产生A21978C系列物质, 另外还 发现其可以产生arylomycins类代谢产物。 在对已经公开的A21978C产生菌Streptomy。
26、ces roseosporus NRRL15998 的基因组进行分析的过程中, 发现基因 SSGG_05586-SSGG_05590 编码非核糖体肽合成酶 (NRPS), 其中模块组成、 异构化 (E) 结构域及甲基化 (M) 结构域 与 arylomycins 结构中肽链组成对应, 因此其可能与 arylomycins 基因簇类似。根据 SSGG_05586-SSGG_05590 上下游序列, 利用 Vector NTI 软件设计引物, 以 1.1 中制备的 S.parvus CGMCC No.4027 染色体为模板逐段 PCR。 0041 PCR 反应体系 (50l) 包括 PrimerS。
27、TAR HS DNA 聚合酶 (2.5U/l)0.5l、 2GC 缓冲液 25l、 dNTP( 浓度各为 2.5mM)4l、 引物 (20mM) 各 0.5l、 Streptomyces parvus CGMCC No.4027总DNA 1l、 dH2O 18.5l。 反应条件为 : 94预变性3min ; 94变性1min, 58 68复性 30s, 72延伸 2.5min, 共 30 个循环 ; 最后 72延伸 10min。 0042 低熔点胶回收预期大小 DNA 片段, 与 pMD18-T simple Vector 连接, 转化 E.coli DH5, 涂布于含有 100g/ml 氨苄。
28、青霉素的 LB 平板上, 37培养。挑取单菌落过夜培养, 抽提质粒, 根据大小将可能含有预期大小 DNA 片段的质粒测序。 0043 引物序列及 PCR 产物大小如表 1 所示。最终将所得 16 个片段拼接起来, 所得序列 总长为 39503bp, GC 含量为 71.9。核苷酸序列如 SEQ ID NO : 1 所示。 0044 表 1、 引物序列及 PCR 产物大小 0045 0046 说 明 书 CN 103160521 A 6 5/10 页 7 0047 实施例 2、 arylomycins 生物合成基因簇功能分析 0048 通过生物信息学分析, 所得序列共包含 17 个开放阅读框, 。
29、如图 2 所示。包含 3 个 功能未知基因 (orf-1、 orf-2、 orf-3), 3 个 NRPS 基因 (aryA、 aryB、 aryD), 1 个后修饰基因 (aryC), 3 个前体合成基因 (aryF、 aryG、 aryH), 1 个 MbtH 基因 (aryE), 2 个 ABC 转运相关基 因 (orf1、 orf2), 3 个与细菌外被膜形成相关基因 (orf3、 orf4、 orf5), 详细分析结果如表 2 所示。 0049 表 2、 arylomycins 生物合成基因簇生物信息学分析 0050 0051 说 明 书 CN 103160521 A 7 6/10 。
30、页 8 0052 实施例 3、 arylomycins A 生物合成基因簇边界确定 0053 3.1、 S.parvus CGMCC No.4027 遗传转移系统的建立 0054 将含有待接合转移质粒的 E.coli ET1256737过夜培养, 取 200l 菌液至装有 20ml LB 培养基的 250ml 三角瓶中, 37培养 3 4h 至 OD600达到 0.5 左右。然后将菌液转 移至50ml离心管中4000rpm离心5min收集菌体, 并用等体积的新鲜LB洗涤两次, 然后重悬 于2ml LB中, 作为大肠杆菌供体细胞。 取-70保存的S.parvus CGMCC No.4027孢子悬。
31、液 一管8000rpm离心2min, 去上清, 用1ml的2YT培养基洗涤两次, 重悬于500l 2YT培 养基中, 50水浴 10min。待冷却后加入 500l 大肠杆菌供体细胞, 混匀, 涂布于含有 10mM MgCl2的 MS 平板上, 28培养 16 20h。在平板表面覆盖 1ml 无菌水 ( 含 0.5mg/ml 萘啶 酮酸和 1mg/ml 安普霉素 ), 用涂布棒涂匀并吹干, 28培养 3 4 天。挑取接合子进行筛选 验证。 0055 3.2、 基因 orf-1 缺失突变株的构建 0056 设计引物 orf-1_u-F(5 -aagcttgacacgttgcccggcaagag-3。
32、 )、 orf-1_u-R(5 -ctgc agaccccgtcggcaacttcgtc-3 ), 和引物 orf-1_d-F(5 -ctgcagcgaagctcaaggaatccgac-3 )、 orf-1_d-R(5 -gaattcagctgacgcagacgctgac-3 ) 分别 PCR 扩增 orf-1 的上、 下游片段 orf-1_u、 orf-1_d。PCR 产物回收后分别与 pMD18-T 载体连接, 转化 E.coli DH5 提取质 粒并测序验证。然后 pMD18-T-orf-1_u 质粒经 HindIII 和 Pst I 酶切, 回收 orf-1_u 片段 ; pMD18。
33、-T-orf-1_d 质粒用 Pst I 和 EcoR I 酶切, 回收 orf-1_d 片段 ; orf-1_u、 orf-1_d 与经 过 HindIII 和 EcoR I 酶切的 pKC1139 连接得到重组质粒 pKC1139-orf-1_u-orf-1_d。重组 质粒转化 E.coli ET12567 后按 3.1 中所述接合转移方法导入 S.parvus CGMCC No.4027。 0057 挑取接合子至含 50g/ml 安普霉素的 MS 平板 37培养 2 3 天。然后挑取单菌 落接种于液体 TSB 培养基, 28培养三代。菌液适当稀释后涂布于 MS 平板, 挑选对安普霉 素敏。
34、感的单菌落, 利用引物 orf-1-F(5 -ccttccgcgagatcttcgatcttc-3 )、 orf-1-R(5 -ga ttccttgagcttcgccgcag-3 ) 进行 PCR 验证。 0058 3.3、 基因 orf1 和 orf2 缺失突变株构建 0059 基因 orf1 和 orf2 缺失突变株的构建方法与 3.2 中 orf-1 缺失突变株的构建方法 相同, 只是所用引物不同, 具体情况如表 3 所示。 0060 表 3、 基因 orf1 和 orf2 缺失突变株构建和验证引物 0061 说 明 书 CN 103160521 A 8 7/10 页 9 0062 3.。
35、4、 S.parvus CGMCC No.4027 及相关突变株液体发酵及 HPLC 分析 0063 3.4.1、 液体发酵 0064 将 S.parvus CGMCC No.4027 及相关突变株的新鲜斜面孢子 ( 高氏一号斜面培养 基 ) 接种于种子培养基 ( 葡萄糖 1, 糊精 4, 黄豆饼粉 2, 磷酸二氢钾 0.02, 氯化钠 0.25, pH 7.3 7.5), 28, 220rpm 振荡培养 44h。然后以 8接种量转入液体发酵培养 基 ( 黄豆饼粉 2.2, 糊精 3.6, 葡萄糖 0.8, 磷酸二氢钾 0.02, pH 7.3 7.5), 28, 220rpm 振荡培养 5 。
36、天。 0065 3.4.2、 发酵液处理 0066 取 800l 3.4.1 中获得的发酵液, 然后加入等体积的无水甲醇, 混匀, 4放置 30min, 12000rpm 离心 15min。取上清进行 HPLC 分析。 0067 3.4.3、 HPLC 分析 0068 对 3.4.2 中获得的发酵液进行 HPLC 分析, 具体条件如下 : 0069 流动相 : A 相 : 乙腈 - 缓冲液 (10 90) 0070 B 相 : 乙腈 - 缓冲液 (45 55) 0071 缓冲液 : 0.5 (NH4)H2PO4 0072 分析用柱 : Hypersil C18, 4.6250mm, 5m 00。
37、73 柱温 : 30 0074 检测波长 : 223nm 0075 流速 : 1.5mL/min 0076 梯度条件如表所示 : 0077 时间 (min) 0 15 17 A 25 0 0 B 75 100 100 0078 3.5、 arylomycins A 生物合成基因簇边界确定 0079 根据基因编码的蛋白功能分析, arylomycins A 生物合成基因簇左侧边界研究集 中在 aryA 基因上游, orf-1、 orf-2、 orf-3 编码 3 个未知功能蛋白, 和原始菌株相比 ( 图 说 明 书 CN 103160521 A 9 8/10 页 10 3I), 对 orf-1 。
38、基因的敲除不影响 arylomycins 合成 ( 图 3II), 表明其与 arylomycins 生物 合成无关。arylomycins 的生物合成基因簇右侧边界研究集中在 aryH 下游, orf1、 orf2 分 别编码 ABC 转运 ATP 结合蛋白、 ABC 转运透性酶, orf1、 orf2 敲除后, 影响到其它化合物的 合成, 其中 orf1 突变株很多化合物不能合成 ( 图 3III), 而 orf2 突变株很多化合物的产量 降低 ( 图 3IV), 同时突变株的色素产量提高, 产孢能力减弱。因此 orf1、 orf2 两个基因并 非仅仅与 arylomycins 相关, 排。
39、除在基因簇之外。orf3、 orf4、 orf5 三个基因分别编码分泌 蛋白、 聚谷氨酸合成蛋白PgsC、 荚膜合成蛋白CapB, 它们与细菌外被膜的形成有关, 而与 arylomycins 合成无关。因此, 最终将 arylomycins A 生物合成基因簇确定为 aryA-aryH, 共 8 个开放阅读框。 0080 实施例 4、 arylomycins A 生物合成基因簇中功能基因的鉴定 0081 arylomycins A 生物合成基因簇包含 aryA-aryH 共 8 个基因, 其中 3 个 NRPS 基因 (aryA、 aryB、 aryD) 分别编码非核糖体肽合酶 NRPS, 负。
40、责 arylomycins 中非核糖体合成六 肽(D-Me-Ser-D-Ala-Gly-L-Me-Hpg-L-Ala-L-Tyr)的合成 ; 3个前体合成基因(aryF、 aryG、 aryH) 分别编码羟基扁桃酸合酶 Hmas、 羟基扁桃酸氧化酶 Hmo、 羟基苯甘氨酸氨基转移酶 HpgT, 负责非天然氨基酸对羟基苯甘氨酸 (HPG) 的合成 ; 1 个后修饰基因 (aryC) 编码 P450 酶, 负责甲基 HPG 与 Tyr 酪氨酸之间联芳键的合成。 0082 另外, 基因簇中还有 1 个编码 MbtH 家族蛋白基因 (aryE), MbtH 家族蛋白通常与 NRPS 连锁, 具有反式互。
41、补特性, 其中一个 MbtH 敲除后会被基因组其它位置编码的 相应蛋 白互补。Felnagle E.A 等研究表明 MbtH 蛋白可能影响氨基酸的活化, 是 NRPS 的构成部分 (Felnagle, Barkei et al.2010)。 为了确定除了aryE以外的aryA-aryD和aryF-aryG确实 负责 arylomycins A 的生物合成, 按照 3.2 中所述的方法构建基因 aryA、 aryB、 aryC、 aryD、 aryF、 aryG、 aryH 缺失突变株, 引物如表 4 所示。 0083 表 4、 基因 aryA-aryD 和 aryF-aryH 缺失突变株构建和。
42、验证引物 0084 说 明 书 CN 103160521 A 10 9/10 页 11 0085 按照 3.4 中所述的方法检测野生菌株和各缺失突变株的发酵产物, 发现当 aryA( 图 3V)、 aryB( 图 3VI)、 aryC( 图 3VII)、 aryD( 图 3VIII)、 aryF( 图 5II)、 aryG( 图 5III)、 aryH( 图 5IV) 基因阻断后影响到菌株 arylomycin A2 和 arylomycin A4 的产生, 进 一步证明得到的基因簇为 arylomycins A 生物合成基因簇。 0086 实施例 5、 Arylomycins A 中非天然氨。
43、基酸 HPG 的生物合成 0087 在 arylomycins A 生物合成基因簇中, aryF、 aryG、 aryH 分别编码羟基扁桃酸合酶 (Hmas)、 羟基扁桃酸氧化酶(Hmo)、 羟基苯甘氨酸氨基转移酶(HpgT)。 arylomycin中HPG的 生物合成途径如图 4 所示。4- 羟基丙酮酸在 Hmas 的作用下氧化脱羧产生 4- 羟基扁桃酸, 4-羟基扁桃酸被Hmo氧化生成4羟基苯乙醛酸, 然后通过HpgT转氨作用生成对羟基苯甘氨 酸。 0088 aryF、 aryG、 aryH基因敲除后, 菌株不能产生arylomycin A2和arylomycin A4。 当 在发酵液中外。
44、源添加 HPG 时, aryF( 图 5V)、 aryG( 图 5VI)、 aryH( 图 5VII) 基因突变菌株恢 复产生 arylomycin A2 和 arylomycin A4, 进一步证明了 aryF、 aryG、 aryH 编码蛋白 AryF、 说 明 书 CN 103160521 A 11 10/10 页 12 AryG、 AryH 负责非天然氨基酸 HPG 的生物合成。 0089 实施例 6、 arylomycins A 骨架合成及后修饰反应 0090 在 arylomycins A 生物合成基因簇中有三个基因 (ayrA、 aryB、 aryD) 负责编码 arylomyc。
45、ins 骨架组装相关的非核糖体肽合成酶 NRPS(AryA、 AryB、 AryD), NRPS 由多模块组 成, 模块的特异性结构域具有特定的活性。AryA 含有 1 个结构域 (C) ; AryB 含有两个模块 M1(C-A-M-T-E)和M2(C-A-T-E), 共9个结构域 ; AryD含有4个模块M3*(A-T)、 M4(C-A-M-T)、 M5(C-A-T) 和 M6(C-A-T-Te), 共 13 个结构域 ; 其中 AryA 编码的 C 结构域与 M3*(A-T) 相互 作用够成一个完整的模块 M3(C-A-T)。模块 M1-M6 中的 A 结构域分别负责 Ser、 Ala、 。
46、Gly、 Hpg、 Ala、 Tyr 的腺苷酰化激活和装载, 模块 M1 和 M4 中的 M 结构域负责 Ser 和 Hpg 的 N- 甲 基化修饰, 模块 M1 和 M2 中的 E 结构域分别负责 Ser、 Ala 的异构化。M1 为起始模块, 其中的 C 结构域将活化的脂肪酸链与第一个氨基酸 D-Me-Ser 通过酰胺键连接。然后, 延伸模块通 过各自的 C 结构域与上游的酰基发生缩合组装成 arylomycin A 骨架, 最终通过模块 M6 中 的 Te 结构域将其从 NRPS 上分离下来。游离线性脂肽中的 HPG 和 Tyr 进一步在 AryD 的催 化作用下形成联芳键产生完整的 a。
47、rylomycins 化合物。整个过程如图 6 所示。 说 明 书 CN 103160521 A 12 1/30 页 13 0001 0002 序 列 表 CN 103160521 A 13 2/30 页 14 0003 序 列 表 CN 103160521 A 14 3/30 页 15 0004 序 列 表 CN 103160521 A 15 4/30 页 16 0005 序 列 表 CN 103160521 A 16 5/30 页 17 0006 序 列 表 CN 103160521 A 17 6/30 页 18 0007 序 列 表 CN 103160521 A 18 7/30 页 19。
48、 0008 序 列 表 CN 103160521 A 19 8/30 页 20 0009 序 列 表 CN 103160521 A 20 9/30 页 21 0010 序 列 表 CN 103160521 A 21 10/30 页 22 0011 序 列 表 CN 103160521 A 22 11/30 页 23 0012 序 列 表 CN 103160521 A 23 12/30 页 24 0013 序 列 表 CN 103160521 A 24 13/30 页 25 0014 序 列 表 CN 103160521 A 25 14/30 页 26 0015 序 列 表 CN 103160521 A 26 15/30 页 27 0016 序 列 表 CN 103160521 A 27 16/30 页 28 0017 序 列 表 CN 103160521 A 28 17/30 页 29 0018 序 列 表 CN 103160521 A 29 18/30 页 30 0019 序 列 表 CN 103160521 A 30 19/30 页 31 0020 序 列 表 CN 103160521 A 31 20/30 页 32 0021 序 列 表 CN 103160521 A 32 21/30 页 33 0。