书签分享收藏举报版权申诉 / 60

立即下载加入VIP,免费下载

当前位置：首页 > 化学；冶金 > 生物化学；啤酒；烈性酒；果汁酒；醋；微生物学；酶学；突变或遗传工程 > ARYLOMYCINSA生物合成基因簇.pdf

ARYLOMYCINSA生物合成基因簇.pdf

上传人：bo****18

文档编号：5322726

上传时间：2019-01-05

格式：PDF

页数：60

大小：3.21MB

《ARYLOMYCINSA生物合成基因簇.pdf》由会员分享，可在线阅读，更多相关《ARYLOMYCINSA生物合成基因簇.pdf（60页完整版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 103160521 A (43)申请公布日 2013.06.19 CN 103160521 A *CN103160521A* (21)申请号 201110422201.7 (22)申请日 2011.12.15 CGMCC No.4027 2010.07.20 C12N 15/52(2006.01) C12N 15/53(2006.01) C12N 15/54(2006.01) C12N 15/31(2006.01) C12R 1/465(2006.01) (71)申请人上海来益生物药物研究开发中心有限责任公司地址 201203 上海市浦东新区张江高科技园区牛顿。

2、路 200 号 8 号楼 5 楼申请人上海交通大学 (72)发明人靳旭饶敏魏维戈梅朱丽陈玲玲万明玉 (74)专利代理机构上海华工专利事务所 31104 代理人应云平 (54) 发明名称 arylomycins A 生物合成基因簇 (57) 摘要本发明公开了由 Streptomyces parvus CGMCC No.4027 菌株产生的具有抗菌活性的抗生素 -arylomycins A 的生物合成基因簇。整个基因簇共包含 8 个基因： 3 个 NRPS 基因 (aryA、 aryB、 aryD) ； 1 个后修饰基因 (aryC) ； 3 个前体合成。

3、基因 (aryF、 aryG、 aryH) 以及 1 个 MbtH 基因 (aryE)。通过对上述生物合成基因的遗传操作可阻断arylomycin A2和 arylomycinA4的合成。本发明所提供的基因也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。 (83)生物保藏信息 (51)Int.Cl. 权利要求书 1 页说明书 10 页序列表 30 页附图 18 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书1页说明书10页序列表30页附图18页 (10)申请公布号 CN 103160521 A CN 103160521 A *。

4、CN103160521A* 1/1 页 2 1. 抗生素 arylomycins A 的生物合成基因簇，其特征在于，所述基因簇包含 8 个基因： aryA 编码非核糖体肽合成酶 NRPS ； aryB 编码非核糖体肽合成酶 NRPS ； aryC 编码 P450 酶； aryD 编码非核糖体肽合成酶 NRPS ； aryE 编码 MbtH 家族蛋白； aryF 编码羟基扁桃酸合酶 Hmas ； aryG 编码羟基扁桃酸氧化酶 Hmo ； aryH 编码羟基苯甘氨酸氨基转移酶 HpgT。 2. 如权利要求 1 所述的基因簇，其特征在于，所述基因 aryA 位于 SEQ ID NO 。

5、： 1 所示的核苷酸序列的第 3739-5493 个碱基处，长度为 1755 个碱基对，编码 584 个氨基酸。 3. 如权利要求 1 所述的基因簇，其特征在于，所述基因 aryB 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 5481-15938 个碱基处，长度为 10458 个碱基对，编码 3485 个氨基酸。 4. 如权利要求 1 所述的基因簇，其特征在于，所述基因 aryC 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 16567-17736 个碱基处，长度为 1170 个碱基对，编码 389 个氨基酸。 5. 如权利要求 1 所述的基因簇。

6、，其特征在于，所述基因 aryD 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 17795-30688 个碱基处，长度为 12894 个碱基对，编码 4297 个氨基酸。 6. 如权利要求 1 所述的基因簇，其特征在于，所述基因 aryE 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 30714-30935 个碱基处，长度为 222 个碱基对，编码 73 个氨基酸。 7. 如权利要求 1 所述的基因簇，其特征在于，所述基因 aryF 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 30983-32047 个碱基处，长度为 1065 个碱基。

7、对，编码 354 个氨基酸。 8. 如权利要求 1 所述的基因簇，其特征在于，所述基因 aryG 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 32044-33159 个碱基处，长度为 1116 个碱基对，编码 371 个氨基酸。 9. 如权利要求 1 所述的基因簇，其特征在于，所述基因 aryH 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 33152-34501 个碱基处，长度为 1350 个碱基对，编码 449 个氨基酸。 10.如权利要求1所述的基因簇，其特征在于，所述基因簇的核苷酸序列如SEQ ID NO ： 1 所示。权利要求。

8、书 CN 103160521 A 2 1/10 页 3 arylomycins A 生物合成基因簇技术领域 0001 本发明属于微生物基因工程领域，具体地说，是关于抗生素arylomycins A的生物合成基因簇。背景技术 0002 随着致病菌耐药性问题的日益严峻，临床上对新抗生素的需求也显得更为迫切。为了应对这一局面，人们一方面对已有抗生素进行改造，另一方面也加快了新型抗生素筛选的步伐。Alexandra 等在 2002 年从 Streptomyces sp.T6075 分离得到了两组脂肽类化合物 arylomycins，包括 arylomycins A 和 aryl。

9、omycins B(Schimana， Gebhardt et al.2002)。它们都属于六肽化合物，含有相同肽链(D-Me-Ser-D-Ala-Gly-L-Me-Hpg-L-Ala- L-Tyr)，不同的是， arylomycins B 中的 Tyr 含有 -NO2取代基。最近，我们从 Streptomyces parvus CGMCC No.4027 的发酵液中分离到了 arylomycin A2 和 arylomycin A4，结构如图 1 所示。 0003 2004年， Mark Paetzel等获得了arylomycin A2与Escherichia coli I型信号肽。

10、酶结合复合物分辨率的晶体结构，研究发现arylomycin A2的C端可与信号肽酶催化活性中心的Ser和Lys残基侧链形成氢键，同时arylomycin A2形成-折叠结构模拟信号肽酶底物的结合(Paetzel， Goodall et al.2004)。 I型信号肽酶(SPase I， EC 3.4.21.89) 是一种广泛存在于真细菌细胞膜中的丝氨酸蛋白酶，负责将前蛋白 N- 端的信号肽切除，对细菌的生存和生长至关重要。SPase I 被抑制后，会造成分泌蛋白在细胞膜上的大量积累并最终导致细菌死亡 (Dalbey and Wickner 1985)。一直以来，病原菌蛋。

11、白酶抑制剂被认为药物发展的一个方向，但是对人体的毒害性降低了这些抑制剂最终成药的可能性。区别于经典的 Ser/His/Asp 催化机制， SPase I 利用独特的 Ser/Lys 催化二元体机制，这就意味着 SPase I 抑制剂有着更高的特异性，对真核细胞有着更低的毒性。同时，由于催化活性中心位于细胞膜外侧， I 型信号肽酶被认为是一种很有潜力的抗生素筛选靶标。虽然已经得到了arylomycin A2与Escherichia coli SPase I结合复合物的晶体结构，但在最初生物活性研究中， arylomycins 只对 Streptococcuspneumoni。

12、a、 Staphylococcus epidermidis 及土壤微生物 Rhodococcus opacus、 Brevibacillus brevis 有抗菌活性，而对大多的病原菌如 Staphylococcus aureus、 Escherichia coli 和 Pseudomonas aeruginosa 没有活性，这大大限制了其成为药物的可能性。但 2010 年有研究发现， Staphylococcus aureus、 Escherichia coli和Pseudomonas aeruginosa之所以对arylomycins表现出耐药性，是由于这些病原菌的SPase。

13、 I催化活性中心的Ser突变为Pro从而导致两者的亲和力降低。通过对自然界中厚壁菌门、放线菌们、变形菌门、拟杆菌门及疣微菌门衣原体属中 SPase I 相应位置 Pro 突变的分布研究表明，很多自然界中的细菌不存在 Pro 突变而对 arylomycins 表现为敏感，如革兰氏阳性边病原菌 Streptococcus pneumoniae、 Streptococcus pyogenes、 S.haemolyticus 及革兰氏阴性病原菌 Chlamydia trachomatis 等 (Smith， Roberts et al.2010)。因此 arylomycins 作为广。

14、谱性抗生素有着广阔的应用前景。说明书 CN 103160521 A 3 2/10 页 4 0004 除了加工与生存及生长相关蛋白， I 型信号肽酶与其它生命活动如细菌耐药性、细菌毒素的分泌等，也有着密切关系。例如，一些病原菌由于能分泌 - 内酰胺酶而对 - 内酰胺类抗生素产生耐药性，而研究表明 arylomycins 类似物 lipoglycopeptides 能抑制 S.aureus - 内酰胺酶的分泌 (Kulanthaivel， Kreuzman et al.2004)。因此除了直接作为抗生素使用， arylomycins 还能够调节细菌毒性或者使得病原菌变得对其它抗。

15、生素敏感，这将大大扩大 arylomycins 应用范围 (Roberts， Smith et al.2007)。 0005 迄今为止，还没有 arylomycins 生物合成基因簇相关研究的报道。发明内容 0006 本发明的目的是提供由Streptomyces parvus CGMCC No.4027菌株产生的具有抗菌活性的抗生素 -arylomycins A 的生物合成基因簇。 0007 根据本发明，抗生素 arylomycins A 的生物合成基因簇包含 8 个基因： 0008 aryA 编码非核糖体肽合成酶 NRPS ； 0009 aryB 编码非核糖体肽合成酶 NRPS 。

16、； 0010 aryC 编码 P450 酶； 0011 aryD 编码非核糖体肽合成酶 NRPS ； 0012 aryE 编码 MbtH 家族蛋白； 0013 aryF 编码羟基扁桃酸合酶 Hmas ； 0014 aryG 编码羟基扁桃酸氧化酶 Hmo ； 0015 aryH 编码羟基苯甘氨酸氨基转移酶 HpgT。 0016 根据本发明，所述基因 aryA 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 3739-5493 个碱基处，长度为 1755 个碱基对，编码 584 个氨基酸。 0017 根据本发明，所述基因aryB位于SEQ ID NO ： 1所示的核苷酸序列的第。

17、5481-15938 个碱基处，长度为 10458 个碱基对，编码 3485 个氨基酸。 0018 根据本发明，所述基因 aryC 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 16567-17736 个碱基处，长度为 1170 个碱基对，编码 389 个氨基酸。 0019 根据本发明，所述基因 aryD 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 17795-30688 个碱基处，长度为 12894 个碱基对，编码 4297 个氨基酸。 0020 根据本发明，所述基因 a。

18、ryE 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 30714-30935 个碱基处，长度为 222 个碱基对，编码 73 个氨基酸。 0021 根据本发明，所述基因 aryF 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 30983-32047 个碱基处，长度为 1065 个碱基对，编码 354 个氨基酸。 0022 根据本发明，所述基因 aryG 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 32044-33159 个碱基处，长度为 1116 个碱基对，编。

19、码 371 个氨基酸。 0023 根据本发明，所述基因 aryH 位于 SEQ ID NO ： 1 所示的核苷酸序列的第 33152-34501 个碱基处，长度为 1350 个碱基对，编码 449 个氨基酸。 0024 根据本发明，所述基因簇的核苷酸序列如 SEQ ID NO ： 1 所示。 0025 本发明所提供的包含arylomycins A生物合成相关的所有基因和蛋白信息可以帮助人们理解 arylomycins 类天然产物的生物合成机制，为进一步遗传改造提供了材料和知说明书 CN 103160521 A 4 3/10 页 5 识。本发。

20、明所提供的基因也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。附图说明 0026 图 1 为 arylomycin A2 及 arylomycin A4 的化学结构示意图。 0027 图 2 为本发明的 arylomycins A 生物合成基因簇结构示意图。 0028 图 3 为原始菌株及各突变株发酵液 HPLC 分析结果图。其中， I 为原始菌株， II 为 orf-1 敲除突变株， III 为 orf1 敲除突变株， IV 为 orf2 敲除突变株， V 为 aryA 敲除突变株， VI 为 aryB 敲除突变株， VII 为 aryC 敲除突变株， VIII 为 a。

21、ryD 敲除突变株。 0029 图 4 为 arylomycins A 中非天然氨基酸 HPG 的生物合成途径示意图。 0030 图 5 为原始菌株、突变株及 HPG 补料后各菌株发酵液 HPLC 分析结果图。其中， I 为原始菌株， II 为 aryF 敲除突变株， III 为 aryG 敲除突变株， IV 为 aryH 敲除突变株， V 为 aryF 敲除突变株 HPG 补料， VI 为 aryG 敲除突变株 HPG 补料， VII 为 aryH 敲除突变株 HPG 补料。 0031 图 6 为 arylomycin A2 和 arylomycin A4 的生物合成过程示意图。具体实施。

22、方式 0032 以下通过具体实施例对本发明作进一步说明。应理解，以下实施例仅用于说明本发明，而不用于限定本发明的范围。 0033 本发明所用的菌种为Streptomycesparvus，于2010年07月20日保藏于中国微生物菌种保藏管理委员会普通微生物中心 (CGMCC)，保藏地址为北京市朝阳区北辰西路 1 号院 3 号，保藏号 CGMCC No.4027。 0034 本发明中所涉及的分子生物学操作参照 Practical Streptomyces Genetics(Norwich ： John Innes Foundation， 2000)和。

23、分子克隆：实验室手册 (New York ： Cold Spring Harbor Laboratory， 2001) 等进行。 0035 实施例 1、 arylomycins 生物合成基因簇的克隆 0036 1.1、 Streptomyces parvus CGMCC No.4027 总 DNA 提取 0037 将新鲜S.parvus CGMCC No.4027斜面孢子接种到3ml TSB培养基中， 28， 220rpm 振荡培养 30h。取 2ml 至 2ml 离心管中， 12000rpm 离心 10min，用无菌水洗涤一次，菌丝体重悬于 250l SET，并加入溶菌酶至终浓。

24、度 4mg/ml， 37水浴 40 60min。加入 50l 10 SDS 和 2.5l 10mg/ml 蛋白酶 K，于 55水浴 2h，期间不断震荡。然后加入 200l 5mol/LNaCl 和 500l 氯仿，混匀，室温放置 30min， 12000rpm 离心 15min。取上清，加入 1ml 异丙醇， 12000rpm 离心 5min，沉淀用 70乙醇洗涤一次并抽干，加入 100l TE 缓冲溶液于 -20保存。 0038 1.2、 arylomycins 生物合成基因簇的克隆 0039 微生物代谢具有多样性，随着越来越多次级代谢产物生物合成基因簇的获得，发现不同的。

25、微生物的基因组中也会含有相同化合物的合成基因簇。如 A21978C 产生菌 Streptomyces roseosporus NRRL 15998 虽然没有报道其能够产生核苷肽类抗生素，但在其基因组中发现了类似负责Pacidamycin生物合成的基因簇(Zhang， Ostash et al.2010)。说明书 CN 103160521 A 5 4/10 页 6 0040 已知Streptomycesparvus CGMCC No.4027也能够产生A21978C系列物质，另外还发现其可以产生arylomycins类代谢产物。在对已经公开的A21978C产生菌Streptomy。

26、ces roseosporus NRRL15998 的基因组进行分析的过程中，发现基因 SSGG_05586-SSGG_05590 编码非核糖体肽合成酶 (NRPS)，其中模块组成、异构化 (E) 结构域及甲基化 (M) 结构域与 arylomycins 结构中肽链组成对应，因此其可能与 arylomycins 基因簇类似。根据 SSGG_05586-SSGG_05590 上下游序列，利用 Vector NTI 软件设计引物，以 1.1 中制备的 S.parvus CGMCC No.4027 染色体为模板逐段 PCR。 0041 PCR 反应体系 (50l) 包括 PrimerS。

27、TAR HS DNA 聚合酶 (2.5U/l)0.5l、 2GC 缓冲液 25l、 dNTP( 浓度各为 2.5mM)4l、引物 (20mM) 各 0.5l、 Streptomyces parvus CGMCC No.4027总DNA 1l、 dH2O 18.5l。反应条件为： 94预变性3min ； 94变性1min， 58 68复性 30s， 72延伸 2.5min，共 30 个循环；最后 72延伸 10min。 0042 低熔点胶回收预期大小 DNA 片段，与 pMD18-T simple Vector 连接，转化 E.coli DH5，涂布于含有 100g/ml 氨苄。

28、青霉素的 LB 平板上， 37培养。挑取单菌落过夜培养，抽提质粒，根据大小将可能含有预期大小 DNA 片段的质粒测序。 0043 引物序列及 PCR 产物大小如表 1 所示。最终将所得 16 个片段拼接起来，所得序列总长为 39503bp， GC 含量为 71.9。核苷酸序列如 SEQ ID NO ： 1 所示。 0044 表 1、引物序列及 PCR 产物大小 0045 0046 说明书 CN 103160521 A 6 5/10 页 7 0047 实施例 2、 arylomycins 生物合成基因簇功能分析 0048 通过生物信息学分析，所得序列共包含 17 个开放阅读框，。

29、如图 2 所示。包含 3 个功能未知基因 (orf-1、 orf-2、 orf-3)， 3 个 NRPS 基因 (aryA、 aryB、 aryD)， 1 个后修饰基因 (aryC)， 3 个前体合成基因 (aryF、 aryG、 aryH)， 1 个 MbtH 基因 (aryE)， 2 个 ABC 转运相关基因 (orf1、 orf2)， 3 个与细菌外被膜形成相关基因 (orf3、 orf4、 orf5)，详细分析结果如表 2 所示。 0049 表 2、 arylomycins 生物合成基因簇生物信息学分析 0050 0051 说明书 CN 103160521 A 7 6/10 。

30、页 8 0052 实施例 3、 arylomycins A 生物合成基因簇边界确定 0053 3.1、 S.parvus CGMCC No.4027 遗传转移系统的建立 0054 将含有待接合转移质粒的 E.coli ET1256737过夜培养，取 200l 菌液至装有 20ml LB 培养基的 250ml 三角瓶中， 37培养 3 4h 至 OD600达到 0.5 左右。然后将菌液转移至50ml离心管中4000rpm离心5min收集菌体，并用等体积的新鲜LB洗涤两次，然后重悬于2ml LB中，作为大肠杆菌供体细胞。取-70保存的S.parvus CGMCC No.4027孢子悬。

31、液一管8000rpm离心2min，去上清，用1ml的2YT培养基洗涤两次，重悬于500l 2YT培养基中， 50水浴 10min。待冷却后加入 500l 大肠杆菌供体细胞，混匀，涂布于含有 10mM MgCl2的 MS 平板上， 28培养 16 20h。在平板表面覆盖 1ml 无菌水 ( 含 0.5mg/ml 萘啶酮酸和 1mg/ml 安普霉素 )，用涂布棒涂匀并吹干， 28培养 3 4 天。挑取接合子进行筛选验证。 0055 3.2、基因 orf-1 缺失突变株的构建 0056 设计引物 orf-1_u-F(5 -aagcttgacacgttgcccggcaagag-3。

32、 )、 orf-1_u-R(5 -ctgc agaccccgtcggcaacttcgtc-3 )，和引物 orf-1_d-F(5 -ctgcagcgaagctcaaggaatccgac-3 )、 orf-1_d-R(5 -gaattcagctgacgcagacgctgac-3 ) 分别 PCR 扩增 orf-1 的上、下游片段 orf-1_u、 orf-1_d。PCR 产物回收后分别与 pMD18-T 载体连接，转化 E.coli DH5 提取质粒并测序验证。然后 pMD18-T-orf-1_u 质粒经 HindIII 和 Pst I 酶切，回收 orf-1_u 片段； pMD18。

33、-T-orf-1_d 质粒用 Pst I 和 EcoR I 酶切，回收 orf-1_d 片段； orf-1_u、 orf-1_d 与经过 HindIII 和 EcoR I 酶切的 pKC1139 连接得到重组质粒 pKC1139-orf-1_u-orf-1_d。重组质粒转化 E.coli ET12567 后按 3.1 中所述接合转移方法导入 S.parvus CGMCC No.4027。 0057 挑取接合子至含 50g/ml 安普霉素的 MS 平板 37培养 2 3 天。然后挑取单菌落接种于液体 TSB 培养基， 28培养三代。菌液适当稀释后涂布于 MS 平板，挑选对安普霉素敏。

34、感的单菌落，利用引物 orf-1-F(5 -ccttccgcgagatcttcgatcttc-3 )、 orf-1-R(5 -ga ttccttgagcttcgccgcag-3 ) 进行 PCR 验证。 0058 3.3、基因 orf1 和 orf2 缺失突变株构建 0059 基因 orf1 和 orf2 缺失突变株的构建方法与 3.2 中 orf-1 缺失突变株的构建方法相同，只是所用引物不同，具体情况如表 3 所示。 0060 表 3、基因 orf1 和 orf2 缺失突变株构建和验证引物 0061 说明书 CN 103160521 A 8 7/10 页 9 0062 3.。

35、4、 S.parvus CGMCC No.4027 及相关突变株液体发酵及 HPLC 分析 0063 3.4.1、液体发酵 0064 将 S.parvus CGMCC No.4027 及相关突变株的新鲜斜面孢子 ( 高氏一号斜面培养基 ) 接种于种子培养基 ( 葡萄糖 1，糊精 4，黄豆饼粉 2，磷酸二氢钾 0.02，氯化钠 0.25， pH 7.3 7.5)， 28， 220rpm 振荡培养 44h。然后以 8接种量转入液体发酵培养基 ( 黄豆饼粉 2.2，糊精 3.6，葡萄糖 0.8，磷酸二氢钾 0.02， pH 7.3 7.5)， 28， 220rpm 振荡培养 5 。

36、天。 0065 3.4.2、发酵液处理 0066 取 800l 3.4.1 中获得的发酵液，然后加入等体积的无水甲醇，混匀， 4放置 30min， 12000rpm 离心 15min。取上清进行 HPLC 分析。 0067 3.4.3、 HPLC 分析 0068 对 3.4.2 中获得的发酵液进行 HPLC 分析，具体条件如下： 0069 流动相： A 相：乙腈 - 缓冲液 (10 90) 0070 B 相：乙腈 - 缓冲液 (45 55) 0071 缓冲液： 0.5 (NH4)H2PO4 0072 分析用柱： Hypersil C18， 4.6250mm， 5m 00。

37、73 柱温： 30 0074 检测波长： 223nm 0075 流速： 1.5mL/min 0076 梯度条件如表所示： 0077 时间 (min) 0 15 17 A 25 0 0 B 75 100 100 0078 3.5、 arylomycins A 生物合成基因簇边界确定 0079 根据基因编码的蛋白功能分析， arylomycins A 生物合成基因簇左侧边界研究集中在 aryA 基因上游， orf-1、 orf-2、 orf-3 编码 3 个未知功能蛋白，和原始菌株相比 ( 图说明书 CN 103160521 A 9 8/10 页 10 3I)，对 orf-1 。

38、基因的敲除不影响 arylomycins 合成 ( 图 3II)，表明其与 arylomycins 生物合成无关。arylomycins 的生物合成基因簇右侧边界研究集中在 aryH 下游， orf1、 orf2 分别编码 ABC 转运 ATP 结合蛋白、 ABC 转运透性酶， orf1、 orf2 敲除后，影响到其它化合物的合成，其中 orf1 突变株很多化合物不能合成 ( 图 3III)，而 orf2 突变株很多化合物的产量降低 ( 图 3IV)，同时突变株的色素产量提高，产孢能力减弱。因此 orf1、 orf2 两个基因并非仅仅与 arylomycins 相关，排。

39、除在基因簇之外。orf3、 orf4、 orf5 三个基因分别编码分泌蛋白、聚谷氨酸合成蛋白PgsC、荚膜合成蛋白CapB，它们与细菌外被膜的形成有关，而与 arylomycins 合成无关。因此，最终将 arylomycins A 生物合成基因簇确定为 aryA-aryH，共 8 个开放阅读框。 0080 实施例 4、 arylomycins A 生物合成基因簇中功能基因的鉴定 0081 arylomycins A 生物合成基因簇包含 aryA-aryH 共 8 个基因，其中 3 个 NRPS 基因 (aryA、 aryB、 aryD) 分别编码非核糖体肽合酶 NRPS，负。

40、责 arylomycins 中非核糖体合成六肽(D-Me-Ser-D-Ala-Gly-L-Me-Hpg-L-Ala-L-Tyr)的合成； 3个前体合成基因(aryF、 aryG、 aryH) 分别编码羟基扁桃酸合酶 Hmas、羟基扁桃酸氧化酶 Hmo、羟基苯甘氨酸氨基转移酶 HpgT，负责非天然氨基酸对羟基苯甘氨酸 (HPG) 的合成； 1 个后修饰基因 (aryC) 编码 P450 酶，负责甲基 HPG 与 Tyr 酪氨酸之间联芳键的合成。 0082 另外，基因簇中还有 1 个编码 MbtH 家族蛋白基因 (aryE)， MbtH 家族蛋白通常与 NRPS 连锁，具有反式互。

41、补特性，其中一个 MbtH 敲除后会被基因组其它位置编码的相应蛋白互补。Felnagle E.A 等研究表明 MbtH 蛋白可能影响氨基酸的活化，是 NRPS 的构成部分 (Felnagle， Barkei et al.2010)。为了确定除了aryE以外的aryA-aryD和aryF-aryG确实负责 arylomycins A 的生物合成，按照 3.2 中所述的方法构建基因 aryA、 aryB、 aryC、 aryD、 aryF、 aryG、 aryH 缺失突变株，引物如表 4 所示。 0083 表 4、基因 aryA-aryD 和 aryF-aryH 缺失突变株构建和。

42、验证引物 0084 说明书 CN 103160521 A 10 9/10 页 11 0085 按照 3.4 中所述的方法检测野生菌株和各缺失突变株的发酵产物，发现当 aryA( 图 3V)、 aryB( 图 3VI)、 aryC( 图 3VII)、 aryD( 图 3VIII)、 aryF( 图 5II)、 aryG( 图 5III)、 aryH( 图 5IV) 基因阻断后影响到菌株 arylomycin A2 和 arylomycin A4 的产生，进一步证明得到的基因簇为 arylomycins A 生物合成基因簇。 0086 实施例 5、 Arylomycins A 中非天然氨。

43、基酸 HPG 的生物合成 0087 在 arylomycins A 生物合成基因簇中， aryF、 aryG、 aryH 分别编码羟基扁桃酸合酶 (Hmas)、羟基扁桃酸氧化酶(Hmo)、羟基苯甘氨酸氨基转移酶(HpgT)。 arylomycin中HPG的生物合成途径如图 4 所示。4- 羟基丙酮酸在 Hmas 的作用下氧化脱羧产生 4- 羟基扁桃酸， 4-羟基扁桃酸被Hmo氧化生成4羟基苯乙醛酸，然后通过HpgT转氨作用生成对羟基苯甘氨酸。 0088 aryF、 aryG、 aryH基因敲除后，菌株不能产生arylomycin A2和arylomycin A4。当在发酵液中外。

44、源添加 HPG 时， aryF( 图 5V)、 aryG( 图 5VI)、 aryH( 图 5VII) 基因突变菌株恢复产生 arylomycin A2 和 arylomycin A4，进一步证明了 aryF、 aryG、 aryH 编码蛋白 AryF、说明书 CN 103160521 A 11 10/10 页 12 AryG、 AryH 负责非天然氨基酸 HPG 的生物合成。 0089 实施例 6、 arylomycins A 骨架合成及后修饰反应 0090 在 arylomycins A 生物合成基因簇中有三个基因 (ayrA、 aryB、 aryD) 负责编码 arylomyc。

45、ins 骨架组装相关的非核糖体肽合成酶 NRPS(AryA、 AryB、 AryD)， NRPS 由多模块组成，模块的特异性结构域具有特定的活性。AryA 含有 1 个结构域 (C) ； AryB 含有两个模块 M1(C-A-M-T-E)和M2(C-A-T-E)，共9个结构域； AryD含有4个模块M3*(A-T)、 M4(C-A-M-T)、 M5(C-A-T) 和 M6(C-A-T-Te)，共 13 个结构域；其中 AryA 编码的 C 结构域与 M3*(A-T) 相互作用够成一个完整的模块 M3(C-A-T)。模块 M1-M6 中的 A 结构域分别负责 Ser、 Ala、。

46、Gly、 Hpg、 Ala、 Tyr 的腺苷酰化激活和装载，模块 M1 和 M4 中的 M 结构域负责 Ser 和 Hpg 的 N- 甲基化修饰，模块 M1 和 M2 中的 E 结构域分别负责 Ser、 Ala 的异构化。M1 为起始模块，其中的 C 结构域将活化的脂肪酸链与第一个氨基酸 D-Me-Ser 通过酰胺键连接。然后，延伸模块通过各自的 C 结构域与上游的酰基发生缩合组装成 arylomycin A 骨架，最终通过模块 M6 中的 Te 结构域将其从 NRPS 上分离下来。游离线性脂肽中的 HPG 和 Tyr 进一步在 AryD 的催化作用下形成联芳键产生完整的 a。

47、rylomycins 化合物。整个过程如图 6 所示。说明书 CN 103160521 A 12 1/30 页 13 0001 0002 序列表 CN 103160521 A 13 2/30 页 14 0003 序列表 CN 103160521 A 14 3/30 页 15 0004 序列表 CN 103160521 A 15 4/30 页 16 0005 序列表 CN 103160521 A 16 5/30 页 17 0006 序列表 CN 103160521 A 17 6/30 页 18 0007 序列表 CN 103160521 A 18 7/30 页 19。

48、 0008 序列表 CN 103160521 A 19 8/30 页 20 0009 序列表 CN 103160521 A 20 9/30 页 21 0010 序列表 CN 103160521 A 21 10/30 页 22 0011 序列表 CN 103160521 A 22 11/30 页 23 0012 序列表 CN 103160521 A 23 12/30 页 24 0013 序列表 CN 103160521 A 24 13/30 页 25 0014 序列表 CN 103160521 A 25 14/30 页 26 0015 序列表 CN 103160521 A 26 15/30 页 27 0016 序列表 CN 103160521 A 27 16/30 页 28 0017 序列表 CN 103160521 A 28 17/30 页 29 0018 序列表 CN 103160521 A 29 18/30 页 30 0019 序列表 CN 103160521 A 30 19/30 页 31 0020 序列表 CN 103160521 A 31 20/30 页 32 0021 序列表 CN 103160521 A 32 21/30 页 33 0。

摘要
申请专利号：	CN201110422201.7	申请日：	2011.12.15
公开号：	CN103160521A	公开日：	2013.06.19
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回IPC(主分类):C12N 15/52申请公布日:20130619\|\|\|实质审查的生效IPC(主分类):C12N 15/52申请日:20111215\|\|\|公开
IPC分类号：	C12N15/52; C12N15/53; C12N15/54; C12N15/31; C12R1/465(2006.01)N	主分类号：	C12N15/52
申请人：	上海来益生物药物研究开发中心有限责任公司; 上海交通大学
发明人：	靳旭; 饶敏; 魏维; 戈梅; 朱丽; 陈玲玲; 万明玉
地址：	201203 上海市浦东新区张江高科技园区牛顿路200号8号楼5楼
优先权：
专利代理机构：	上海华工专利事务所 31104	代理人：	应云平
PDF完整版下载：	PDF下载

内容摘要

本发明公开了由Streptomyces parvus CGMCC No.4027菌株产生的具有抗菌活性的抗生素--arylomycins A的生物合成基因簇。整个基因簇共包含8个基因：3个NRPS基因(aryA、aryB、aryD)；1个后修饰基因(aryC)；3个前体合成基因(aryF、aryG、aryH)以及1个MbtH基因(aryE)。通过对上述生物合成基因的遗传操作可阻断arylomycin A2和arylomycinA4的合成。本发明所提供的基因也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。

权利要求书

权利要求书抗生素arylomycins A的生物合成基因簇，其特征在于，所述基因簇包含8个基因：
aryA编码非核糖体肽合成酶NRPS；
aryB编码非核糖体肽合成酶NRPS；
aryC编码P450酶；
aryD编码非核糖体肽合成酶NRPS；
aryE编码MbtH家族蛋白；
aryF编码羟基扁桃酸合酶Hmas；
aryG编码羟基扁桃酸氧化酶Hmo；
aryH编码羟基苯甘氨酸氨基转移酶HpgT。
如权利要求1所述的基因簇，其特征在于，所述基因aryA位于SEQ ID NO：1所示的核苷酸序列的第3739‑5493个碱基处，长度为1755个碱基对，编码584个氨基酸。
如权利要求1所述的基因簇，其特征在于，所述基因aryB位于SEQ ID NO：1所示的核苷酸序列的第5481‑15938个碱基处，长度为10458个碱基对，编码3485个氨基酸。
如权利要求1所述的基因簇，其特征在于，所述基因aryC位于SEQ ID NO：1所示的核苷酸序列的第16567‑17736个碱基处，长度为1170个碱基对，编码389个氨基酸。
如权利要求1所述的基因簇，其特征在于，所述基因aryD位于SEQ ID NO：1所示的核苷酸序列的第17795‑30688个碱基处，长度为12894个碱基对，编码4297个氨基酸。
如权利要求1所述的基因簇，其特征在于，所述基因aryE位于SEQ ID NO：1所示的核苷酸序列的第30714‑30935个碱基处，长度为222个碱基对，编码73个氨基酸。
如权利要求1所述的基因簇，其特征在于，所述基因aryF位于SEQ ID NO：1所示的核苷酸序列的第30983‑32047个碱基处，长度为1065个碱基对，编码354个氨基酸。
如权利要求1所述的基因簇，其特征在于，所述基因aryG位于SEQ ID NO：1所示的核苷酸序列的第32044‑33159个碱基处，长度为1116个碱基对，编码371个氨基酸。
如权利要求1所述的基因簇，其特征在于，所述基因aryH位于SEQ ID NO：1所示的核苷酸序列的第33152‑34501个碱基处，长度为1350个碱基对，编码449个氨基酸。
如权利要求1所述的基因簇，其特征在于，所述基因簇的核苷酸序列如SEQ ID NO：1所示。

说明书

说明书arylomycins A生物合成基因簇
技术领域
本发明属于微生物基因工程领域，具体地说，是关于抗生素arylomycins A的生物合成基因簇。
背景技术
随着致病菌耐药性问题的日益严峻，临床上对新抗生素的需求也显得更为迫切。为了应对这一局面，人们一方面对已有抗生素进行改造，另一方面也加快了新型抗生素筛选的步伐。Alexandra 等在2002年从Streptomyces sp.Tü6075分离得到了两组脂肽类化合物arylomycins，包括arylomycins A和arylomycins B(Schimana，Gebhardt et al.2002)。它们都属于六肽化合物，含有相同肽链(D‑Me‑Ser‑D‑Ala‑Gly‑L‑Me‑Hpg‑L‑Ala‑L‑Tyr)，不同的是，arylomycins B中的Tyr含有‑NO2取代基。最近，我们从Streptomyces parvus CGMCC No.4027的发酵液中分离到了arylomycin A2和arylomycin A4，结构如图1所示。
2004年，Mark Paetzel等获得了arylomycin A2与Escherichia coli I型信号肽酶结合复合物分辨率的晶体结构，研究发现arylomycin A2的C端可与信号肽酶催化活性中心的Ser和Lys残基侧链形成氢键，同时arylomycin A2形成β‑折叠结构模拟信号肽酶底物的结合(Paetzel，Goodall et al.2004)。I型信号肽酶(SPase I，EC 3.4.21.89)是一种广泛存在于真细菌细胞膜中的丝氨酸蛋白酶，负责将前蛋白N‑端的信号肽切除，对细菌的生存和生长至关重要。SPase I被抑制后，会造成分泌蛋白在细胞膜上的大量积累并最终导致细菌死亡(Dalbey and Wickner 1985)。一直以来，病原菌蛋白酶抑制剂被认为药物发展的一个方向，但是对人体的毒害性降低了这些抑制剂最终成药的可能性。区别于经典的Ser/His/Asp催化机制，SPase I利用独特的Ser/Lys催化二元体机制，这就意味着SPase I抑制剂有着更高的特异性，对真核细胞有着更低的毒性。同时，由于催化活性中心位于细胞膜外侧，I型信号肽酶被认为是一种很有潜力的抗生素筛选靶标。虽然已经得到了arylomycin A2与Escherichia coli SPase I结合复合物的晶体结构，但在最初生物活性研究中，arylomycins只对Streptococcuspneumonia、Staphylococcus epidermidis及土壤微生物Rhodococcus opacus、Brevibacillus brevis有抗菌活性，而对大多的病原菌如Staphylococcus aureus、Escherichia coli和Pseudomonas aeruginosa没有活性，这大大限制了其成为药物的可能性。但2010年有研究发现，Staphylococcus aureus、Escherichia coli和Pseudomonas aeruginosa之所以对arylomycins表现出耐药性，是由于这些病原菌的SPase I催化活性中心的Ser突变为Pro从而导致两者的亲和力降低。通过对自然界中厚壁菌门、放线菌们、变形菌门、拟杆菌门及疣微菌门衣原体属中SPase I相应位置Pro突变的分布研究表明，很多自然界中的细菌不存在Pro突变而对arylomycins表现为敏感，如革兰氏阳性边病原菌Streptococcus pneumoniae、Streptococcus pyogenes、S.haemolyticus 及革兰氏阴性病原菌Chlamydia trachomatis等(Smith，Roberts et al.2010)。因此arylomycins作为广谱性抗生素有着广阔的应用前景。
除了加工与生存及生长相关蛋白，I型信号肽酶与其它生命活动如细菌耐药性、细菌毒素的分泌等，也有着密切关系。例如，一些病原菌由于能分泌β‑内酰胺酶而对β‑内酰胺类抗生素产生耐药性，而研究表明arylomycins类似物lipoglycopeptides能抑制S.aureus β‑内酰胺酶的分泌(Kulanthaivel，Kreuzman et al.2004)。因此除了直接作为抗生素使用，arylomycins还能够调节细菌毒性或者使得病原菌变得对其它抗生素敏感，这将大大扩大arylomycins应用范围(Roberts，Smith et al.2007)。
迄今为止，还没有arylomycins生物合成基因簇相关研究的报道。
发明内容
本发明的目的是提供由Streptomyces parvus CGMCC No.4027菌株产生的具有抗菌活性的抗生素‑‑arylomycins A的生物合成基因簇。
根据本发明，抗生素arylomycins A的生物合成基因簇包含8个基因：
aryA编码非核糖体肽合成酶NRPS；
aryB编码非核糖体肽合成酶NRPS；
aryC编码P450酶；
aryD编码非核糖体肽合成酶NRPS；
aryE编码MbtH家族蛋白；
aryF编码羟基扁桃酸合酶Hmas；
aryG编码羟基扁桃酸氧化酶Hmo；
aryH编码羟基苯甘氨酸氨基转移酶HpgT。
根据本发明，所述基因aryA位于SEQ ID NO：1所示的核苷酸序列的第3739‑5493个碱基处，长度为1755个碱基对，编码584个氨基酸。
根据本发明，所述基因aryB位于SEQ ID NO：1所示的核苷酸序列的第5481‑15938个碱基处，长度为10458个碱基对，编码3485个氨基酸。
根据本发明，所述基因aryC位于SEQ ID NO：1所示的核苷酸序列的第16567‑17736个碱基处，长度为1170个碱基对，编码389个氨基酸。
根据本发明，所述基因aryD位于SEQ ID NO：1所示的核苷酸序列的第17795‑30688个碱基处，长度为12894个碱基对，编码4297个氨基酸。
根据本发明，所述基因aryE位于SEQ ID NO：1所示的核苷酸序列的第30714‑30935个碱基处，长度为222个碱基对，编码73个氨基酸。
根据本发明，所述基因aryF位于SEQ ID NO：1所示的核苷酸序列的第30983‑32047个碱基处，长度为1065个碱基对，编码354个氨基酸。
根据本发明，所述基因aryG位于SEQ ID NO：1所示的核苷酸序列的第32044‑33159个碱基处，长度为1116个碱基对，编码371个氨基酸。
根据本发明，所述基因aryH位于SEQ ID NO：1所示的核苷酸序列的第33152‑34501个碱基处，长度为1350个碱基对，编码449个氨基酸。
根据本发明，所述基因簇的核苷酸序列如SEQ ID NO：1所示。
本发明所提供的包含arylomycins A生物合成相关的所有基因和蛋白信息可以帮助人们理解arylomycins类天然产物的生物合成机制，为进一步遗传改造提供了材料和知识。本发明所提供的基因也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
附图说明
图1为arylomycin A2及arylomycin A4的化学结构示意图。
图2为本发明的arylomycins A生物合成基因簇结构示意图。
图3为原始菌株及各突变株发酵液HPLC分析结果图。其中，I为原始菌株，II为orf‑1敲除突变株，III为orf1敲除突变株，IV为orf2敲除突变株，V为aryA敲除突变株，VI为aryB敲除突变株，VII为aryC敲除突变株，VIII为aryD敲除突变株。
图4为arylomycins A中非天然氨基酸HPG的生物合成途径示意图。
图5为原始菌株、突变株及HPG补料后各菌株发酵液HPLC分析结果图。其中， I为原始菌株，II为aryF敲除突变株，III为aryG敲除突变株，IV为aryH敲除突变株，V为aryF敲除突变株HPG补料，VI为aryG敲除突变株HPG补料，VII为aryH敲除突变株HPG补料。
图6为arylomycin A2和arylomycin A4的生物合成过程示意图。
具体实施方式
以下通过具体实施例对本发明作进一步说明。应理解，以下实施例仅用于说明本发明，而不用于限定本发明的范围。
本发明所用的菌种为Streptomycesparvus，于2010年07月20日保藏于中国微生物菌种保藏管理委员会普通微生物中心(CGMCC)，保藏地址为北京市朝阳区北辰西路1号院3号，保藏号CGMCC No.4027。
本发明中所涉及的分子生物学操作参照Practical Streptomyces Genetics(Norwich：John Innes Foundation，2000)和《分子克隆：实验室手册》(New York：Cold Spring Harbor Laboratory，2001)等进行。
实施例1、arylomycins生物合成基因簇的克隆
1.1、Streptomyces parvus CGMCC No.4027总DNA提取
将新鲜S.parvus CGMCC No.4027斜面孢子接种到3ml TSB培养基中，28℃，220rpm振荡培养30h。取2ml至2ml离心管中，12000rpm离心10min，用无菌水洗涤一次，菌丝体重悬于250μl SET，并加入溶菌酶至终浓度4mg/ml，37℃水浴40～60min。加入50μl 10％SDS和2.5μl 10mg/ml蛋白酶K，于55℃水浴2h，期间不断震荡。然后加入200μl 5mol/LNaCl和500μl氯仿，混匀，室温放置30min，12000rpm离心15min。取上清，加入1ml异丙醇，12000rpm离心5min，沉淀用70％乙醇洗涤一次并抽干，加入100μl TE缓冲溶液于‑20℃保存。
1.2、arylomycins生物合成基因簇的克隆
微生物代谢具有多样性，随着越来越多次级代谢产物生物合成基因簇的获得，发现不同的微生物的基因组中也会含有相同化合物的合成基因簇。如A21978C产生菌Streptomyces roseosporus NRRL 15998虽然没有报道其能够产生核苷肽类抗生素，但在其基因组中发现了类似负责Pacidamycin生物合成的基因簇(Zhang，Ostash et al.2010)。
已知Streptomycesparvus CGMCC No.4027也能够产生A21978C系列物质，另外还发现其可以产生arylomycins类代谢产物。在对已经公开的A21978C产生菌Streptomyces roseosporus NRRL15998的基因组进行分析的过程中，发现基因 SSGG_05586‑SSGG_05590编码非核糖体肽合成酶(NRPS)，其中模块组成、异构化(E)结构域及甲基化(M)结构域与arylomycins结构中肽链组成对应，因此其可能与arylomycins基因簇类似。根据SSGG_05586‑SSGG_05590上下游序列，利用Vector NTI软件设计引物，以1.1中制备的S.parvus CGMCC No.4027染色体为模板逐段PCR。
PCR反应体系(50μl)包括PrimerSTAR HS DNA聚合酶(2.5U/μl)0.5μl、2×GC缓冲液25μl、dNTP(浓度各为2.5mM)4μl、引物(20mM)各0.5μl、Streptomyces parvus CGMCC No.4027总DNA 1μl、dH2O 18.5μl。反应条件为：94℃预变性3min；94℃变性1min，58～68℃复性30s，72℃延伸2.5min，共30个循环；最后72℃延伸10min。
低熔点胶回收预期大小DNA片段，与pMD18‑T simple Vector连接，转化E.coli DH5α，涂布于含有100μg/ml氨苄青霉素的LB平板上，37℃培养。挑取单菌落过夜培养，抽提质粒，根据大小将可能含有预期大小DNA片段的质粒测序。
引物序列及PCR产物大小如表1所示。最终将所得16个片段拼接起来，所得序列总长为39503bp，GC含量为71.9％。核苷酸序列如SEQ ID NO：1所示。
表1、引物序列及PCR产物大小

实施例2、arylomycins生物合成基因簇功能分析
通过生物信息学分析，所得序列共包含17个开放阅读框，如图2所示。包含3个功能未知基因(orf‑1、orf‑2、orf‑3)，3个NRPS基因(aryA、aryB、aryD)，1个后修饰基因(aryC)，3个前体合成基因(aryF、aryG、aryH)，1个MbtH基因(aryE)，2个ABC转运相关基因(orf1、orf2)，3个与细菌外被膜形成相关基因(orf3、orf4、orf5)，详细分析结果如表2所示。
表2、arylomycins生物合成基因簇生物信息学分析

实施例3、arylomycins A生物合成基因簇边界确定
3.1、S.parvus CGMCC No.4027遗传转移系统的建立
将含有待接合转移质粒的E.coli ET1256737℃过夜培养，取200μl菌液至装有20ml LB培养基的250ml三角瓶中，37℃培养3～4h至OD600达到0.5左右。然后将菌液转移至50ml离心管中4000rpm离心5min收集菌体，并用等体积的新鲜LB洗涤两次，然后重悬于2ml LB中，作为大肠杆菌供体细胞。取‑70℃保存的S.parvus CGMCC No.4027孢子悬液一管8000rpm离心2min，去上清，用1ml的2×YT培养基洗涤两次，重悬于500μl 2×YT培养基中，50℃水浴10min。待冷却后加入500μl大肠杆菌供体细胞，混匀，涂布于含有10mM MgCl2的MS平板上，28℃培养16～20h。在平板表面覆盖1ml无菌水(含0.5mg/ml萘啶酮酸和1mg/ml安普霉素)，用涂布棒涂匀并吹干，28℃培养3～4天。挑取接合子进行筛选验证。
3.2、基因orf‑1缺失突变株的构建
设计引物orf‑1_u‑F(5’‑aagcttgacacgttgcccggcaagag‑3’)、orf‑1_u‑R(5’‑ctgcagaccccgtcggcaacttcgtc‑3’)，和引物orf‑1_d‑F(5’‑ctgcagcgaagctcaaggaatccgac‑3’)、orf‑1_d‑R(5’‑gaattcagctgacgcagacgctgac‑3’)分别PCR扩增orf‑1的上、下游片段orf‑1_u、orf‑1_d。PCR产物回收后分别与pMD18‑T载体连接，转化E.coli DH5α提取质粒并测序验证。然后pMD18‑T‑orf‑1_u质粒经HindIII和Pst I酶切，回收orf‑1_u片段；pMD18‑T‑orf‑1_d质粒用Pst I和EcoR I酶切，回收orf‑1_d片段；orf‑1_u、orf‑1_d与经过HindIII和EcoR I酶切的pKC1139连接得到重组质粒pKC1139‑orf‑1_u‑orf‑1_d。重组质粒转化E.coli ET12567后按3.1中所述接合转移方法导入S.parvus CGMCC No.4027。
挑取接合子至含50μg/ml安普霉素的MS平板37℃培养2～3天。然后挑取单菌落接种于液体TSB培养基，28℃培养三代。菌液适当稀释后涂布于MS平板，挑选对安普霉素敏感的单菌落，利用引物orf‑1‑F(5’‑ccttccgcgagatcttcgatcttc‑3’)、orf‑1‑R(5’‑gattccttgagcttcgccgcag‑3’)进行PCR验证。
3.3、基因orf1和orf2缺失突变株构建
基因orf1和orf2缺失突变株的构建方法与3.2中orf‑1缺失突变株的构建方法相同，只是所用引物不同，具体情况如表3所示。
表3、基因orf1和orf2缺失突变株构建和验证引物

3.4、S.parvus CGMCC No.4027及相关突变株液体发酵及HPLC分析
3.4.1、液体发酵
将S.parvus CGMCC No.4027及相关突变株的新鲜斜面孢子(高氏一号斜面培养基)接种于种子培养基(葡萄糖1％，糊精4％，黄豆饼粉2％，磷酸二氢钾0.02％，氯化钠0.25％，pH 7.3～7.5)，28℃，220rpm振荡培养44h。然后以8％接种量转入液体发酵培养基(黄豆饼粉2.2％，糊精3.6％，葡萄糖0.8％，磷酸二氢钾0.02％，pH 7.3～7.5)，28℃，220rpm振荡培养5天。
3.4.2、发酵液处理
取800μl 3.4.1中获得的发酵液，然后加入等体积的无水甲醇，混匀，4℃放置30min，12000rpm离心15min。取上清进行HPLC分析。
3.4.3、HPLC分析
对3.4.2中获得的发酵液进行HPLC分析，具体条件如下：
流动相：A相：乙腈‑缓冲液(10∶90)
B相：乙腈‑缓冲液(45∶55)
缓冲液：0.5％(NH4)H2PO4
分析用柱：Hypersil C18，4.6×250mm，5μm
柱温：30℃
检测波长：223nm
流速：1.5mL/min
梯度条件如表所示：
时间(min) 0 15 17 A％ 25 0 0 B％ 75 100 100
3.5、arylomycins A生物合成基因簇边界确定
根据基因编码的蛋白功能分析，arylomycins A生物合成基因簇左侧边界研究集中在aryA基因上游，orf‑1、orf‑2、orf‑3编码3个未知功能蛋白，和原始菌株相比(图3I)，对orf‑1基因的敲除不影响arylomycins合成(图3II)，表明其与arylomycins生物合成无关。arylomycins的生物合成基因簇右侧边界研究集中在aryH下游，orf1、orf2分别编码ABC转运ATP结合蛋白、ABC转运透性酶，orf1、orf2敲除后，影响到其它化合物的合成，其中orf1突变株很多化合物不能合成(图3III)，而orf2突变株很多化合物的产量降低(图3IV)，同时突变株的色素产量提高，产孢能力减弱。因此orf1、orf2两个基因并非仅仅与arylomycins相关，排除在基因簇之外。orf3、orf4、orf5三个基因分别编码分泌蛋白、聚γ谷氨酸合成蛋白PgsC、荚膜合成蛋白CapB，它们与细菌外被膜的形成有关，而与arylomycins合成无关。因此，最终将arylomycins A生物合成基因簇确定为aryA‑aryH，共8个开放阅读框。
实施例4、arylomycins A生物合成基因簇中功能基因的鉴定
arylomycins A生物合成基因簇包含aryA‑aryH共8个基因，其中3个NRPS基因(aryA、aryB、aryD)分别编码非核糖体肽合酶NRPS，负责arylomycins中非核糖体合成六肽(D‑Me‑Ser‑D‑Ala‑Gly‑L‑Me‑Hpg‑L‑Ala‑L‑Tyr)的合成；3个前体合成基因(aryF、aryG、aryH)分别编码羟基扁桃酸合酶Hmas、羟基扁桃酸氧化酶Hmo、羟基苯甘氨酸氨基转移酶HpgT，负责非天然氨基酸对羟基苯甘氨酸(HPG)的合成；1个后修饰基因(aryC)编码P450酶，负责甲基HPG与Tyr酪氨酸之间联芳键的合成。
另外，基因簇中还有1个编码MbtH家族蛋白基因(aryE)，MbtH家族蛋白通常与NRPS连锁，具有反式互补特性，其中一个MbtH敲除后会被基因组其它位置编码的相应蛋白互补。Felnagle E.A等研究表明MbtH蛋白可能影响氨基酸的活化，是NRPS的构成部分(Felnagle，Barkei et al.2010)。为了确定除了aryE以外的aryA‑aryD和aryF‑aryG确实负责arylomycins A的生物合成，按照3.2中所述的方法构建基因aryA、aryB、aryC、aryD、aryF、aryG、aryH缺失突变株，引物如表4所示。
表4、基因aryA‑aryD和aryF‑aryH缺失突变株构建和验证引物

按照3.4中所述的方法检测野生菌株和各缺失突变株的发酵产物，发现当aryA(图3V)、aryB(图3VI)、aryC(图3VII)、aryD(图3VIII)、aryF(图5II)、aryG(图5III)、aryH(图5IV)基因阻断后影响到菌株arylomycin A2和arylomycin A4的产生，进一步证明得到的基因簇为arylomycins A生物合成基因簇。
实施例5、Arylomycins A中非天然氨基酸HPG的生物合成
在arylomycins A生物合成基因簇中，aryF、aryG、aryH分别编码羟基扁桃酸合酶(Hmas)、羟基扁桃酸氧化酶(Hmo)、羟基苯甘氨酸氨基转移酶(HpgT)。arylomycin中HPG的生物合成途径如图4所示。4‑羟基丙酮酸在Hmas的作用下氧化脱羧产生4‑羟基扁桃酸，4‑羟基扁桃酸被Hmo氧化生成4羟基苯乙醛酸，然后通过HpgT转氨作用生成对羟基苯甘氨酸。
aryF、aryG、aryH基因敲除后，菌株不能产生arylomycin A2和arylomycin A4。当在发酵液中外源添加HPG时，aryF(图5V)、aryG(图5VI)、aryH(图5VII)基因突变菌株恢复产生arylomycin A2和arylomycin A4，进一步证明了aryF、aryG、aryH编码蛋白AryF、AryG、AryH负责非天然氨基酸HPG的生物合成。
实施例6、arylomycins A骨架合成及后修饰反应
在arylomycins A生物合成基因簇中有三个基因(ayrA、aryB、aryD)负责编码arylomycins骨架组装相关的非核糖体肽合成酶NRPS(AryA、AryB、AryD)，NRPS由多模块组成，模块的特异性结构域具有特定的活性。AryA含有1个结构域(C)；AryB含有两个模块M1(C‑A‑M‑T‑E)和M2(C‑A‑T‑E)，共9个结构域；AryD含有4个模块M3*(A‑T)、M4(C‑A‑M‑T)、M5(C‑A‑T)和M6(C‑A‑T‑Te)，共13个结构域；其中AryA编码的C结构域与M3*(A‑T)相互作用够成一个完整的模块M3(C‑A‑T)。模块M1‑M6中的A结构域分别负责Ser、Ala、Gly、Hpg、Ala、Tyr的腺苷酰化激活和装载，模块M1和M4中的M结构域负责Ser和Hpg的N‑甲基化修饰，模块M1和M2中的E结构域分别负责Ser、Ala的异构化。M1为起始模块，其中的C结构域将活化的脂肪酸链与第一个氨基酸D‑Me‑Ser通过酰胺键连接。然后，延伸模块通过各自的C结构域与上游的酰基发生缩合组装成arylomycin A骨架，最终通过模块M6中的Te结构域将其从NRPS上分离下来。游离线性脂肽中的HPG和Tyr进一步在AryD的催化作用下形成联芳键产生完整的arylomycins化合物。整个过程如图6所示。