本发明至少有部分内容是在美国能源部高级研究项目局(DepartmentofEnergy AdvancedResearchProjectsAgency)的政府支持下完成的-能源(ARPA-e)拨款号DE- AR0000042。政府对本发明享有特定的权利。
本申请是2009年11月6日递交的美国专利申请号12/590,444的申请的部分连续申 请,通过引用将该申请全部内容并入本文。
与本申请同时电子提交的以“序列表”为标题的序列表,通过引用将其全部内容并 入本文,该序列表创建于2010年11月5日,大小为14,792,733字节。
技术领域
本发明涉及对蛋白活性进行控制。
背景技术
许多蛋白都具有有用的特性,但在特定情况下,蛋白也会变得难以利用。例如,水 解酶具有重要的工业和农业应用,但它们在一些表达宿主内的表达和产生可能又与不需要 的表型效果相关。细胞壁降解酶,包括纤维素酶、木聚糖酶、木质素酶、酯酶、过氧化物酶及 其它水解酶,在植物内表达时常常会与植物的生长、生理学表现和农艺表现上的不利影响 相关。木聚糖酶是能催化β-1,4-木聚糖的水解的酶:β-1,4-木聚糖是植物细胞壁内所含的 半纤维素中的直链多糖成分。纤维素酶是能催化纤维素、各种聚合度的纤维素种类和纤维 二糖内所含的以β-1,4-D-糖苷键连接的葡萄糖聚合物发生内部水解或端部水解的酶。基于 上述活性,木聚糖酶或纤维素酶在植物内的表达可能导致非期望的的植物成分的降解。一 些酶也可能由于其水解活性而在微生物宿主内低表达。
发明内容
一方面,本发明涉及一种分离蛋白,该分离蛋白具有与选自由SEQIDNOS:2373- 2686和3315-3322所组成的组中的序列具有至少90%的同一性的氨基酸序列。
一方面,本发明涉及一种分离核酸,该分离核酸的核苷酸序列编码与选自由SEQ IDNOS:2373-2686和3315-3322所组成的组中的序列具有至少90%的同一性的氨基酸序列。
一方面,本发明涉及一种含有分离核酸的转基因植物,所述分离核酸的核苷酸序 列编码与选自由SEQIDNOS:2373-2686和3315-3322所组成的组中的序列具有至少90%的 同一性的氨基酸序列。
一方面,本发明涉及一种分离核酸,该分离核酸的核苷酸序列在中严格度条件下 与选自由SEQIDNOS:2687-3000和3323-3330所组成的组中的序列杂交。
一方面,本发明涉及一种含有分离核酸的转基因植物,所述分离核酸的核苷酸序 列在中严格度条件下与选自由SEQIDNOS:2687-3000和3323-3330所组成的组中的序列杂 交。
一方面,本发明涉及一种分离的氨基酸序列,该分离的氨基酸序列所含的连续氨 基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个,或 10至全部的连续氨基酸残基具有至少90%的同一性,所述蛋白具有SEQIDNOS:2373-2686 和3315-322中的任意的序列。所述蛋白具有内含肽序列、酶序列、上游内含肽-外显肽接头 和下游内含肽-外显肽接头。具有SEQIDNOS:3315-3322中的一个的序列的蛋白含有至少 一种有关SEQIDNO:2518的氨基酸改变。所述分离的氨基酸序列含有上游内含肽-外显肽 接头、下游内含肽-外显肽接头中的至少一种,或至少一种有关SEQIDNO:2518的氨基酸改 变中的一种或多种。
一方面,本发明涉及一种抗体,该抗体识别分离的氨基酸序列上的抗原表位,该分 离的氨基酸序列所含的连续氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10- 300个、10-400个、10-500个,或10至全部的连续氨基酸残基具有至少90%的同一性,所述蛋 白具有SEQIDNOS:2373-2686和3315-322中的任意的序列。所述蛋白具有内含肽序列、酶 序列、上游内含肽-外显肽接头和下游内含肽-外显肽接头。具有SEQIDNOS:3315-3322中 的一个的序列的蛋白含有至少一种有关SEQIDNO:2518的氨基酸改变。所述分离的氨基酸 序列含有上游内含肽-外显肽接头、下游内含肽-外显肽接头中的至少一种,或至少一种有 关SEQIDNO:2518的氨基酸改变中的一种或多种。
一方面,本发明涉及一种分离的核酸,该核酸的序列编码连续氨基酸序列,该连续 氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个, 或10至全部的连续氨基酸残基具有至少90%的同一性,所述蛋白具有SEQIDNOS:2373- 2686和3315-322中的任意的序列。所述蛋白具有内含肽序列、酶序列、上游内含肽-外显肽 接头和下游内含肽-外显肽接头。具有SEQIDNOS:3315-3322中的一个的序列的蛋白含有 至少一种有关SEQIDNO:2518的氨基酸改变。所述分离的氨基酸序列含有上游内含肽-外 显肽接头、下游内含肽-外显肽接头中的至少一种,或至少一种有关SEQIDNO:2518氨基酸 改变中的一种或多种。
附图说明
结合附图阅读将能更好地理解下文中对优选实施方式进行的具体描述。出于阐释 本发明的目的,附图所示为本发明优选的实施方式。但是,应当理解的是,本发明不限于所 展示的精确安排和手段。图中:
图1显示了在远离蛋白活性位点处的内含肽插入位点。菱形表示插入位点,方形表 示未插入内含肽的其它C/S/T位点。
图2A显示了一种植物表达载体,将其命名为pAG2005(SEQIDNO:1)。
图2B显示了更详细的pAG2005(SEQIDNO:1)。
图3A-3L显示了针对Tth内含肽修饰的P77853的蛋白质印迹数据,其中,内含肽插 入在P77853酶中的丝氨酸158处(S158)或苏氨酸134(T134)处。在部分图3A至图3L中,遮住 了部分蛋白质印迹来突出特定的泳道组。泳道上方示出了针对各个样品的琼脂平板表型。 所述琼脂平板表型用“SW”代表转化表型(switcherphenotype),TSP代表温敏转化剪接表 型(temperaturesensitiveswitchersplicerphenotype),P代表许可表型(permissive phenotype)。每幅图3A至图3L中的NIC代表内含肽修饰蛋白中的N-外显肽、内含肽和C-外显 肽;NC代表含有N-外显肽和C-外显肽的剪接蛋白。
图3A显示了反映P77853-Tth-S158-2蛋白(SEQIDNO:1672)的蛋白质印迹,该蛋 白在37℃(系列2,左泳道)或55℃(系列2,右泳道)下进行了4小时的预热处理。同时该图还 显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两 种蛋白进行预热处理。
图3B显示了反映P77853-Tth-S158-4蛋白(SEQIDNO:1673)的蛋白质印迹,该蛋 白在37℃(系列4,左泳道)或55℃(系列4,右泳道)下进行了4小时的预热处理。同时该图还 显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两 种蛋白进行预热处理。
图3C显示了反映P77853-Tth-S158-7蛋白(SEQIDNO:1674)的蛋白质印迹,该蛋 白在37℃(系列7,左泳道)或55℃(系列7,中泳道)下进行了4小时的预热处理,并在70℃(系 列7,右泳道)下进行了1小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和 野生型P77853蛋白(P77)的泳道。
图3D显示了反映P77853-Tth-S158-19蛋白(SEQIDNO:1675)的蛋白质印迹,该蛋 白在37℃(系列19,左泳道)或55℃(系列19,中泳道)下进行了4小时的预热处理,并在70℃ (系列19,左泳道)下进行了1小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋 白和野生型P77853蛋白(P77)的泳道。
图3E显示了反映P77853-Tth-S158-20蛋白(SEQIDNO:1676)的蛋白质印迹,该 蛋白在37℃(系列20,左泳道)或55℃(系列20,中泳道)下进行了4小时的预热处理,并在70 ℃(系列20,右泳道)下进行了1小时的预热处理。同时该图还显示了含有空载体对照(VCT) 蛋白和野生型P77853蛋白(P77)的泳道。
图3F显示了反映P77853-Tth-S158-21蛋白(SEQIDNO:1677)的蛋白质印迹,该蛋 白在37℃(系列21,左泳道)或70℃(系列21,右泳道)下进行了1小时的预热处理。同时该图 还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这 两种蛋白进行预热处理。
图3G显示了反映P77853-Tth-S158-25蛋白(SEQIDNO:1678)的蛋白质印迹,该蛋 白在37℃(系列25,左泳道)或70℃(系列25,右泳道)下进行了1小时的预热处理。同时该图 还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这 两种蛋白进行预热处理。
图3H显示了反映P77853-Tth-S158-38蛋白(SEQIDNO:1679)的蛋白质印迹,该蛋 白在37℃(系列38,左泳道)或55℃(系列38,右泳道)下进行了4小时的预热处理。同时该图 还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这 两种蛋白进行预热处理。
图3I显示了反映P77853-Tth-S158-39蛋白(SEQIDNO:1680)的蛋白质印迹,该蛋 白在37℃(系列39,左泳道)或55℃(系列39,中泳道)下进行了4小时的预热处理,并在70℃ (系列39,右泳道)下进行了1小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋 白和野生型P77853蛋白(P77)的泳道。
图3J显示了反映P77853-Tth-S158-42蛋白(SEQIDNO:1681)的蛋白质印迹,该蛋 白在37℃(系列42,左泳道)或55℃(系列42,中泳道)下进行了4小时的预热处理,并在70℃ (系列42,右泳道)下进行了1小时的预热处理。同时该图还显示了含有空载体对照蛋白和野 生型P77853蛋白(P77)的泳道。
图3K显示了反映P77853-Tth-S158-138蛋白(SEQIDNO:1691)的蛋白质印迹,该 蛋白在37℃(系列42,左泳道)或59℃(左泳道数起第二条)下进行了4小时的预热处理。同时 该图还显示了含有空载体对照蛋白和野生型P77853蛋白(P77853)的泳道。
图3L显示了反映P77853-Tth-T134-1蛋白(SEQIDNO:1629)(系列1)、P77853- Tth-T134-2蛋白(SEQIDNO:1630)(系列2)、P77853-Tth-T134-3蛋白(SEQIDNO:1631) (系列3)、P77853-Tth-T134-9蛋白(SEQIDNO:1632)(系列9)、P77853-Tth-T134-91蛋白 (SEQIDNO:1644)(系列91)、P77853-Tth-T134-48蛋白(SEQIDNO:1638)(系列48)、 P77853-Tth-T134-80蛋白(SEQIDNO:1640)(系列80)和P77853-Tth-T134-95蛋白(SEQID NO:1645)(系列95)的蛋白质印迹,这些蛋白在37℃(前述每个系列的左泳道)和70℃(前述 每个系列的游泳道)下进行了1小时的预热处理。同时该图还显示了含有空载体对照(VCT) 蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两种蛋白进行预热处理。将各个 蛋白表型列于其对应的泳道上方。
图4A-4C显示了针对S158Tth内含肽修饰的P77853木聚糖酶突变体的蛋白质印迹 分析。
图4A显示了针对S158-19Tth内含肽修饰的P77853木聚糖酶(SEQIDNO:1675)的蛋 白质印迹分析。将蛋白样品在59℃下进行不同时间的培养(0小时、1小时、2小时、3小时、4小 时和6小时)。空载体(V)和野生型P77853对照样品按分子量梯度显示在最右侧。灰色标出的 中间区域遮盖了含有其它样品的泳道。
图4B显示了针对S158-30-103Tth内含肽修饰的P77853木聚糖酶(SEQIDNO:1701) 的蛋白质印迹分析。如图所示,将蛋白样品在37℃、50℃、59℃和65℃下进行不同时间的培 养(1小时、2小时、3小时、4小时和6小时)。空载体(V)和野生型P77853对照样品按分子量梯 度显示在最右侧。
图4C显示了针对T134-100-101Tth内含肽修饰的P77853木聚糖酶(SEQIDNO: 1711)的蛋白质印迹分析。如图所示,将蛋白样品在37℃、50℃、59℃和65℃下进行不同时间 的培养(1小时、2小时、4小时、6小时和17小时)。空载体(V)和野生型P77853对照样品按分子 量梯度显示在最右侧。
图5显示了在酵母细胞中表达和分泌内含肽修饰蛋白,例如来源于解纤维热酸菌 (Acidothermuscellulolyticus)的内切葡聚糖酶的质粒载体;。
图6显示了对能表达P07981(在里氏木霉(Trichodermareesei)中的内切葡聚糖 酶EG-1)、P54583或白蛋白(作为阴性对照)的毕赤酵母株(Pichia)进行的活性分析。
图7显示了对酿酒酵母(S.cerevisiae)中P54583的分泌进行的平板分析。
图8显示了P54583在不同pH水平及不同温度下的活性。
图9显示了P54583在不同时间点及不同温度下的活性。
图10显示了P54583的PNP-C分析。
图11显示了用微晶纤维素对P54583进行的提纯。
图12显示了野生型P54583的蛋白质印迹检测。
图13显示了P54583中的候选内含肽插入点。
图14显示了对内含肽修饰的内切葡聚糖酶进行编码的基因的装配策略(assembly strategy)。
图15显示了针对内含肽修饰的内切葡聚糖酶在不同温度处理下作出反应行为的 评分。
图16显示了针对内含肽修饰的内切葡聚糖酶的活性分析。
图17显示了针对多种内含肽修饰的P54583蛋白的蛋白质印迹分析。
图18A-C显示了产生诱变处理文库(mutangenizedlibraries)的易错PCR(error pronePCR)。
图19显示了缺陷内含肽(crippledintein)对P54583酶活性的影响。
图20显示了在不同温度的预温育下的酶活性恢复。
图21显示了P54583在不同温度下进行预温育后的酶活性恢复,该P54583携带有位 于S237位点的微小内含肽。
图22显示了预温育时间和内含肽修饰的内切葡聚糖酶的活化。每个系列(1、2、3和 4)中从左至右连续的条形代表进行了0小时、2小时、4小时、6小时和10小时预温育。
图23显示了针对内含肽修饰的内切葡聚糖酶文库的高通量内切葡聚糖酶分析结 果。
图24显示了经诱变处理后的内含肽修饰的内切葡聚糖酶文库筛选。
图25显示了对经诱变处理后的内含肽修饰的内切葡聚糖酶文库中的候选者进行 的重复活性分析。
图26显示了内含肽修饰的内切葡聚糖酶的热诱导酶活性,该内含肽修饰的内切葡 聚糖酶携带有位于Tth内含肽中R51位点的突变。
图27显示了内切葡聚糖酶的系统树。
图28显示了表达和分泌内含肽修饰蛋白的质粒载体;例如,酵母中表达和分泌来 源于白蚁的内切葡聚糖酶的质粒载体。
图29显示了表达空表达载体(emptyexpressionvector)、编码NtEG的表达载体、 编码不含天然信号肽(nativesignalpeptide)的NtEG突变体的表达载体的酵母。
图30显示了NtEG及不含天然信号肽的NtEG突变体在一定范围的温度下的内切葡 聚糖酶活性。
图31显示了不含天然信号肽的NtEG突变体和P54583在一定范围的pH下的内切葡 聚糖酶活性。
图32显示了不含天然信号肽的NtEG突变体在具有或不具有组氨酸标签情况下的 内切葡聚糖酶活性。
图33显示了能编码内含肽修饰的NtEG内切葡聚糖酶的基因的装配策略。
图34显示了酵母细胞酶活性的时间进程,该酵母细胞能对内含肽修饰的白蚁酶切 葡聚糖酶进行表达。
图35显示了λII载体中的表达盒。
图36A-D显示了pH为6.5时,对实施例15中内含肽修饰的P77853进行的T134和S158 插入位点的转化检测(switchingassay)。将系列的内含肽插入P77853的S158位点(图 36A-B)和T143位点(图36C-D)。将高温和低温下的活性相对于野生型P77853绘制成图(图 36A和C)。将高温活性对诱导倍数(高温活性/低温活性)也绘制成图(图36B和D)。内含肽因 其宿主的嗜热性而发生分解。纵向的短划线代表10%的低温野生型活性。横向短划线代表 40%的高温野生型活性。
图37A-D显示了pH为7.5时,对实施例15中内含肽修饰的P77853进行的T134和S 158插入位点的转化检测。将系列的内含肽插入P77853的S158位点(图37A-B)和T143位点 (图37C-D)。将高温和低温下的活性与野生型P77853进行比较绘制成图(图37A和C)。将高温 活性对诱导倍数(高温活性/低温活性)也绘制成图(图37B和D)。内含肽因其宿主的嗜热性 而发生分解。纵向短划线代表10%的低温野生型活性。横向短划线代表40%的高温野生型活 性。
图38A-D显示了实施例15中的最高活性候选者。将系列的内含肽插入P77853的 S158位点(图38A和C)和T143位点(图39B和D)。将前20个最高活性候选者在pH为6.5(图38A 和B)和pH为7.5(图38C和D)下,进行高温热处理(每个样品的右侧条形)和低温热处理(每个 样品的左侧条形)后的活性与野生型和空载体进行比较绘制成图。活性轴上2到4之间的短 划线代表40%的高温野生型活性。活性轴2下方的短划线代表10%的低温野生型活性。
图39A-D显示了实施例15中的不同转化类(switchingclasses)的实例。图39A和C 显示了针对P77853的S158内含肽插入的数据,图39B和D显示了针对P77853的T134内含肽 插入的DNA。图39A和B对应的是在pH为6.5时进行的热处理。图39C和D对应的是在pH为7.5时 进行的热处理。活性轴上2到4之间的短划线代表40%的高温野生型活性。活性轴2下方的短 划线代表10%的低温野生型活性。
图40显示了对实施例15中最佳表现候选者(AS-146、AS-2、AS-79、AS-83)的再评 价,以及它们与低表现者(AS-8)、阳性对照(P77853)和空白载体对照(pBS)的比较。活性轴 上1上方的短划线代表40%的高温野生型活性。活性轴上0.5下方的短划线代表10%的低温野 生型活性。
图41显示了P77853在S158插入位点(AS-2、AS-79、AS-83和AS-146)以及T134插入 位点(AT-2、AT-83、AT-149、AT-154)的最佳表现候选者的蛋白质印迹。pBS为空载体对照, P77为阳性对照(P77853)。每个样品的左侧和右侧条形分别代表来自相同裂解液的低温等 份(37℃/4小时)和加热等份(60℃/4小时)。箭头代表内含肽修饰的P77853前体,NC标记了 成熟蛋白的位点。
图42A和B显示了基于耐热性的活性和转化的差别。针对来自嗜热/超嗜热生物(每 个样品标签的右侧条形表示)的内含肽和来自嗜常温/UNK生物(每个样品标签的左侧条形 表示),将高温下具有高活性的候选者分数(图42A)与高于2X转化的候选者分数(图42B)进 行比较。
图43A和B显示了基于内含肽长度的活性和转化的差别。针对长度<240个氨基酸的 内含肽(每个样品的左侧条形表示)和长度>240个氨基酸的内含肽(每个样品的右侧条形表 示),将高温下具有高活性的候选者分数(图43A)与高于2X转化的候选者分数(图43B)进行 比较。
图44A-D显示了在最高命中率(tophits)之间的序列相似度。图44A和C显示了针 对P77853的S158内含肽插入的序列相似度,图44B和D显示了针对P77853的T134内含肽插入 的序列相似度。图44A和B显示了在pH为6.5时进行热处理的序列相似度。图44C和D显示了 “最高命中率”(定义为>40重量%活性,或>30重量%活性且>2X转化)和“无命中”(余下序列) 在pH为7.5进行热处理的序列相似度。图44A-D反映了同时是最高命中率(每个样品的两个 样品标签的左侧条形为“相似的最高命中率”)或无命中(每个样品的两个样品标签中右侧 条形为“相似的无命中”)的相似序列(E值<1e-20)的分数。
具体实施方式
除非另有说明,本文使用的技术和科技术语具有本发明所属领域技术人员公知的 意义。本文实施方式中的方法可以与本领域技术人员已知的其它筛选和应用方法进行替换 或结合。“至少一种”短语之后跟随有一种或多种项目清单,例如“A、B或C”,表示A、B或C中的 任意一个或它们的任意组合。
本文中使用的“外显肽”指的是内含肽修饰蛋白中不属于内含肽的部分。
本文中使用的“氨基末端外显肽(aminoterminalextein)”、“N-末端外显肽”或 “N-外显肽”具有相同的意思,指的是位于内含肽N-末端残基之前的外显肽。在装配的内含 肽修饰蛋白中,将氨基末端外显肽、N-末端外显肽或N-外显肽的羧基端融合到内含肽的氨 基端上。
本文使用的“羧基末端外显肽”、“C-末端外显肽”或“C-外显肽”具有相同的意思, 指的是位于内含肽C-末端残基之后的外显肽。在装配的内含肽修饰蛋白中,将羧基末端外 显肽、C-末端外显肽或C-外显肽的氨基端融合到内含肽的羧基端上。
本文使用的“靶蛋白”是其中插入了内含肽的蛋白,或者是将要插入内含肽的候选 者。插入内含肽之前,可以根据将要进行插入的位点将靶蛋白的各个部分称为外显肽、氨基 末端外显肽或羧基末端外显肽。
“靶蛋白”可以是酶,因此术语“靶酶”表示这样的“靶蛋白”:该靶蛋白是一种酶。
本文使用的“许可型”或“P”指的是这样的内含肽修饰:其中,内含肽修饰蛋白在插 入内含肽后保持了功能,或者将内含肽从蛋白质中切开或剪接出来后,剩下了具有功能的 外显肽或连接蛋白。
本文中使用的“非许可型”或“NP”指的是这样的内含肽修饰,其中,内含肽修饰蛋 白在插入内含肽后具有减弱了的功能。
本文使用的“热敏”指的是这样的内含肽修饰:其中,内含肽修饰蛋白在暴露在一 定温度或一定范围的温度下时具有更强的功能,或者将内含肽从蛋白质中剪接出来后,剩 下了在暴露在一定温度或一定范围的温度下时具有更强的功能的外显肽或连接蛋白。
本文中使用的“转化”指的是内含肽修饰蛋白响应物理或化学条件的改变而发生 的活性变化。能产生“转化”或“转化子(switcher)”内含肽修饰蛋白的内含肽修饰在条件发 生改变前是非许可型,在条件发生改变后成为许可型。转化可以在存在内含肽、内含肽从外 显肽上切开、或内含肽发生切开且外显肽发生连接时产生。
本文中的“热敏转化剪接”或“TSP”指的是这样的内含肽修饰蛋白:其中,内含肽对 诱导温度或诱导温度范围作出应答发生剪接。所述内含肽修饰蛋白可以在暴露于非诱导温 度或诱导温度范围之外的温度之前时是非许可型,当暴露在于诱导温度或诱导温度范围之 后为许可型。
本文中使用的“分离核酸”、“分离多核苷酸”、“分离寡核苷酸”、“分离DNA”或“分离 RNA”指的是从产生它们的生物中,或者从经常与其有关的天然存在的基因组、地点、或分子 中分离出来的,或者通过合成工艺制得的核酸、多核苷酸、寡核苷酸、DNA或RNA。
本文中使用的“分离蛋白”、“分离多肽”、“分离寡肽”或“分离肽”指的是从产生它 们的生物中,或者从经常与其有关的天然存在的地点或分子中分离出来的,或者通过合成 工艺制得的蛋白、多肽、寡肽或肽。
本文中使用的“变体”指的是保持了与原始序列相同或基本相似的生物活性的分 子。所述变体可以是来自相同或不同的物种,或者是基于天然分子或优先分子(prior molecule)合成的序列。
本文中提到的核酸、核苷酸序列、蛋白质或氨基酸序列可以是分离的、提纯的、化 学合成的、或通过重组DNA技术制得。上述方法均为本领域所公知。
本文中使用的“可操作地连接”指的是两个或更多个生物分子或部分的一个或更 多个生物分子中在彼此相关的结构中的关系,使所述生物分子的正常功能得以发挥。涉及 核苷酸序列时,“可操作地连接”指的是两个或更多个核酸序列通过酶的连接作用或其它方 式在彼此相关的结构中的关系,使所述序列的正常功能得以发挥。例如,如果编码前序列或 分泌前导区的核苷酸序列能表达为参与多肽分泌的前蛋白,则该核苷酸序列是可操作地连 接到多肽的核苷酸序列中的;如果启动子或增强子能影响编码序列的转录,则该启动子或 增强子是可操作地连接到所述编码序列上的;如果核糖体结合位点的位置有利于翻译编码 序列,则该核糖体结合位点可操作地连接到所述编码序列上。
提供了具有可控活性的分离蛋白、能编码所述分离蛋白的分离核酸、测定内含肽 插入位点的方法以及控制蛋白活性的方法。可以将所述蛋白或核酸提供在植物、微生物和 其它生物内。通过控制作用,可以将一种或更多中蛋白或核酸用于燃料、纤维、生面、化学制 品、糖类、织物、浆料、纸张、人类食物或动物饲料的制造。优选地,表达宿主的一种或多种的 生长、生理或其它性能特征不会轻易受到所述蛋白或核酸的干扰。待受控蛋白可以是一种 酶,也可以是任意种类的蛋白,包括非酶、结构蛋白或激素。
使用内含肽是一种控制蛋白活性的方法,这种控制允许内含肽修饰蛋白以预定义 的活性水平进行表达。内含肽是能够自切割和自连接的多肽。将同时具备自切割和自连接 的属性总称为“自剪接”或“剪接”。内含肽从蛋白中切割出来,并对其所切割的蛋白序列(外 显肽)的连接作用进行介导,从而对该蛋白进行剪接。内含肽可以插入蛋白序列内部或与蛋 白末端融合。蛋白中的内含肽插入物可以通过这种方式来对蛋白进行控制:产生的蛋白在 内含肽存在时具有一种活性,当内含肽被切割或剪接后该蛋白具有另一种活性。在某些情 况下,通过不同诱导条件中的一种或多种能对内含肽剪接反应进行控制。当通常情况下对 宿主有害的活性被降低后,内含肽就可以保护表达宿主不受到蛋白对生长、生理学或产量 造成的不利影响。对蛋白进行表达后,可以通过使被修饰的蛋白暴露在能诱发内含肽剪接 的反应条件中来改变蛋白活性。剪接后产生的蛋白可能具有更强的活性。在一种实施方式 中,内含肽修饰在低温下是非许可型而在较高温度下是许可型,因此内含肽修饰蛋白会在 温度从低温向较高温度变化时发生转化。但是,在一些实施方式中,经过切割和/或连接的 酶具有较低的活性。能编码内含肽修饰蛋白的核酸可以是在植物中进行表达的最佳密码 子。可以用本发明实施方式的内含肽进行修饰的靶蛋白包括但不限于细胞壁降解酶、木素 纤维素降解酶、木聚糖酶和纤维素酶。本文公开的全部蛋白都可以作为进行内含肽修饰的 靶蛋白。
可以用选自由Mth内含肽、Psp-Pol内含肽、微小Psp-Pol(mPsp-Pol)内含肽、RecA 内含肽、Tac内含肽、Tag内含肽、Tth内含肽、微小Tth内含肽,或它们的衍生物所组成的组中 的内含肽对靶蛋白进行修饰。Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含 肽、Tac内含肽、Tag内含肽、Tth内含肽和微小Tth(mTth)内含肽可以分别含有SEQIDNOS: 2、3、4-87、88、89、90、91和92-103所示的序列。但内含肽也可以有其它来源,或者是被修饰 的天然内含肽形式。
提供了分离的内含肽修饰的木聚糖酶。发生内含肽切割或内含肽剪接之前和之后 的内含肽修饰的木聚糖酶的实施方式具有不同的活性。在一种实施方式中,通过将内含肽 修饰的木聚糖酶暴露在诱导条件下来诱发内含肽的切割或剪接。所述诱导条件可以是提高 温度,但不仅限于此。提高的温度可以是但不限于50-70℃的范围,包括50℃和70℃的温度, 或者是在上述范围内任意两个整数温度之间的子区间。所提高的温度可以大于或等于在 25-70℃内以整数递增的温度。所提高的温度可以大于或等于50℃、55℃、59.9℃、60℃、65 ℃或70℃。编码内含肽修饰的木聚糖酶的核酸是优选但非必要的为在植物中进行表达而进 行了密码子优化的。在一种实施方式中,可以使内含肽修饰的木聚糖酶在转基因植物中进 行表达。
提供了分离的内含肽修饰的纤维素酶。发生内含肽切割或内含肽剪接之前和之后 的内含肽修饰的纤维素酶的实施方式具有不同的活性。在一种实施方式中,通过将内含肽 修饰的纤维素酶暴露在诱导条件下来诱发内含肽的切割或剪接。所述诱导条件可以是提高 温度,但不仅限于此。提高的温度可以是但不限于50-70℃的范围,包括50℃和70℃的温度, 或者是在上述范围内任意两个整数温度之间的子区间。所提高的温度可以大于或等于在 25-70℃内以整数递增的温度。所提高的温度可以大于或等于45℃、50℃、55℃、60℃、62℃ 或65℃。编码内含肽修饰的纤维素酶的核酸是优选但非必要的为在植物中进行表达而进行 了密码子优化的。在一种实施方式中,可以使内含肽修饰的纤维素酶在转基因植物中进行 表达。
可以作为靶蛋白的木聚糖酶包括但不限于来自嗜热网球菌(Dictyoglomus thermophilum)的β-1,4-木聚糖酶229B(登录号为P77853,SEQIDNO:104)、来自热纤梭菌 (Clostridiumthermocellum)的内-1,4-β-木聚糖酶(登录号为P51584,SEQIDNO:105)、 来自芽孢杆菌(Bacillussp.)NG-27的碱性耐热内木聚糖酶前体(登录号为O30700,SEQID NO:106),来自疏棉状嗜热丝孢菌(Thermomyceslanuginosus)的内-1,4-β-木聚糖酶(登录 号为O43097,SEQIDNO:107)和来自粪堆梭菌(Clostridiumstercorarium)的耐热胞外木 聚糖酶(celloxylanase)(登录号为P40942,SEQIDNO:108)。可以用一种或多种不同的内 含肽对木聚糖酶进行修饰,包括但不限于选自由Mth内含肽、Psp-Pol内含肽、微小Psp-Pol 内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、微小Tth内含肽或它们的衍生物所 组成的组中的至少一种。在一种实施方式中,所述Mth内含肽、Psp-Pol内含肽、微小Psp-Pol 内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、或微小Tth内含肽的分别具有SEQ IDNOS:2、3、4-87、88、89、90、91、或92-103所示的序列。可以在木聚糖酶内多个候选位点中 的一个或多个位点上插入一个或多个内含肽。
可以作为靶蛋白的纤维素酶包括但不限于热纤梭菌celK(Clostridium thermocellumcelK)纤维素酶(登录号为O68438(SEQIDNO:109))、褐色热单胞菌celB (ThermomonosporafuscacelB)纤维素酶(登录号为P26222(SEQIDNO:110))、来自解纤 维热酸菌(Acidothermuscellulolyticus)的Ace1内切葡聚糖酶E1(登录号为P54583(SEQ IDNO:111))以及高山象白蚁(Nasutitermestakasagoensis)NtEG纤维素酶(登录号为 O77044(SEQIDNO:112))。可以用一种或更多种不同的内含肽对纤维素酶进行修饰,所述内 含肽包括但不限于选自由Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、 Tac内含肽、Tag内含肽、Tth内含肽、微小Tth内含肽或它们的衍生物所组成的组中的至少一 种。在一种实施方式中,所述Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、 Tac内含肽、Tag内含肽、Tth内含肽、或微小Tth内含肽的分别具有SEQIDNOS:2、3、4-87、 88、89、90、91、或92-103所示的序列。可以在纤维素酶内多个候选位点中的一个或多个位点 上插入一个或多个内含肽。
可以通过标准分子生物学技术制备内含肽修饰蛋白,然后进行筛选。可以使内含 肽、靶蛋白或内含肽修饰蛋白发生突变,然后进行筛选。可用的筛选系统包括λ噬菌体、酵母 或其它允许蛋白产生和/或能测试该蛋白的物理和/或功能特性的表达系统。可以将候选者 从内含肽修饰蛋白或突变内含肽修饰蛋白群中分离出来,并进一步进行分析。进一步进行 的分析可以包括DNA测序、功能分析法、结构分析、酶活性分析和监测活性、结构发生的变 化,或者对诱导条件作出应答而发生的剪接。
诱导条件可以包括将内含肽修饰蛋白暴露在变化的物理或化学条件发生中,例如 但不限于温度、pH、剪接抑制剂的浓度、配体浓度、光、盐条件和压力方面的改变。可以通过 对天然内含肽或突变内含肽进行的筛选来测定诱导条件。此外,也可以从能适应所期待的 诱导条件下生活的生物中获得内含肽。例如,可以从嗜冷菌(psychrophile)、中温菌或嗜热 菌(例如,骑行纳古菌(Nanoarchaeumequitans)、深海火球菌(Pyrococcusabyssi)或火球 菌(Pyrococcussp.))中分离出温度诱导型内含肽;可以从嗜酸菌、嗜碱菌或嗜中性菌(例 如,火球菌、结核分枝杆菌(Mycobacteriumtuberculosis)、酿酒酵母(Saccharomyces cerevisiae))中分离出pH诱导型内含肽;同时可以从嗜盐菌中分离出盐诱导型内含肽。还 对化学诱导或化学抑制的内含肽进行了确认。作为化学诱导或化学抑制的内含肽的非限制 性实例,从酿酒酵母中分离出来的液泡ATP酶亚基(VMA)内含肽通过暴露在DTT、NH2OH或半 胱氨酸中而发生了诱导性的切割;存在Zn2+的时候,从分枝杆菌(Mycobacterium)中分离出 来的内含肽和从酵母菌属(Saccharomyces)中分离出来的其它内含肽呈现出受抑制的剪 接。可以通过撤去抑制条件来对受抑制的内含肽进行诱导。可以使天然内含肽发生突变并 对其进行筛选,以测定在期望诱导条件下可诱导的内含肽中是否产生了突变。可以在内含 肽修饰蛋白中提供上述任意来源的内含肽。
可以通过实验测定内含肽的插入位点。为了测定插入位点是否允许进行内含肽剪 接,可以使用本领域已知的方法构造和克隆内含肽-蛋白融合基因、使该内含肽修饰蛋白得 到表达,并测试内含肽修饰蛋白自发地或在诱导条件下发生剪接的能力。
为了避免将任何额外的氨基酸引入蛋白中,并可能由此使蛋白功能或活性发生改 变的情况,可以将蛋白质中存在的天然半胱氨酸、丝氨酸和苏氨酸筛选为潜在的内含肽插 入位点。插入后,可以在以改变蛋白功能为目的的内含肽切割和/或连接之前和之后对蛋白 进行测试。
通过在新接头位点引入半胱氨酸、丝氨酸或苏氨酸可以将内含肽插入到蛋白中任 意位置。可以通过对蛋白内的氨基酸进行取代反应或者通过插入半胱氨酸、丝氨酸或苏氨 酸来引入半胱氨酸、丝氨酸或苏氨酸。在新接头位点处插入内含肽时,该内含肽的羧基端将 与羧基外显肽氨基端的第一氨基酸发生融合。如果引入的半胱氨酸、丝氨酸或苏氨酸在蛋 白内的位置能促进内含肽的插入,那么在随后的剪接反应中将该氨基酸留在所述蛋白内。 剪接反应后留在成熟蛋白中的引入氨基酸可能对蛋白的功能或活性产生干扰,因此人们需 要对经这种剪接反应后得到含有引入氨基酸的所有蛋白的功能和活性进行证实。本领域已 知通过功能分析法来对所有已被赋予了功能的蛋白的功能进行测定。
鉴于许多蛋白中含有多个半胱氨酸、丝氨酸和苏氨酸,因此希望对那些经测试能 进行内含肽剪接的插入位点进行等级排序,或者甚至对这些插入位点的数量进行限制。可 以用三个特点来预测内含肽插入位点是:A)支持向量机(supportvectormachine,SVM)所 描述的局部序列,B)插入位点到活性位点残基的距离,以及C)插入位点与局部二级结构的 邻近程度(例如,在α-螺旋结构或β-片状结构端部处或附近)。在一种实施方式中,使用局部 序列和到活性位点的距离来缩小推荐插入位点的选择范围,而二级结构元件信息则能用于 对相似的插入位点进行优选。
A)局部序列
可使用SVM法来对内含肽插入位点进行预测或评价。可以由已知的天然内含肽插 入位点装配成合适的已知内含肽插入位点训练组(训练组)。可以在Perler,F.B.(2002), InBase,TheInteinDatabase(内含肽数据库),Nuc.AcidsRes.30:383-384中记载的NEB inbase数据库中找到用于该目的的已知内含肽插入位点序列,通过引用该文献全部记载而 将其整体与本文结合。优选地,训练组内含肽插入位点具有SEQIDNOS:1233-1512的序列。 用于上述目的的蛋白序列的一种来源是NCBI数据库,也可以使用其它的来源。含有对应于 SEQIDNOS:1233-1512训练组内含肽插入位点的内含肽的蛋白分别具有SEQIDNOS:393- 672序列。基于内含肽序列(SEQIDNOS:113-392)和含内含肽的蛋白序列(SEQIDNOS: 393-672),可以将各个含内含肽的蛋白的外显肽序列从每个内含肽序列中分离出来。SEQ IDNOS:393-672蛋白序列中的N-外显肽分别以SEQIDNOS:673-952表示,而SEQIDNOS: 393-672蛋白序列中的C-外显肽分别以SEQIDNOS:953-1232表示。为了SVM序列预测的生 成,对N-外显肽及C-外显肽中的含有插入位点X和环绕X的序列的盒(cassette)进行测定。 优选地,被分析的序列包括环绕X的-3号到+2号(总计6个氨基酸,编号为-3、-2、-1、0、1、2) 的氨基酸盒(NNNXNN序列中,X为0号氨基酸)。下面以NNNXNN盒作为SVM模型进行描述。如果 采用了NNNXNN以外的盒,则根据本文的描述可以显然得知需要对SVM进行修改。
用下面的等式将盒换算成向量V:
V=[位点-3位点-2位点-1位点0位点+1位点+2]
其中,
位点i=[aaiALAaaiARG…aaiTRPaaiTYR]
如果位点i存在氨基酸型N时,aaiN=1;否则,N=0。这将6个氨基酸的盒序列换算成1 ×120的向量。将用于含有内含肽的SEQIDNOS:393-672蛋白的插入位点盒分别提供在SEQ IDNOS:1233-1512中。将这一组插入位点盒的向量用作真阳性对照组来训练SVM。在每个具 有真阳性的蛋白中,同时还从N-外显肽序列和C-外显肽序列中选择3个在X(0)处具有半胱 氨酸、苏氨酸和丝氨酸(本文中称为“C/T/S”)但不含内含肽插入无的随机NNNXNN盒(优选来 自序列SEQIDNOS:673-1232)作为真阴性。然后对来自外显肽序列的真阴性组进行编译。 被选择的真阴性可以来自与真阳性插入位点相同的蛋白,并在X处具有与真阳性相同的残 基类型。
在整套内含肽插入位点序列上对用来预测内含肽插入位点的总SVM进行训练,同 时除去全部相同的序列。这可以通过执行多种不同方法或程序中的任何一种来进行。一种 可以用来预测内含肽插入位点的SVM程序为SVM_lightV6.02(2008年8月14日),该程序可 商购自ThorstenJoachimsWeichgutLLC,Ithaca,NY,通过引用其全部内容将其与本文结 合。同时参见ThorstenJoachims的“产生大量SVM学习实践”(Makinglarge-ScaleSVM LearningPractical)。在Kernel法中进行了改进——支持向量学习,B.Scholkopf和 C.Burges和A.Smola(编译),MIT-出版社,1999,通过引用其全部内容将其与本文结合。简而 言之,SVM_lightV6.02是上述提到的Joachims1999出版物(该出版物解释了与大量问题 有关的较大训练组的困难)的支持向量机训练法的实践。通过以高效方式选择工作组变量, 将算法构建在在解决上述问题的分解策略的基础上。通过SVM_lightV6.02采用了线性核 (linearkernel)和设定至1的成本因素,从而使阳性组和阴性组中的差错具有同等重要 性。
为了测试该方法的正确性,可以选择较小组的插入位点盒按照下面的方法进行训 练和测试:1)随机选择m组具有单一序列的真阳性训练组插入位点(在一种实施方式中,m为 1-250,所述序列选自SEQIDNOS:1233-1512);2)针对每个真阳性插入位点,从同一个含内 含肽蛋白(在一种实施方式中,SEQIDNOS:673-1232)中与所述真阳性插入位点有关的外 显肽中随机选择三个对应的真阴性盒,其中,真阴性插入位点具有相同的中心氨基酸X但不 含有内含肽插入物,和3)可以将步骤1)组内未被选择的余下其它单一序列选为测试组(例 如,SEQIDNOS:1233-1512中余下的序列)。接着,采用与进行总量预测的相同方法来对支 持向量进行训练,然后用这些支持向量对测试组进行评分,所述支持向量包括已知插入位 点盒——以正值表示,和选自在0位具有半胱氨酸、苏氨酸或丝氨酸的外显肽(SEQIDNOS: 673-1232)的全部其它非插入位点盒——以负值表示。
然后将对每个蛋白的大量位点进行的评分进行比较,并根据其分值将插入位点进 行分级。为了得到用于比较的基度(metric),可以为每个内含肽插入位点指定一个数值,该 数值是通过将SVM评分低于插入位点(L)的位点数量除以测试组中全部位点数量减去1 ((Nn)之后计算得到的比值,或表示为L/Nn。结果为1的基度意味着插入位点的数量大于全 部其它位点的数量,而结果为0的基度则意味着插入位点的数量小于全部其它位点的数量。 可以将上述过程在各个不同大小的训练组中重复进行25次,其中,每次过程都是基于SEQ IDNOS:1233-1512中的插入位点盒进行的随机选择之上,而相应的真阴性插入位点对应地 选自待训练和测试的SEQIDNOS:673-1232中。下表1显示了使用上述训练和测试程序的针 对已知内含肽插入位点的基度。表1中针对已知内含肽插入位点的平均基度以及各个不同 大小训练组的标准偏差是建立在优选实施方式的基础上的,该优选实施方式包括选自SEQ IDNOS:673-1512的训练和测试组序列。对于大小为25个或更多的训练组来说,内含肽插入 位点的平均值为0.75个基度。由此具有150个插入位点盒的训练组的p值大约为10-10显示出 统计学上的显著性。基于局部序列的特征,可以通过SVM对任意靶蛋白的潜在内含肽插入物 位点进行筛选,进而对能用来调整靶蛋白活性的插入位点进行预测。在一种实施方式中,选 择等级为0.75或更高的候选插入位点作为插入内含肽的位点。
表1
训练组大小 平均基度 标准偏差 SV数量 1 0.57 0.068 3 25 0.73 0.032 75 50 0.74 0.031 150 75 0.75 0.045 225 100 0.75 0.048 300 125 0.77 0.054 375 150 0.75 0.052 450
175 0.77 0.062 525 200 0.76 0.071 600 225 0.77 0.070 675 250 0.86 0.133 750
优选的NNNXNN内含肽插入无盒组包括含有以下序列的组:GGKCGG、GGKSGG、 GGKTGG、PGATSP、PGATVP、GAKSLG、PGATSL,PGASPL,PGATGP,AQRSLG,NQPSIV,NQASIV,PNMSSA, GNHSSG,PSHSAY,SLMSSC,TNTSNY,IDTSRN,PSTSAY,QIKSLG,FETCNY,AVLSVN,LVYSAH,AGYSSA, MWGTLR,LSASSY,FAQTQI,GGRSFV,SFVCGF,GFGSNP,NPPTRP,HHRSSS,HRSSSC,RSSSCP,DWNTFN, TFNSPD,DDRSDY,EVATDY,NQVTEL,SSVTFW,LRESVW,RFHTLV,DLSSVT,DNHTWL,DYNTEV,LDVSLY, HYNSIV,ADLSSV,NIITEL,GHQTHI,MRNSPW,RFHTLV,DYNTDD,DKYSWL,LDMSIY,HNQTPT,DIKSWD, WGISDK,SGATDL,YYYSWW,SWWSDG、NFGTYD,GKTTRV,NAPSID,GTQTFD,QYWSVR,IVATEG,GYFSSG, NGNSYL,YGWTRN,YDPSSG,LGKTTR,YFSSGY,IDHTDS,SWSTNE,HTDSWS,NEITIN,DSWSTN,LDQSYV, EDPTIT,SYVTGY,PWGSNS,GSNSFI,TPGSGG,TNYSHP,DGMSYL,PQKCYI,DLISLM,LMSSCM,AGSSQA, AGHSAW,GIATNT,ATNTSN,CDPSGR,PQGTWF,VIDTSR,QGLTSL,SGQSAL,NGDSYW,SGDTGG,GVQSYN, LVYSAH,EFGTTL,FQWTFW,TFWSWN,NPDSGD,GYQSSG,IVESWG,GWSTNP,NLGTID,TGNTTM,NGNSYL, YGWSTN,YQSSGS、SNASGT或DGGTYD(分别是SEQIDNO:1513-1628)。
B)插入位点到活性位点残基的距离
虽然将蛋白内任意点的内含肽插入物都列入了考虑,但是可以选择靠近蛋白活性 位点的内含肽插入位点。通过图1所示内容可以发现,在活性位点25埃以内的内含肽插入位 点比超出该范围的内含肽插入位点更普遍。图1中,通过对i)插入位点中最接近活性位点的 氨基酸的原子到ii)活性位点中最接近插入位点氨基酸的原子进行测量得到插入位点和活 性位点之间的距离。可以将内含肽插入到离活性位点距离小于或等于25埃、24埃、23埃、22 埃、21埃、20埃、19埃、18埃、17埃、16埃、15埃、14埃、13埃、12埃、11埃、10埃、9埃、8埃、7埃、6 埃、5埃、4埃、3埃、2埃、或1埃的位置处。在一种实施方式中,内含肽插入位点位于离靶蛋白 活性位点10埃或更近的位置。本文中使用的“10埃以内”指的是10埃或更近的距离。插入位 点也可以是远离蛋白中一级结构或二级结构中的活性位点,这可以通过直接距离(而非氨 基酸或二级结构界标的数量)来对距离进行测量。可以通过参考已出版的数据或晶体学、核 磁共振或同源模型来获得蛋白的特性以插入位点残基到活性位点的距离。可以使用缺省参 数通过Swissprot(SWISS-MODELandtheSwiss-PdbViewer:Anenvironmentfor comparativeproteinmodeling.Guex,N.andPeitsch,M.C.(1997)Electrophoresis18, 2714-2723,通过引用该文献全部记载而将其整体与本文结合)来构建同源模型。参考有关 特异性蛋白的文献,或者使用以下文献中描述的对活性位点的位置的注释可以对活性位点 残基进行:NCBIgenPent文件(数据库来源为国家生物技术信息中心。DavidL.Wheeler、 TanyaBarrett、DennisA.Benson、StephenH.Bryant、KathiCanese、Vyacheslav Chetvernin、DeannaM.Church、MichaelDiCuccio、RonEdgar、ScottFederhen、Lewis Y.Geer、YuriKapustin、OlegKhovayko、DavidLandsman、DavidJ.Lipman、Thomas L.Madden、DonnaR.Maglott、JamesOstell、VadimMiller、KimD.Pruitt、Gregory D.Schuler、EdwinSequeira、StevenT.Sherry、KarlSirotkin、AlexandreSouvorov、 GrigoryStarchenko、RomanL.Tatusov、TatianaA.Tatusova、LukasWagner、andEugene Yaschenko(2007)Nucl.AcidsRes.200735:D5-D12,通过引用该文献全部记载而将其整体 与本文结合)、催化位点图谱数据库(TheCatalyticSiteAtlas:aresourceof catalyticsitesandresiduesidentifiedinenzymesusingstructuraldata)。 CraigT.Porter、GailJ.BartlettandJanetM.Thornton(2004)Nucl.Acids.Res.32:D 129-D133;AnalysisofCatalyticResiduesinEnzymeActiveSites.Gail J.Bartlett、CraigT.Porter、NeeraBorkakotiandJanetM.Thornton(2002)JMol Biol324:105-121;UsingaLibraryofStructuralTemplatesto RecogniseCatalyticSitesandExploretheirEvolutioninHomologous Families.JamesW.Torrance、GailJ.Bartlett、CraigT.Porter、JanetM.Thornton (2005)JMolBiol.347:565-81,通过引用上述文献全部记载而将其整体与本文结合),以 及有关活性位点信息的其它来源。同时还考虑了在其它蛋白位点处或附近的内含肽插入物 (例如但不限于异构影响因子位点)。在其它蛋白位点处或附近的插入位点与其它位点的距 离可以小于或等于25埃、24埃、23埃、22埃、21埃、20埃、19埃、18埃、17埃、16埃、15埃、14埃、 13埃、12埃、11埃、10埃、9埃、8埃、7埃、6埃、5埃、4埃、3埃、2埃或1埃,但不仅限于此。
C)插入位点与局部二级结构的邻近程度
内含肽插入位点可以产生在任意类型的局部二级结构中。在一种实施方式中,内 含肽插入位点位于环-β片状接头或α-螺旋接头附近。本文中使用的“附近”指的是插入位点 位于从环-β片状接头或α-螺旋接头始的10个氨基酸以内。本文中使用的插入位点“位于从 环-β片状接头或α-螺旋接头始的10个氨基酸内”表示的是插入位点位于离环-β片状接头或 α-螺旋接头距离为10个氨基酸、9个氨基酸、8个氨基酸、7个氨基酸、6个氨基酸、5个氨基酸、 4个氨基酸、3个氨基酸、2个氨基酸或1个氨基酸的氨基酸之前,或者插入位点位于环-β片状 接头或α-螺旋接头第10个氨基酸、第9个氨基酸、第8个氨基酸、第7个氨基酸、第6个氨基酸、 第5个氨基酸、第4个氨基酸、第3个氨基酸、第2个氨基酸或第1个氨基酸之前。可以将内含肽 插入在环-β-片状接头的2个氨基酸内,或将其插入到环-α-螺旋接头的2个氨基酸内。本文 中使用的“在2个氨基酸内”表示将内含肽插入到离环-β-片状接头或环-α-螺旋接头2个氨 基酸或1个氨基酸的氨基酸之前,或者将内含肽插入到环-β-片状接头或环-α-螺旋接头第2 个氨基酸或第1个氨基酸之前。其它可以插入内含肽的二级结构包括但不限于,在β-片状结 构中部处或附近、在α-螺旋结构中部处或附近,在环的中部处或附近。
内含肽插入位点预测小结
基于A)通过SVM描述的局部序列、B)插入位点到活性位点残基的距离和C)插入位 点与局部二级结构(例如,环-β-片状接头或环-α-螺旋接头)的邻近程度中的一种或更多 种,可以对能用来预测蛋白活性的内含肽插入位点进行预测,然后通过实验对其进行测试。 可以使用SVM模型对能够将蛋白活性控制在平均水平全部位点中前25%的插入位点进行预 测。内含肽插入位点可以在活性位点残基处,或者离活性位点10埃以内范围内。内含肽插入 位点的局部二级结构可以在具有β片状结构或α-螺旋螺旋结构的环形接头处或附近。
预测插入位点后,可以用内含肽对蛋白进行修饰并对其进行筛选。筛选的方法可 以包括功能分析法,进而测定内含肽修饰蛋白是否具有许可型、非许可型、条件敏感许可 型、热敏许可型或转化表型。筛选的方法还可以包括物理分析,从而能够进行构造使或暴露 到诱导条件下后,对内含肽修饰蛋白内的内含肽是否被剪接、切割,或保留在该内含肽修饰 蛋白内进行测定。用蛋白质印迹可以用来测定内含肽修饰蛋白中的内含肽是否被剪接、切 割或保留在该内含肽修饰蛋白内。功能分析和物理分析的组合可以用来测定内含肽修饰蛋 白是否为条件敏感转化剪接型(condition-sensitiveswitchersplicer)。功能分析和物 理分析的组合可以通过构造蛋白、将其暴露在诱导温度下、和进行功能分析和物理分析的 方法,来测定内含肽修饰蛋白是否为热敏转化剪接型。
通过在任何C/S/T位置前插入内含肽的方法,可以在不进行预测的前提下构造内 含肽修饰蛋白。所述C/S/T位置可以是天然的,也可以是引入的。
内含肽修饰蛋白编码序列可以发生突变。这种突变可以发生在内含肽编码序列、 外显肽编码序列或它们的组合之上。随后构建出突变的内含肽修饰蛋白,并用功能和/或物 理分析对其进行筛选。
在一种实施方式中,提供了一种分离蛋白,该分离蛋白的序列与含有选自由SEQ IDNOS:1629-1784、2373-2686和3313-3322所组成的组中任意一种序列的蛋白至少具有 70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。在一种 实施方式中,与其所对应的SEQIDNOS:1629-1784、2373-2686和3313-3322氨基酸序列的 同一性低于100%的一种或更多种蛋白是所参照的蛋白或氨基酸的变体。在一种实施方式 中,提供了分离蛋白、分离多肽、分离寡肽、或分离肽,与具有SEQIDNOS:1629-1784、2373- 2686和3313-3322中任意序列的蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10- 400个、10-500个、10-600个、10-700个、10-800个、10-900个或10至全部氨基酸相比,所述分 离蛋白、分离多肽、分离寡肽、或分离肽与具有SEQIDNO:1629-1784、2373-2686和3313- 3322中任意序列的蛋白具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%或100%的同一性。这一序列长度分布列表包括了SEQIDNOS:1629-1784、2373- 2686和3313-3322中所有完整长度的蛋白,和该列表中的所有长度较短的蛋白,乃至那些所 含氨基酸不足900的蛋白。例如,具有453个氨基酸的序列可以采用6个、10-50个、10-100个、 10-150个、10-300个、10-400个和10至全部氨基酸的长度。文中提及的氨基酸序列长度的范 围包括该范围内的每一个氨基酸序列长度(端点也包含在内)。提及的氨基酸长度可以始于 参考序列中任意的独立位置(singleposition),只要在该独立位置之后具有足够的符合 所述长度的氨基酸即可。针对具有1000个或更多个氨基酸的序列来说,可以通过增加10- 100N个氨基酸来扩大序列长度的范围,其中N=10或更大的整数。通过Smith-Waterman算法 可以对同一性进行测量(SmithTF,WatermanMS(1981),“IdentificationofCommon MolecularSubsequences”,JournalofMolecularBiology147:195-197,通过引用其全 部内容将其与本文结合)。所含氨基酸序列短于SEQIDNOS:1629-1784、2373-2686和3313- 3322中任意一种的完整长度的肽、寡肽或多肽可以用于多种用途,包括但不限于提高抗体 来检测内含肽修饰蛋白或其片段。所述抗体可以用来检测内含肽修饰蛋白或其片段是否在 植物、植物组织、植物细胞或植物的亚细胞区域或者亚细胞区室中得到了表达。一种实施方 式提供了对分离氨基酸序列上的抗原决定部位进行识别的抗体,所述分离氨基酸序列与具 有SEQIDNOS:1629-1784、2373-2686和3313-3322中任意序列的蛋白中6个、10-50个、10- 100个、10-150个、10-300个、10-400个、10-500个、10-600个、10-700个、10-800个、10-900个 或10至全部的乡里氨基酸残基具有至少90%的同一性。
本领域技术人员可以理解的是,可以通过保守氨基酸取代反应得到上述蛋白或氨 基酸序列的变体,并提供任意上述具有保守氨基酸改变的序列的变体作为其它的实施方 式。本发明的实施方式还包括了具有上述任意序列但不含有合成或非天然产生的氨基酸类 似物(和/或肽键)。保守氨基酸取代反应可以是这样的氨基酸取代反应,该反应不会使多肽 中发生氨基酸取代反应处的相对电荷或大小特征发生改变。一些情况下,采用标准的单字 母密码(onelettercode)使以下氨基酸特异化:丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、天冬 氨酸(D)、谷氨酸(E)、天冬酰胺(N)、谷氨酰胺(Q)、精氨酸(R)、赖氨酸(K)、异亮氨酸(I)、亮 氨酸(L)、蛋氨酸(M)、缬氨酸(V)、苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)、脯氨酸(P)、甘氨酸 (G)、组氨酸(H)、半胱氨酸(C)。“疏水性氨基酸”指的是A、L、I、V、P、F、W和M;“极性氨基酸”指 的是G、S、T、Y、C、N和Q;“带电氨基酸”指的是D、E、H、K和R。保守氨基酸取代反应还包括对蛋 白活性不产生关键作用的氨基酸进行的氨基酸取代反应,或者用具有相似特性(例如,酸 性、碱性、带正性或带负电、极性或非极性、疏水性、带电性等等)的其它氨基酸对氨基酸进 行取代反应,因此对关键氨基酸(criticalaminoacid)进行的取代反应不会使活性发生 显著的改变。以下六组均含有能互相用作保守氨基酸取代物的氨基酸:1)丙氨酸(A)、丝氨 酸(S)、苏氨酸(T);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸 (R)、赖氨酸(K);5)异亮氨酸(I)、亮氨酸(L)、蛋氨酸(M)、缬氨酸(V);和6)苯丙氨酸(F)、酪 氨酸(Y)、色氨酸(W)。本领域技术人员可以理解的是,可以作为保守取代物的不仅限于上面 确认的取代物。比如说,在一些情况下,可以将所有带电氨基酸(无论带有正电还是负电)视 为能互相使用的保守取代物。此外,个体取代反应、能够改变、增加或删除已编码序列中的 单个氨基酸或小部分氨基酸的缺失或插入作用也可以成为保守氨基酸取代反应。在此提出 了保守氨基酸取代物表格(提供了本领域公知的功能类似的氨基酸)和本领域抑制的保守 氨基酸改变。本发明的实施方式中还提出了核酸编码的分离蛋白中的保守核苷酸取代物。 保守核苷酸取代物包括但不限于能影响已编码氨基酸序列中的保守氨基酸取代物的那些。 此外,可以通过对于具有不同密码子的氨基酸的密码子进行取代作用,进而在该氨基酸的 基因序列中产生退化的保守核苷酸取代物。
可以根据本领域技术人员已知的用来制备或改变多肽序列及其编码核酸序列的 方法来获得分离蛋白、分离多肽、分离寡肽或分离肽,以及它们的变体,例如可以从普通分 子生物学文献中获知的内容,例如分子克隆:实验室手册(LaboratoryManual), J.Sambrook等人编辑,第二版,ColdSpringHarborLaboratory出版社,ColdSpring Harbor,N.Y.(1989)或分子生物学实验室指南(CurrentProtocolsinMolecular Biology),F.M.Ausubel等人编辑,JohnWiley&Sons,有限公司,纽约,通过引用这些文献 全部记载而将其整体与本文结合。所述分离蛋白、多肽、寡肽或肽可以含有天然氨基酸、天 然氨基酸类食物或合成氨基酸类似物。
在一种实施方式中,提供了分离核酸或与其互补的分离核酸,其序列与具有SEQ IDNOS:1629-1784、2373-2686和3313-3322中任意一种序列的蛋白具有至少70%、75%、80%、 85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。在一种实施方式中,与 参考序列的同一性低于100%的核酸编码氨基酸能对参考序列的变体进行编码。在一种实施 方式中,提供了分离核酸、多核苷酸、寡核苷酸,与具有SEQIDNOS:1629-1784、2373-2686 和3313-3322中任意序列的蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400 个、10-500个、10-600个、10-700个、10-800个、10-900个或10至全部氨基酸相比,所述分离 核酸、多核苷酸、寡核苷酸的序列编码的氨基酸序列与具有SEQIDNO:1629-1784、2373- 2686和3313-3322中任意序列的蛋白具有至少75%、80%、85%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或100%的同一性。在一种实施方式中提供了所述分离核酸、多核苷酸或寡 核苷酸的互补物。这一序列长度分布列表包括了SEQIDNOS:1629-1784、2373-2686和 3313-3322中所有完整长度的蛋白,和该列表中的所有长度较短的蛋白,乃至那些所含氨基 酸不足900的蛋白。例如,具有453个氨基酸的序列可以采用6个、10-50个、10-100个、10-150 个、10-300个、10-400个和10至全部氨基酸的长度。针对具有1000个或更多个氨基酸的序列 来说,可以通过增加10-100N个氨基酸来扩大序列长度的范围,其中N=10或更大的整数。通 过Smith-Waterman算法可以对同一性进行测量(SmithTF,WatermanMS(1981), “IdentificationofCommonMolecularSubsequences”,JournalofMolecular Biology147:195-197,通过引用其全部内容将其与本文结合)。
在一种实施方式中,提供了一种分离核酸,该分离核酸中的序列与具有SEQID NOS:1629-1784、2373-2686和3313-3322中任意序列的核酸或其互补物发生杂交。在一种实 施方式中,杂交反应的条件可以是低严格度的。在一种实施方式中,杂交反应的条件可以是 中等严格度的。在一种实施方式中,杂交反应的条件可以是高严格度的。进行杂交的方案以 及对杂交方案进行优化的方法的实例在下面的书籍中进行了描述:MolecularCloning, T.Maniatis、E.F.FritschandJ.Sambrook,ColdSpringHarborLaboratory,1982;以 及,CurrentProtocol,F.M.Ausubel,R.Brent,R.E.Kingston,D.D.Moore,J.G.Seidman, J.A.Smith,K.Struhl,Volume1,JohnWiley&Sons,2000,通过引用这些文献的全部内容 将其与本文结合。在实施例(而非限制性)的方式中,中等严格度的杂交反应的条件包括以 下:在68℃下将含有DNA的滤膜在含有6×的SSC(Amresco公司,Solon,OH)、0.5%的SDS (Amersco公司,Solon,OH),5×的登哈特(Denhardt’s)溶液(Amersco,公司,Solon,OH),和 100μg/mL的变性鲑鱼精DNA(Invitrogen生命技术公司,Carlsbad,CA)的溶液中进行2-4小 时的预处理。在每平方厘米的膜上使用约0.2mL的预处理溶液。对溶液作出下列调整后,在 该溶液中进行杂交反应:使用0.01M的EDTA(Amersco公司,Solon,OH),100μg/ml的鲑鱼精 DNA和5-20×106每分钟技术(cpm)的32P-标记的或荧光标记的探针。使滤膜在68℃的杂交反 应混合物中孵化16-20小时,然后在室温(25±5℃)下用含有2×的SSC和0.1%的SDS溶液洗 涤1分钟,同时进行轻度振荡。用含有0.1×的SSC和0.5%的SDS来替换洗液,在68℃下再次进 行2小时的孵化,同时进行轻度振荡。将滤膜进行吸印干燥(blotteddry)和曝光进而在成 像器中进行显像,或者通过自放射显影法进行显像。如有必要,将滤膜进行3次洗涤和再曝 光后进行显像。在实施例(而非限制性)的方式中,低严格度表示采用了低温度进行杂交反 应的杂交条件,例如37-60℃的温度。在实施例(而非限制性)的方式中,高严格度表示的杂 交条件与上述相同(不同的是,使用了高温度),例如,超过68℃的杂交反应温度。
在一种实施方式中,可以将编码至少部分的SEQIDNOS:1629-1784、2373-2686和 3313-3322中任意氨基酸序列的分离核酸、分离多核苷酸或分离寡核苷酸用作杂交反应的 探针或引物。在一种事实方式中,可以使用所述分离核酸、分离多核苷酸或分离寡核苷酸的 互补物作为杂交反应的探针或引物。在一种实施方式中,可以将具有SEQIDNOS:1785- 1923、2052、2058、2687-3000和3323-3330中一种序列或与该序列互补的分离核酸、分离多 核苷酸或分离寡核苷酸用作杂交反应的探针或引物。此处的分离核酸、分离多核苷酸或分 离寡核苷酸的长度可以但不限于10-100个核苷酸、10-90个核苷酸、10-80个核苷酸、10-70 个核苷酸、10-60个核苷酸、10-50个核苷酸、10-40个核苷酸、10-35个核苷酸、10-30个核苷 酸、10-25个核苷酸、10-20个核苷酸或10-15个核苷酸,或者是20-30个核苷酸残基,或25个 核苷酸残基。在此提到了核苷酸序列的范围包括在这个范围内的所有长度的核苷酸序列 (端点也包含在内)。提及的核苷酸长度可以始于参考序列中任意的独立位置,只要在该独 立位置之后具有足够的符合所述长度的核苷酸即可。在一种实施方式中,杂交反应的探针 或引物和具有与作为探针或引物的核酸相同长度的核酸有85-100%、90-100%、91-100%、92- 100%、93-100%、94-100%、95-100%、96-100%、97-100%、98-100%、99-100%或100%的互补,且所 述杂交反应的探针或引物具有的序列选自在编码SEQIDNOS:1629-1784、2373-2686和 3313-3322蛋白之一的核酸或核酸的互补物的范围内的与所述探针或引物长度对应的核苷 酸。在一种实施方式中,杂交反应的探针或引物具有与作为探针或引物的核酸相同长度的 核酸有85-100%、90-100%、91-100%、92-100%、93-100%、94-100%、95-100%、96-100%、97- 100%、98-100%、99-100%或100%的互补,且所述杂交反应的探针或引物具有的序列选自SEQ IDNOS:1785-1923、2052、2058、2687-3000和3323-3330的核酸或该核酸的互补物的范围内 的与所述探针或引物长度对应的核苷酸。在一种实施方式中,杂交反应的探针或引物在其 长度方向上与具有相应长度的编码SEQIDNOS:1629-1784、2373-2686和3313-3322序列之 一的核酸或其互补物进行杂交。在一种实施方式中,杂交反应的探针或引物在其长度方向 上与具有相应长度的SEQIDNOS:1785-1923、2052、2058、2687-3000和3323-3330序列之一 的核酸或其互补物进行杂交。在一种实施方式中,杂交反应可以在低严格度条件下进行。在 一种实施方式中,杂交反应可以在中等严格度条件下进行。在一种实施方式中,杂交反应可 以在高严格度条件下进行。
本发明实施方式中的分离核酸、分离多核苷酸或分离寡核苷酸可以包括天然核苷 酸、天然核苷酸类似物、或合成核苷酸类似物。本发明实施方式中的核酸、多核苷酸或寡核 苷酸可以是任意类型的核酸,包括脱氧核糖核酸(DNA)、核糖核酸(RNA)、或肽核酸(PNA)。列 出的SEQIDNO:1785-1923为DNA序列,还将SEQIDNOS:1785-1923中的U用T代替后的RNA 序列考虑作为本发明实施方式的核酸。
虽然本发明实施方式中可以使用未标记的杂交反应探针或引物,但可以通过检测 的方式对杂交反应的探针或引物进行标记,并可以用来对核酸进行检测、测序或合成。示例 性的标记包括但不限于放射性核元件、吸光的化学部分、染料和荧光部分。所述标记可以是 荧光部分,例如6-羧基荧光素(FAM)、6-羧基-4,7,2’,7’-四氯荧光素(TET)、罗丹明、JOE(2, 7-二甲氧基-4,5-二氯-6-羧基荧光素)、HEX(六氯-6-羧基荧光素)或VIC。
在一种实施方式中,将适于在所期望的宿主内进行表达的表达构建体中提供编码 内含肽修饰蛋白、内含肽修饰蛋白的变体或内含肽修饰蛋白片段的分离核酸、分离多核苷 酸或分离寡核苷酸。内含肽修饰蛋白片段可以包括保持了内含肽修饰蛋白活性的部分内含 肽修饰蛋白。但是所述片段还可以具有其它的用途,例如能够起到产生抗体的抗原的作用, 该抗体随后能用来测定内含肽修饰蛋白或其片段在植物、植物组织、植物细胞或植物的亚 细胞区域或亚细胞区室内还是被从这些地方提取出来。核酸包括的序列能编码这样的氨基 酸序列:该氨基酸序列与具有SEQIDNOS:1629-1784、2373-2686和3313-3322任一序列的 蛋白具有70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一 性。在表达构建体内的内含肽修饰蛋白编码核酸片段可以对这样的氨基酸序列进行编码: 与具有SEQIDNOS:1629-1784、2373-2686和3313-3322中任一序列的蛋白中的6个、10-50 个、10-100个、10-150个、10-300个、10-400个、10-500个、10-600个、10-700个、10-800个、 10-900个或10至全部氨基酸相比,该氨基酸序列与SEQIDNOS:1629-1784、2373-2686和 3313-3322中任一氨基酸序列具有75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或100%的同一性。这一序列长度分布列表包括了SEQIDNOS:1629-1784、2373-2686和 3313-3322中所有完整长度的蛋白,和该列表中的所有长度较短的蛋白,乃至那些所含氨基 酸不足900的蛋白。例如,具有453个氨基酸的序列可以采用6个、10-50个、10-100个、10-150 个、10-300个、10-400个和10至全部氨基酸的长度。针对具有1000个或更多个氨基酸的序列 来说,可以通过增加10-100N个氨基酸来扩大序列长度的范围,其中N=10或更大的整数。所 述核酸可以包括与具有SEQIDNOS:1785-1923、2052、2058、2687-3000和3323-3330中之一 序列的核酸或其互补物进行杂交的序列。在一种实施方式中,杂交反应可以在中等严格度 条件下进行。在一种实施方式中,杂交反应可以在低严格度条件下进行。在一种实施方式 中,杂交反应可以在高严格度条件下进行。
所述表达构建体可以是任何能在适当宿主内对内含肽修饰蛋白或其片段进行表 达的合适的表达构建体。一种实施方式中的表达构建体为pAG2005(SEQIDNO:1),或者是 与SEQIDNO:1序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相似度 的任何表达构建体。在一种优选的实施方式中,在pAG2005中提供编码前述任意蛋白或其片 段的核酸。可以在水稻泛素启动子的控制下,将核酸克隆到pAG2005中的KpnI和EcoRI位点。
分离核酸、分离多核苷酸或分离寡核苷酸在表达构建体内可以是针对表达宿主而 进行密码子优化的。密码子优化可以是但不限于针对植物的密码子优化。密码子优化可以 是针对但不限于柳枝稷(switchgrass)、玉米、芒草(miscanthus)、高粱、甘蔗、小麦或水稻 的。
含有一个或多个核酸、多核苷酸或寡核苷酸的用于表达构建体的宿主可以是植 物。该植物可以是单子叶植物。所述单子叶植物可以是但不限于柳枝稷、玉米、芒草、高粱、 甘蔗、小麦或水稻。前述植物可以是双子叶植物。所述双子叶植物可以是但不限于大豆、油 菜、杨树、柳树或油菜籽。表达构建体可以是pAG2005(SEQIDNO:1),已示于图2A-2B中。表 达构建体中的核酸能够可操作地连接到启动子上。所述启动子可以控制内含肽修饰蛋白或 其片段的表达,启动子可以是但不限于植物泛素启动子系统、玉米泛素启动子、缺少一个或 多个热休克元件的改性玉米泛素启动子、水稻泛素启动子、水稻肌动蛋白1启动子、水稻肌 动蛋白2启动子、γ-玉米蛋白启动子、谷蛋白启动子、玉米PR-1启动子、玉米乙醇脱氢酶1启 动子、CaMV19S启动子、CaMV35S启动子、35S-增强mas(甘露碱合成酶基因)启动子、35S最 小化启动子、拟南芥PR-1启动子、烟草PR-la启动子、胭脂氨酸合成酶(opalinesynthase) 启动子、大豆热休克启动子、章鱼碱合成酶启动子、甘露碱合成酶启动子、合成启动子、乙醇 诱导启动子、四环素诱导启动子、类固醇诱导启动子、激素诱导启动子、基于蜕皮激素受体 的启动子、酵母铜反应(yeastcopperresponsive)启动子、金属硫蛋白启动子、热调解启 动子、冷诱导启动子、土豆α-淀粉酶启动子、光调解启动子、玉米叶绿素a/b启动子、暗激活 和光激活的Cab启动子、组织特异性的启动子、根启动子、种子特异性启动子或组成型启动 子。启动子可以是组成型启动子或诱导型启动子,也可以是水稻泛素启动子、玉米泛素启动 子、γ-玉米蛋白启动子、谷蛋白启动子或水稻肌动蛋白启动子。可以将核酸提供在与玉米 泛素启动子可操作地链接的pAG2005中,并可以将表达构建体提供在柳枝稷、玉米、芒草、高 粱、甘蔗、小麦或水稻内。可以在水稻泛素启动子的控制下,将核酸克隆到pAG2005中的KpnI 和EcoRI位点。在一种实施方式中,如果任意上述表达构建体中的核酸能对与SEQIDNOS: 1629-1784、2373-2686和3313-3322中任一具有低于100%同一性的氨基酸序列进行编码,它 所编码的是氨基酸序列的变体。
参见图2A-2B,pAG2005(SEQIDNO:1)包括具有第一内含子的水稻(Oryza sativa)泛素3基因启动子(OsUbi3启动子,12-2094核苷酸)、对用来选择转化体的磷酸甘露 糖异构酶进行编码的序列(PMI,2104-3279核苷酸)、左T-DNA边界(LB,3674-3698核苷酸)、 ColE1复制起点(Ori,6970核苷酸)、右T-DNA边界(RB,9717-9741核苷酸),具有第一内含子 的二号OsUbi3启动子(9948-12015核苷酸)以及Nos终止子(12035-12310核苷酸),其中的核 苷酸数字是从驱动PMI的OsUbi3启动子的5’端开始,相对于EcoRI序列内的1号核苷酸进行 的编号。
在一种实施方式中,向转基因植物中提供一种或更多种本发明的分离核酸、分离 多核苷酸、分离寡核苷酸和/或表达构建体。可以通过土壤杆菌(Agrobacterium)接到的转 化或本领域已知的其它合适的方法来将所述分离核酸、分离多核苷酸、分离寡核苷酸和/或 表达构建体引入植物中。土壤杆菌介导的向未成熟玉米胚芽中的转化过程可以按照 Negrotto等人,(2000)PlantCellReports19:798-803中描述的进行,通过引用该文献全 部记载而将其整体与本文结合。
本发明的实施方式还包括突变内含肽,其用途可以包括但不局限于对蛋白质进行 修饰。所述突变内含肽包括但不限于那些与含有SEQIDNOS:92-103和2373-2686中任一序 列的蛋白,或者与SEQIDNOS:1675、1678-1681、1689、1691、1700-1708、1710和3315-3322 中任一所含的任意内含肽相比,具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或100%的同一性的突变内含肽。实施方式还包括对突变内含肽进行编码 的核酸,所述突变内含肽包括但不限于那些与含有SEQIDNOS:92-103和2373-2686中任一 序列的蛋白,或者与SEQIDNOS:1675、1678-1681、1689、1691、1700-1708、1710和3315-3322 中任一所含的任意内含肽相比,具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或100%的同一性的突变内含肽。实施方式还包括对突变内含肽进行编码 的核酸,其中所述核酸与编码具有SEQIDNOS:92-103和2373-2686中任一序列的蛋白、或 编码SEQIDNOS:1675、1678-1681、1689、1691、1700-1708、1710和3315-3322中任一所含的 任意内含肽的核酸或其互补物发生杂交。实施方式还包括对突变内含肽进行编码的核酸, 其中,所述核酸与具有SEQIDNOS:3323-3330中任一所含的内含肽编码序列之一的序列的 核酸或其互补物发生杂交。在一种实施方式中,杂交反应可以在低严格度条件下进行。在一 种实施方式中,杂交反应可以在中等严格度条件下进行。在一种实施方式中,杂交反应可以 在高严格度条件下进行。可以诱导突变内含肽从其所插入的蛋白上发生切割和/或剪辑。诱 导条件可以包括将内含肽暴露在变化的物理条件或化学条件中,例如但不限于温度、pH、剪 接抑制剂的浓度、配体浓度、光、盐条件和压力方面的改变。所述诱导条件可以是提高温度, 但不仅限于此。提高的温度可以是但不限于50-70℃的范围,包括50℃和70℃的温度。所提 高的温度可以大于或等于在25-70℃内以整数递增的温度(包括端点)。所提高的温度可以 大于或等于50℃、55℃、59.9℃、60℃、65℃或70℃。可以使用这样的内含肽对蛋白、酶、纤维 素酶或木聚糖酶进行修饰:该内含肽与含有SEQIDNOS:2、3、4-103、113-392中序列的蛋 白,或与SEQIDNOS:1675、1678-1681、1689、1691、1700-1708和1710中任一所含有的任意 一种内含肽相比,具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或100%的同一性。可以使用这样的核酸从核酸水平上来对蛋白、酶、纤维素酶或木聚糖 酶进行修饰:该核酸与编码SEQIDNOS:92-103,或SEQIDNOS:1675、1678-1681、1689、 1691、1700-1708和1710中任一所含的内含肽的任意一种的核酸或其互补物发生杂交。可以 通过将SEQIDNOS:1675、1678-1681、1689、1691、1700-1708和1710中各个序列与SEQIDNO: 91的Tth内含肽序列比较后得到上述序列中的内含肽序列。
按照上文的描述,实施方式包括这样的氨基酸序列,其中,与具有SEQIDNOS: 1629-1784、2373-2686和3313-3322中任意序列的蛋白中的6个、10-50个、10-100个、10-150 个、10-300个、10-400个、10-500个、10-600个、10-700个、10-800个、10-900个或10至全部氨 基酸相比,一个所述序列与具有SEQIDNOS:1629-1784、2373-2686和3313-3322中任意序 列的蛋白具有至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同 一性。实施方式包括编码所述氨基酸序列的核酸,以及识别位于所述氨基酸序列上的抗原 决定部位的抗体。短于完整长度的氨基酸序列可以从对应于所截取长度的氨基酸的SEQID NOS:1629-1784、2373-2686和3313-3322序列之一上的任意位置进行选择。可以从具有上游 内含肽-外显肽接头的SEQIDNOS:1629-1784、2373-2686和3313-3322任一序列中的一部 分上择短于完整长度的氨基酸序列,在其中任意两个连续位置处,所述上游内含肽-外显肽 接头的N-外显肽上具有C-末端残基,且内含肽上具有N-末端残基。举例来说,SEQIDNOS: 3313-3322序列中的134和135位置分别是各个序列的N-外显肽的C-末端残基和内含肽的N- 末端残基,因此选自SEQIDNOS:3313-3322中任一序列中的短于完整长度的氨基酸序列可 以使134和135残基在所截取长度范围内的任意两个独立而又连续的位置上。可以从具有下 游内含肽-外显肽接头的SEQIDNOS:1629-1784、2373-2686和3313-3322任一序列中的一 部分上选择短于完整长度的氨基酸序列,在其中任意两个连续位置处,所述下游内含肽-外 显肽接头的内含肽上具有C-末端残基,且C-外显肽上具有N-末端残基。举例来说,SEQID NO:3313-3322序列中的616和617位置分别是各个序列的内含肽的C-末端残基和C-外显肽 的N-末端残基,因此选自SEQIDNO:3313-3322中任一序列中的短于完整长度的氨基酸序 列可以使616和617残基包含在所截取长度范围内的任意两个独立而又连续的位置上。可以 从SEQIDNO:1629-1784、2373-2686和3313-3322任一序列中的一部分上择短于完整长度 的氨基酸序列,在被选择的部分内的位置上,含有至少一种不同于天然内含肽或天然蛋白 序列的氨基酸。距离来说,下面的序列含有相对于碱基序列(SEQIDNO:2518)的突变(以序 列ID后加“/AAi#AAj”表示):SEQIDNO:3315/R322H;SEQIDNO:3315/R398W;SEQIDNO: 3315/I412V;SEQIDNO:3315/T415M;SEQIDNO:3316/D188E;SEQIDNO:3316/K245N;SEQ IDNO:3316/T402A;SEQIDNO:3316/R504G;SEQIDNO:3316/K566N;SEQIDNO:3317/ K245M;SEQIDNO:3317/D418V;SEQIDNO:3317/S585I;SEQIDNO:3318/V231L;SEQIDNO: 3318/P282S;SEQIDNO:3318/K402M;SEQIDNO:3318/E545D;SEQIDNO:3318/I618N;SEQ IDNO:3319/P134S;SEQIDNO:3319/E405K;SEQIDNO:3319/N747Y;SEQIDNO:3320/ P134S;SEQIDNO:3320/R345M;SEQIDNO:3320/V589D;SEQIDNO:3321/T30I;SEQIDNO: 3321/E331G;SEQIDNO:3321/G366E;SEQIDNO:3321/L578M;SEQIDNO:3322/P189L;SEQ IDNO:3322/G242A和SEQIDNO:3322/N730D。短于完整长度的选自SEQIDNO:3313-3322 任一序列中的氨基酸序列中可以含有一种或更多种有关上述SEQIDNO:2518氨基酸的改 变。短于完整长度的选自SEQIDNO:3313-3322任一序列中的氨基酸序列中可以含有一种 或更多种有关上述SEQIDNO:2518氨基酸的改变。类似地,可以选择短于完整长度的选自 本发明中含有一种或更多种有关天然内含肽或天然酶的氨基酸改变的其它序列中任一的 氨基酸序列。如果所选择的短于完整长度的氨基酸序列含有不止一个氨基酸改变的时候, 多个氨基酸改变彼此之间的相对位置可以保持不变。然而,上述一种或更多种氨基酸改变 也可以存在于短于完整长度氨基酸序列被截取的长度内的任何位置。本文提供的核酸能编 码任一短于完整长度的含计算序列。本文提供的核酸可以为上文描述的任何长度,包括编 码一部分内含肽修饰蛋白的短于完整长度的氨基酸序列,所述内含肽修饰蛋白具有上游内 含肽-外显肽接头、下游内含肽-外显肽接头或在内含肽修饰蛋白序列相对于天然内含肽或 天然蛋白序列发生的改变中的至少一种。在核酸截取长度内,编码接头或改变位点的核苷 酸可以位于长度上的任意独立位置。本文提供的抗体能对任一短于完整长度氨基酸序列上 抗原决定部位进行识别。所述抗原决定部位可以包括上游内含肽-外显肽接头、下游内含 肽-外显肽结构、在短于完整长度氨基酸序列中的有关天然内含肽或天然蛋白序列的一种 或多种改变,或在短于完整长度氨基酸序列中的任意其它序列。
本发明中任一实施方式都可以用一种或更多种其它本发明实施方式中的一个或 更多个元件进行补充。
实施例——下文提供了非限制性的实施例来对具体的实施方式进行阐述。可以通 过一个或更多个来自下面一个或更多个实施例的细节来对全部的实施方式进行补充。
实施例1——对内含肽插入位点的预测。使用A)通过SVM预测的局部序列、B)插入 位点到活性位点残基的距离,或C)插入位点与局部二级结构(例如,α-螺旋结构或β-片状结 构)的邻近程度能够对下列木聚糖酶和纤维素酶中的插入位点进行预测:芽孢杆菌NG-27木 聚糖酶(登录号为O30700(SEQIDNO:106));粪堆梭菌xynB木聚糖酶(登录号为P40942 (SEQIDNO:108));疏棉状嗜热丝孢菌xynA木聚糖酶(登录号为O43097(SEQIDNO:107));嗜 热网球菌xynB木聚糖酶(登录号为P77853(SEQIDNO:104));热纤梭菌celK纤维素酶(登录 号为O68438(SEQIDNO:109));褐色热单胞菌celB纤维素酶(登录号为P26222(SEQIDNO: 110));解纤维热酸菌纤维素酶(登录号为P54583(SEQIDNO:111));以及高山象白蚁纤维 素酶(登录号为O77044(SEQIDNO:112))。对这些木聚糖酶和纤维素酶中的每一个来说,基 于C/T/S残基中的全部原子与活性位点任意残基中的全部原子之间的最短距离计算酶中各 个C/T/S与活性位点之间的距离。接着,得到每个NNNXNN局部序列盒(其中X为C/T/S)的SVM 评分。按照上文的描述,用SEQIDNOS:1233-1512的内含肽插入物盒序列对SVM进行训练和 使用。通过以下对SVM的正确性进行测试:1)随机选择m组具有单一序列的真阳性训练组插 入位点,所述单一序列选自SEQIDNOS:1233-1512中含内含肽蛋白的文库;2)含有3个来自 外显肽序列(真阳性插入盒从此中选出(SEQIDNOS:673-1232))的其它随机盒的真阴性; 3)将SEQIDNOS:1233-1512的内含肽插入位点盒中余下的其它序列作为真阳性测试组,其 中,对已知的内含肽插入位点进行过滤以除去训练组中的序列;和4)测试组中的真阴性选 自外显肽序列(SEQIDNOS:673-1232)中的其它C/S/T位点。训练组中的每一个真阴性含有 与对应真阳性相同的中心氨基酸X,但在该真阴性氨基酸位置处不含有内含肽插入物。
收集在10埃或更近距离内且/或SVM评分大于0的位点进行进一步的分析。将那些 在SVM评分方面具有较高得分但距离超过20埃的位点进行排除。接着,对全部候选位点的二 级结构进行测定,并且优先选择位于环-(α-螺旋结构或β-片状结构)接头处的位点。位于长 表面环上未直接与活性位点相邻的位点,或者在蛋白中心的位点也被排除。据此预测的插 入位点列于下表2中。
表2
实施例2——对木聚糖酶进行克隆、表达和活性分析。将野生型木聚糖酶进行克隆,从而在λ噬菌体和大肠杆菌(E.coli)筛选系统中进行表达。在具有或不具有一个连接到编码序列羧基端(下文称为“C-末端”)的6His-标签的情况下,对编码9个木聚糖酶的核酸进行PCR扩增。这些木聚糖酶是未培养细菌GH11木聚糖酶(登录号为EU591743(SEQIDNO:1924))、芽孢杆菌NG-27木聚糖酶(登录号为O30700(SEQIDNO:106))、疏棉状嗜热丝孢菌xynA木聚糖酶(登录号为O43097(SEQIDNO:107))、粪堆梭菌xynA木聚糖酶(登录号为P33558(SEQIDNO:1925))、热纤梭菌xynY木聚糖酶(登录号为P51584(SEQIDNO:105))、嗜热网球菌xynB木聚糖酶(登录号为P77853(SEQIDNO:104))、粪堆梭菌xynB木聚糖酶(登录号为P40942(SEQIDNO:108))、菊欧文氏菌(Erwiniachrysanthemi)木聚糖酶(登录号为Q46961(SEQIDNO:1926))和热袍菌(Thermotogasp.xynA)xynA木聚糖酶(登录号为Q60044(SEQIDNO:1927))。使PCR产物经过EcoRI/XhoI酶切(37℃,1小时)、柱纯化(MinElutePCR提纯试剂盒,Qiagen),并连接(在4℃下进行至少40小时,或者在12℃下进行至少12小时)到预先进行酶切的λII载体(Stratagene)中。II载体中的表达盒在图35中示出,其目标基因以灰色方框表示。将酶基因连接到预先酶切的载体上后,用噬菌体包装提取物(phagepackagingextract,Stratagene)将含有酶基因的载体包装到λ噬菌体中(室温下进行2小时)。用重组噬菌体感染XL1-BlueMRF’大肠杆菌细胞(Stratagene),然后将其析出在含有0.2%的AZCL-木聚糖底物(Megazyme)的NZY琼脂平板上(在GigapackIIIGoldCloning试剂盒中进行了描述,Stratagene)。每升NZY琼脂平板含有10g的NZ胺(酪蛋白水解物)、5g的NaCl、2g的MgSO4*7H2O、5g的酵母提取物和15g的琼脂,用NaOH将pH调至7.5,按照商家(Stratagene)的说明在高压釜中进行灭菌。AZCL-木聚糖底物(Megazyme)含有天青精交联的木聚糖,它在水解后能释放染料呈现出蓝色。在37℃下进行整夜培养后,目测平板上的噬菌斑内部和周围产生的蓝色。基于水解AZCL-木聚糖底物进而在噬菌斑内部和周围产生蓝色的能力,将木聚糖酶活性评分为有活性或无活性。通过PCR证实选出的菌斑中含有目标木聚糖酶基因,并重新析出在含有0.2%的AZCL-木聚糖的NZY琼脂平板上,以证实噬菌斑中的木聚糖酶的酶活性。
将每个表达木聚糖酶的噬菌体分离物在XL1-BlueMRF’大肠杆菌细胞中进行扩增,从而得到高效价的噬菌体裂解液,在存在异丙基β-D-1-硫代半乳糖苷(IPTG,不含二噁烷,99%纯度;购自ResearchProductsInternational公司)的情况下用XL1-BlueMRF’大肠杆菌细胞(Stratagene)进行二次感染的过程中使用上述噬菌体裂解液,以诱发木聚糖酶的表达。将等份的裂解液至于从4-70℃的不同温度下进行最多4小时的培养,然后在4℃下冷却至少2个小时。用试剂盒(InvitrogenTM)或通过将AZCL-木聚糖底物加至0.2%并在37℃或70℃下进行4小时培养的方法来测量各个裂解液中的木聚糖酶活性。
在含AZCL-木聚糖的NZY琼脂平板上和通过液相分析来对木聚糖酶活性进行比较。 是在添加了AZCL-木聚糖底物的NZY琼脂平板上,具有或不具有C-末端His-标签的P77853显 示出具有最强活性,接下来是P51584、O43097和O30700。在全部的实例中,6His-标签至少对 木聚糖酶活性产生了一定的抑制作用。
实施例3——将内含肽插入木聚糖酶内。通过PCR途径将多个内含肽插入表2中列 出的预测位点的子集中。首先,通过PCR(PhusionTMTaq聚合酶(NewEnglandBiolabs),遵 照操作手册进行)分别产生32段DNA:来自木聚糖酶的“N”(代表氨基末端或N-外显肽片段) 和“C”(代表羧基末端或C-外显肽片段),以及来自内含肽的“I”(代表内含肽)。对内含肽片 段I进行扩增,这样I与N木聚糖酶PCR片段的C-末端具有20个核苷酸的重叠部分,并与C木聚 糖酶PCR片段的N-末端有20个核苷酸的重叠区域。随后通过两步PCR(AccumprimeTMTaq聚合 酶Pfx(Invitrogen))将N、I和C片段组装为编码内含肽修饰酶的相邻基因。本文中使用的 “NIC”指的是木聚糖酶DNA片段的N-末端与期望的内含肽发生了融合,该期望的是与木聚糖 酶DNA片段的C-末端发生融合。虽然“NIC”在本实施例上下文中表示内含肽修饰的木聚糖 酶,“NIC”也可以表示任意内含肽修饰蛋白中的M-外显肽、内含肽和C-外显肽相邻序列。针 对不同构造采用了遵照以下格式的命名习惯:(靶酶)-(内含肽)-(插入位点)-(突变体数); 例如,可以将在S158处插入P77853中的Tth内含肽命名为P77853-Tth-S158。类似地,将在 T134处插入P77853中的Tth内含肽命名为P77853-Tth-T134。然后在连接号后加入每个内含 肽修饰酶中的突变体;例如P77853-Tth-S158-1、P77853-Tth-S158-2、P77853-Tth-S158- 3、P77853-Tth-S158-4等。
通常来说,进行NIC组装的第一步中,在主混合(mastermix)中使用N、I和C编码核 酸各100ng,主混合中含有1×缓冲PCR反应缓冲液、200μΜ的各个dNTP、和1单位的PfxTaq聚 合酶/12.5μL,在95℃下进行一次2分钟的循环,然后进行5次3步热循环:95℃下进行2分钟, 45℃下进行1分钟和68℃下进行2分钟(较长基因的时候改为3分钟),接着在68℃下进行15 分钟的最终PCR延伸。第二步是对NIC进行扩增,其中,用0.15μΜ的引物对含有组装NIC的主 混合进行PCR扩增,所述引物与组装NIC的DNA的5’端和3’端发生杂交。第二步中的加热周期 在95℃下进行1个2分钟的周期,接着进行27个3步加热周期:95℃下进行20秒,58℃下进行 30秒和68℃下进行3分钟,然后在68℃下进行15分钟的最终的PCR延伸。
用QIAquick凝胶回收试剂盒(QIAquickGelExtractionKit,Qiagen)对按照上述方法制得的组装NIC基因进行凝胶提纯(gelpurified),并用EcoRI和XhoI(NewEnglandBiolab)进行酶切,进行上面实施例2中描述的步骤后,再通过QIAquick凝胶回收试剂盒(Qiagen)进行凝胶纯化,和用预先进行了切割的λII载体(Stratagene)进行连接。
将产物放在含0.2%的AZCL-木聚糖底物的NZY琼脂平板上,在37℃下进行整夜培养 后对菌斑的木聚糖酶活性进行评分。将上述平板在37-70℃的温度下进行最多4小时的培养 后,再次对各个菌斑色木聚糖酶活性进行评分。以整夜培养和二次培养之后进行的活性评 分为基础,将各个菌斑归入不同的表型。在37℃下进行整夜培养后即出现蓝色的菌斑,在升 高温度环境下进行二次培养后仍然具有蓝色,将这种菌斑评定为许可型。在37℃下进行整 夜培养后没有出现蓝色的不活泼的菌斑,在升高温度环境下进行第二次培养后确实出现了 蓝色,将这种菌斑评定为转化型。将在37℃下进行整夜培养和在提高温度的环境下进行二 次培养依然没有活性的菌斑评定为非许可型。以内含肽修饰的木聚糖酶(在特定位点上含 有内含肽)在琼脂平板上的表型为基础,将各个内含肽插入物划分为许可型(内含肽插入物 不会对蛋白功能产生干扰,或者内含肽在37℃下进行整夜培养的过程中发生了剪接)、非许 可型(内含肽插入物在全部测试条件下都对蛋白功能造成了干扰)或转化型(在高温下进行 4小时培养后才能观察到木聚糖活性,而在在37℃下进行整夜培养之后却没有观察到活 性)。
对应于各个插入位点从平板上挑选出菌斑,遵照操作手册说明(Stratagene)将其切成噬菌粒。简而言之,将λII载体设计成能进行简单有效的或体内切除,然后对λ载体内全部的克隆插入物进行重新环化(recirculization),形成含有克隆插入物的噬菌粒。为了将克隆插入物切成噬菌粒,将分离出来的菌斑转移到无菌微型离心管内,该微型离心管内含有500μL的SM缓冲液(Stratagene)和20μL的氯仿。摇晃离心管以使噬菌体颗粒释放到SM缓冲液中。将离心管在室温下培养至少1个小时,或者在4℃下培养整夜。进行培养之后,将预先制好的XL1-BlueMRF’(Stratagene)和SOLRTM(Stratagene)细胞在1000×g下进行数分钟的离心作用。将得到的团块状细胞用25ml的进行再悬浮直到得到OD600等于1.0(8×108个细胞/ml)的10mMMgSO4。将细胞进行再悬浮后,将OD600为1.0的200μL的XL1-BlueMRF’细胞,250μL所期望的分离噬菌体液(phagestock)(含有>1×105个噬菌体颗粒)和1μL的(Stratagene)辅助噬菌体(>1×106pfu/μL)加入15mL的聚丙烯管中。将该聚丙烯管在37℃下培养15分钟以允许噬菌体附着到细胞上。培养后,加入3mL的含有添加物的LB肉汤,一边摇晃一边将混合物在37℃下培养2.5-3小时。然后将混合物在65-70℃下加热20分中以使λ噬菌体颗粒和细胞发生裂解。在溶解之后,将离心管放在1000×g下进行10分钟的离心,使细胞碎片形成团块。将上清液倾析到另一个无菌管内。该上清液中含有的离体噬菌粒为丝状噬菌体颗粒。为了将离体噬菌粒制成板,将200μL新生长的SOLRTM细胞(OD600=1.0)与100μL噬菌体的上清液在1.5ml的微型离心管中进行混合。将混合物在37℃下培养15分钟,然后将200μL-的细胞混合物倒在LB-氨苄西林琼脂平板(100μg/mL)上,并在37℃下培养整夜。得到的菌落中含有离体噬菌粒。各个噬菌粒含有对氨苄西林具有耐药性的标记物,以支持其在含氨苄西林的培养基中的生长。通过PCR和DNA测序进行证实后,可以将噬菌粒克隆体在自诱导培养基中(本文中称为AIM,可商购自Novagen,商品名为OvernightExpressTMInstantTBMedium)培养整夜。用FastBreakTM裂解缓冲液(Promega)使细胞发生裂解,并通过蛋白质印迹对其剪接作用进行测定。
NZY琼脂平板上的内含肽修饰的木聚糖酶的菌斑表型进行测定,并通过改良的蛋 白质印迹操作(在下面实施例5中进行描述)对前体积累和成熟木聚糖酶积累进行分析。 Psp-pol内含肽(SEQIDNO:3)从S112处(SEQIDNO:1696)和S124处(SEQIDNO:1697)插 入P77853内,这是实施例1(上文)预测的插入位点的位置。对这些位置的菌斑表型进行评 分:S112为许可型而S124为非许可型。在蛋白质印迹中,S112处积累了一定量的内含肽修 饰的木聚糖酶前体和一定量的成熟木聚糖酶。S124积累的主要是内含肽修饰的木聚糖酶前 体。除了这些预测位点之外,Psp-pol内含肽还可以插入多个其它位点。在所测试的其它位 点之中,在S63(SEQIDNO:1692)、S86(SEQIDNO:1694)、S95(SEQIDNO:1695)和S178 (SEQIDNO:1698)处插入Psp-pol内含肽后产生的菌斑被评定为转化表型。进行蛋白质印 迹时,没有加热的时候,这些位点处积累了内含肽修饰的木聚糖酶前体,将噬菌体裂解液在 70℃下进行热处理后,该位点处积累了内含肽修饰的木聚糖酶前体和成熟的木聚糖酶。
Tag内含肽(SEQIDNO:90)从S112处、T113处、S124处、T134处、T145处、S158处和 T199插入P77853内,这是实施例1(上文)预测的插入位点的位置。对含有Tag内含肽的 P77853内含肽修饰的木聚糖酶的菌斑,根据其表型评分如下:S112(非许可型)、T113(非许 可型)、S124(非许可型)、T134(许可型)、T145(转化型)、S158(非许可型)和T199(非许可 型)。Tag内含肽修饰的木聚糖酶前体在S112、T113、S124、T134、T145、S158和T199插入处发 生积累;但是仅T145和T199处积累了成熟的木聚糖酶。通过其它插入位点上的蛋白质印迹 可以观察到其它的切割产物。
Tth内含肽(SEQIDNO:91)从S112处、T113处、S124处、T134处、T145处、S158处 和T199处插入P77853木聚糖酶中,这是实施例1(上文)预测的插入位点的位置。将这些位置 的菌斑表型评定为下:S112(许可型)、S124(转化型)、T113(非许可型)、T134(转化型)、S 158(转化型)、T145(非许可型)和T199(非许可型)。在蛋白质印迹中,在S112处、S124处、 T113处、T134处、S158处、T145处和T199处检测到积累了一定量的内含肽修饰的木聚糖酶前 体。在S112处、S124处、T113处、S158处和T145处的蛋白质印迹中检测到了成熟的木聚糖酶。
微小Psp-Pol内含肽mPspM1L4(SEQIDNO:7)和mPspM5L5(SEQIDNO:36)从S112插 入位点处插入P77853木聚糖酶中,这是实施例1(上文)预测的插入位点的位置。当从S112 处插入时,将表达含有mPspM1L4或mPspM5L5的内含肽修饰的木聚糖酶P77853的菌斑评定为 非许可表型,且没有对它们进行蛋白质印迹分析。类似地,微小Psp-Pol内含肽中的 mPspM1L4(SEQIDNO:7)、mPspM1L7(SEQIDNO:10)、mPspM2L5(SEQIDNO:15)、mPspM4L3 (SEQIDNO:27)、mPspM5L2(SEQIDNO:33)、mPspM5L5(SEQIDNO:36)和mPspM7L3(SEQID NO:48)从S67处插入P77853木聚糖酶时,产生的是非许可型菌斑表型。与此相对的是,这些 内含肽(mPspM1L4(SEQIDNO:7)、mPspM1L7(SEQIDNO:10)、mPspM2L5(SEQIDNO:15)、 mPspM4L3(SEQIDNO:27)、mPspM5L2(SEQIDNO:33)、mPspM5L5(SEQIDNO:36)和mPspM7L3 (SEQIDNO:48))从S95和S178处插入P77853木聚糖酶时,产生的是许可型菌斑。
Psp-Pol内含肽(SEQIDNO:3)从S215处、T314处和S357处插入O30700木聚糖酶 中,这是实施例1(上文)预测的插入位点的位置。从这些位置处插入的Psp-Pol内含肽的菌 斑表型在S215和S314处被评定为非许可型,在S357处被评定为许可型。相反地,将微小Psp- Pol内含肽mPspM1L4(SEQIDNO:7)和mPspM3L5(SEQIDNO:22)从同样的位点插入,但S314 被评定为许可型,而S215和S357被评定为非许可型。
Tth内含肽(SEQIDNO:91)从S95处、T137处、S215处、T250处、S358处、S314处和 S357处插入O30700木聚糖酶中,这是实施例1(上文)预测的插入位点的位置。对插入了Tth 内含肽的O30700木聚糖酶进行表达的噬菌体的菌表表型评定如下:S95许可型)、T137(非许 可型)、S215(非许可型)、T250(非许可型)、S314(许可型)、S357(非许可型)和S358(许可 型)。
将Mth内含肽(SEQIDNO:2)和Tag内含肽(SEQIDNO:90)分别通过独立的实验融 合到O30700木聚糖酶的C-末端上,从而使生成的内含肽修饰蛋白在经过37℃的整夜培养后 被激活,这表示将C-末端与Mth内含肽和Tag内含肽进行融合得到O30700的许可型。
Tth内含肽(SEQIDNO:91)从S47处、S50处、S103处、T111处、T126处、S130处、T134 处、T151处、T152处、S158处、T164处、S170处、T208处、S213处和S214插入O43097木聚糖酶 中,这是实施例1(上文)预测的插入位点的位置。对表达Tth内含肽修饰的O43097木聚糖酶 的噬菌斑的表型评定如下:S47(许可型)、T134(非许可型)、T151(非许可型)、T152(非许可 型)、S158(非许可型)、T164(非许可型)、S170(非许可型)、T208(非许可型)、S213(许可型)、 S214(许可型)。在蛋白质印迹分析中,在S47、S50、S103、T111、S130、T164、S213和S214的插 入位点处观察到Tth内含肽修饰的O43097木聚糖酶前体,在S47、S50、S103、S213和S214的插 入位点处观察到成熟的O43097木聚糖酶。不对这样的噬菌体裂解液进行蛋白质印迹分析: 该噬菌体裂解液来自在T126、T134、T152、S158处对Tth内含肽修饰的O43097木聚糖酶进行 表达的噬菌体。
通过上文可以发现,在根据本文的方法基础上预测的插入位点处插入内含肽可以 得到具有转化表型的内含肽修饰蛋白。但该方法发同时还产生了可能发生或没有发生切割 或剪接的许可型候选者或非许可型候选者。在通过本发明找到的位点之外处插入的内含肽 可以获得转化表型。但是本发明的方法使具有较大可能产生转化表型的候选池得到了丰 富。
实施例4——对内含肽修饰酶进行诱变。本领域中存在多种不同的蛋白诱变方法, 作为一种非限制性的实例,如下文所描述地,可以采用不同的特定策略来产生内含肽修饰 蛋白的变体。
使用(Stratagene)突变试剂盒在木聚糖酶、内含肽修饰的木聚糖酶或上述实施例中的内含肽中产生随机突变。每次使用对模板DNA进行扩增时,在新合成的DNA中发生突变是存在一定可能性的。实践中,可以通过改变模板DNA的量以及PCR循环的次数获得突变率。本文中的诱变PCR操作最优选为:对整个盒或内含肽编码部分进行修饰时,在每个内含肽中产生1-2个氨基酸突变。
为使全部盒发生诱变,遵照操作手册,用II随机突变试剂盒(Stratagene)和M13正向引物和反相引物将5μg的噬菌粒NICDNA进行10个循环的PCR扩增。简单来说,将5μg的待诱变处理的噬菌粒NICDNA与1×缓冲PCR反应缓冲液、200μΜ的各个dNTP、0.15μΜ的引物(与NICDNA的端部互补)以及2.5单位的IIDNA聚合酶进行混合,最终体积为50μL,然后在95℃下进行一次2分钟的循环,接着进行10次3步热循环:95℃下进行20秒,58℃下进行30秒和68℃下进行3分钟(1分钟/千个模板碱基),接着在68℃下进行15分钟的最终PCR延伸。在扩增步骤后进行10个PCR循环,使用常规的Taq聚合酶对用于每个诱变的NICDNA引物进行克隆。由此产生的诱变NICDNA文库后,用QIAquick凝胶回收试剂盒进行凝胶提纯、用EcoRI和XhoI(NewEnglandBiolab)进行酶切、用MinElutePCR提纯试剂盒(Qiagen)进行柱纯化、连接到II载体(Stratagene)、按前文的描述包装到λ噬菌体内,然后根据前文的描述将其析出在NZY琼脂平板上。
为使内含肽发生诱变,遵照操作手册通过II突变试剂盒(Stratagene)和内含肽端部特异性引物将5μg的编码内含肽的质粒DNA进行10个循环的PCR扩增。简单来说,将5μg的待诱变处理的内含肽DNA与1×缓冲PCR反应缓冲液、200μΜ的各个dNTP、0.15μΜ的内含肽端部特异性引物和2.5单位的IIDNA聚合酶进行混合,最终体积为50μL,然后在95℃下进行一次2分钟的循环,接着进行10次3步热循环:95℃下进行20秒,58℃下进行30秒和68℃下进行3分钟,接着在68℃下进行15分钟的最终PCR延伸。由此产生的诱变内含肽文库后,用QIAquick凝胶回收试剂盒进行凝胶提纯。使用常规的Taq聚合酶通过PCR产生木聚糖酶的N-末端片段和C-末端片段(N和C)。使用上文提到的PCR操作将具有野生型N和C的NICDNA和经诱变处理的内含肽文库I组装起来,并将其克隆到II载体上,从而能够按照前文描述地在NZY琼脂平板上对文库进行筛选。
为使内含肽发生诱变,还生成了合成的Tth内含肽((SEQIDNO:91)诱变文库。将 该文库设计成在Tth内含肽的每个位置上至少发生一次独立的氨基酸取代反应。设计完成 后,通过Genscript来合成文库。使用常规的Taq聚合酶通过PCR产生木聚糖酶的N-末端片段 和C-末端片段(N和C)。使用上文提到的PCR操作将具有野生型N和C的NICDNA和合成的诱变 Tth内含肽文库I组装起来,并克隆以进行文库筛选。
通过下面的操作产生以下诱变文库:
1、整个盒的诱变文库,其中,含有从S67位点处插入P77853的微小PspPol内含肽 mPspM1L4的盒发生了诱变;
2、内含肽诱变文库,其中,诱变的微小PspPol内含肽mPspM1L4从S67位点处插入 P77853中;
3、内含肽诱变文库,其中,诱变的微小PspPol内含肽mPspM1L4、mPspM2L5、 mPspM3L5、mPspM4L3、mPspM5L5、mPspM5L2和mPspM7L3从S67位点处插入P77853中;
4、内含肽诱变文库,其中,诱变的微小PspPol内含肽mPspM5L5从S112位点处插 入P77853中;
5、整个盒的诱变文库,其中,含有从T134位点处插入P77853的Tth内含肽的盒发生 了诱变;
6、内含肽诱变文库,其中,诱变的Tth从T134位点处插入P77853中;
7、内含肽诱变文库,其中,诱变的Tth从S158位点处插入P77853中;和
8、内含肽诱变文库,其中,诱变的微小PspPol内含肽mPspM3L5从S106、S215、 S295、S314、S357或S358位点处插入O30700中。
实施例5——对内含肽修饰酶文库的筛选。对处理的文库进行筛选,对候选者进行 分离、纯化和证实。用一系列稀释度的SM缓冲液(通过将5.8g的NaCl、2.0g的MgSO4*7H2O、 50.0mL的1MTris-HCl(pH7.5)、5.0mL的2%(重量/体积(w/v)的明胶定容至1升,然后在高 压釜中进行灭菌,进而制备SM缓冲液)对单个文库进行滴定以测量效价(菌斑形成单位或 pfu/μL),并将其析出在NZY平板上。对于被评定为非许可表型的插入位点,例如在P77853的 S67处和S112处,或者在O30700中多个位点处插入的微小PspPol内含肽mPspM1L4,用高密 度噬菌体效价进行筛选。用500μL的XL1-BlueMRF’细胞(OD600=0.5)使高达10000pfu析出在 15cm的平板上。对源于具有转化表型的内含肽修饰酶文库(例如,通过在P77853的T134和 S158位点插入Tth内含肽得到的文库)来说,对2000pfu/平板进行筛选以获得该文库。
使每个文库析出在琼脂平板上,并在37℃下培养整夜。将具有蓝晕的菌斑标记为 许可表型突变。然后使平板经历热处理系列(50℃下处理,然后在70℃处理2小时)来诱导对 候选噬菌斑进行表达的表型。挑选出独立菌斑,并将其分散到500μL的SM缓冲液中。制备一 系列稀释度的SM缓冲液,并将其用来感染XLl-BlueMRF’细胞,随后使该细胞在NZY平板上 析出。随后将平板在37℃下培养整夜,接着在70℃下培养2个小时。在上述两个温度下进行 培养后,对菌斑表型进行确认。
将超过500个内含肽修饰的P77853木聚糖酶候选者进行分离、提纯和并证实其表 示。在它们之中,约100个候选者含有位于S67位点的微小PspPol内含肽插入物、70个含有 位于S112位点的M5L5内含肽插入物,250个含有位于T134位点的Tth内含肽插入物,并有75 个含有位于位点S158的Tth内含肽插入物。对于O30700木聚糖酶来说,使约50个选择对象经 历菌斑提纯、表型确认并通过PCR进行证实。
根据上文描述的操作,将经证实表型的候选者分别切成噬菌粒。通过酶法对绝大 多数的候选者进行分析。通过蛋白质印迹分析(剪接)和DNA序列分析对表现出热敏转化活 性的候选者进行分析。
按下面步骤进行针对木聚糖酶活性的酶法:1)将含有离体噬菌粒的单菌落接种到 培养物上,使该培养物在添加了100mg/L的氨苄西林(AMP,购自Sigma)的1mL的路尼亚肉汤 (LuriaBroth,LB,通过以下方法制得:将10g的NaCl、10g的细菌用胰蛋白胨和5g的细菌-酵 母提取物混合定容至1升,然后用5N的NaOH将pH调解为7.0,随后在高压釜中进行杀菌)中, 在37℃和300RPM的条件下生长一整夜。2)将50μ1的细胞转移到5mL的OvernightExpressTMInstantTB培养基(在本文中也被称为自诱导培养基或AIM,可商购自Novagen)上,并在37 ℃和250RPM的条件下生长一整夜。3)将培养物在3000RPM下离心15分钟。4)除去上清液,并 使细胞颗粒再悬浮在裂解缓冲液中(该裂解缓冲液中含有1×FastBreakLysisBufferTM(Promega)、200mM的磷酸钠(pH6.5),和0.2μ1/mL的DNA酶)。5)将裂解液混合充分后,用 200mM的磷酸钠(pH6.5)制备1:10稀释度的裂解液。和6)用100μ1的各个稀释度对样品进行 活性分析,叔叔样品或者暴露在剪接诱导条件(例如加热预处理)中,或者未暴露在诱导条 件中。
在进行预处理(PT)的分析中,将裂解液样品分成具有相同体积的等份,将这些等 份在37℃或55℃下处理4小时后在冰上进行冷却。然后,加入20μl0.2%的细磨AZCL底物后将 样品进行充分混合。允许在37℃下进行至少1个小时的反应,但有时会延长至进行整晚的反 应。根据内含肽修饰酶及其各自的成熟酶不同,反应时间、反应温度、反应条件及反应底物 都可能不同。
在不进行预处理(NPT)的分析中,将样品分成具有相同体积的等份,然后与20μl 0.2%的细磨AZCL底物进行混合。许在37℃和70℃下进行最多6个小时的反应。根据内含肽修 饰酶及其各自的成熟酶不同,反应时间、反应温度、反应条件及反应底物都可能不同。
在进行预处理(PT)或不进行预处理(NPT)的分析中,反应时间完成之后,对样品进 行搅拌然后在4000RPM下进行7分钟离心作用。向每个样品中加入50μl的添加物,从而能对 590nm下的吸光度进行测量,该指标表示样品中的酶或内含肽修饰酶具有多高的活性。可以 在ThermoScientific分光光度计上,或在BioTekSynergyTM多模型酶标仪上用96孔或384 孔圆底分析板对吸光度进行测量。如有必要,将样品再次进行离心以确保未将细胞碎片选 入在内,并在需要时用200mM的磷酸钠(pH6.5)制备5×或10××稀释液。
按下面内容进行针对候选的内含肽修饰酶突变体的蛋白质印迹分析:1)使5ml的AIM培养物在30℃和250RPM的条件下生长整夜,然后在3000RPM下对其离心15分钟。2)除去上清液和并将团块状的细胞再悬浮于200μl的裂解缓冲液中(参见上文)。3)将裂解液混合充分后,用1×磷酸缓冲溶液(按照以下制备PBS:将137mmol的NaCl、2.7mmol的KCl、4.3mmol的Na2HPO4和1.47mmol的KH2PO4混合并定容至1升,用2N的NaOH调节pH至7.4,用0.22微米的滤膜对溶液进行无菌过滤)制备1:10稀释度的裂解液,而余下没有使用的样品存储在-20℃下(根据表达水平和活性不同,可能需要更高的稀释度)。4)对各个稀释度来说,从各稀释度中取50μl转移到无菌离心管或PCR管内,并在37℃或59℃下加热处理4小时(该体积可以根据需要而做出改变,但推荐最少为15-25μl)。5)加入同等体积的2×负载缓冲(2×负载缓冲液中含有62.5mM的Tris-Cl(pH6.8)、6M的尿素、10%的甘油、2%的SDS、0.0125%溴酚蓝和5%的BME);6)用相同体积的尿素(将待用凝胶的数量乘以20μl(针对18孔凝胶(Biorad)),或将待用凝胶的数量乘以15(针对26孔凝胶(Biorad)可以计算出梯度的体积)来制备生物素酰化梯度(Biotinylatedladder)。7)将样品进行充分搅拌,然后装载到凝胶(针对18孔Biorad凝胶,装载30μ1的样品;而针对26孔Biorad凝胶,装载20μ1的样品)上。8)使凝胶在150-175V下运行1小时后解体。10)使凝胶在1×的Transfer(Towbin)缓冲液(25mM的Tris碱、192mM的甘氨酸和20%的甲醇)中浸泡15分钟。11)组装Whatman-PVDF(用甲醇浸渍)-凝胶-Whatman夹层结构,在电压为15V,电流小于600mA下进行1小时电印迹的方法来转移样品。12)将印迹移至封闭液中,该封闭液中含有2%的BSA的TBST溶液(50mM的Tris-HCl、150mM的NaCl、0.1%的吐温-20)。13)在4℃下将印迹保存在封闭液中整晚。14)对封闭液进行倾析,并加入第一抗体溶液(1%的BSA在TBST中的溶液,其中含有1:2000的能对检测到的酶和内含肽修饰酶进行识别的第一抗体。15)用TBST对印迹进行5次洗涤,每次5分钟。16)加入第二抗体溶液(1%的牛血清白蛋白(BSA)在TBST中的溶液,其中具有1:20000的辣根过氧化物酶(HRP)抗生素和1:5000的HRP抗兔二抗(HRPantirabbitsecondary)),并用TBST对印迹进行5次洗涤,每次5分钟。将印迹浸泡在20μl的WestPico化学荧光底物(Pierce)中5分钟,在化学设定中以20×每分钟间隔进行连续拍照,并在G:BoxTM凝胶成像系统(Syngene)中进行显影。
采用本领域常规方法进行DNA测序。
从文库(1)(位于P77853的S67位点处微小pspPol内含肽mPspM1L4,其盒发生了诱 变)产生了约40个候选者,通过蛋白质印迹和DNA测序对其进行分析。进行测序的候选者中, 超过50%的候选者在C-外显肽上具有终止密码子,恰好位于底物结合域和催化结构域之间 的连接序列上或在其之后。整个盒上的突变将会产生大量的候选者,其中截断P77853蛋白 在S67插入位点处含有的碳水化合物结合域不完整。虽然在少数候选者(m25,m30)中观察到 了经剪接的成熟木聚糖酶,但更多的候选者(如m3)仅仅有切割产物。
内含肽诱变在产生氨基酸取代物方面具有更高的效率。在进行测试的诱变PCR条 件下,在P77853的S67位点和S112两个位点处,能观察到的微小pspPol候选者的平均数为4 个。这些突变会在大多数微小pspPol候选者中引发前体切割而非内含肽剪接。
Tth内含肽使NZY琼脂平板上的内含肽修饰的木聚糖酶P77853在酶法中表现出热 敏性,并能在蛋白质印迹中使剪接产物发生积累。在该结果的基础上,进一步对Tth内含肽 修饰的木聚糖酶候选者特征进行描述。
为了对多个候选者的热敏转化活性和剪接活性进行测量,对这些候选者的最佳转 化条件(温度和时间)进行测定。首先,对部分候选者进行测试,以得到加热预处理诱导条件 对木聚糖酶活性的影响。测试采用的一系列温度(30℃、37℃、45℃、55℃、70℃)和时间(0.5 小时、l小时、2小时、3小时、4小时、6小时和20小时)中,发现在55℃下处理4小时是最佳的。 以小得多的增量在55℃温度周围对多个候选者进行4小时的测试。采用所述条件进行测试 时,发现59℃是针对所有Tth候选者的最佳温度。
图3A-3L显示了针对Tth内含肽修饰的P77853的蛋白质印迹数据,其中,内含肽插 入在P77853酶中的丝氨酸158处(S158)或苏氨酸134(T134)处。泳道上方示出了针对各个样 品的琼脂平板表型。所述琼脂平板表型用“SW”代表转化表型,TSP代表热敏转化剪接表型,P 代表许可表型。
图3A显示了反映P77853-Tth-S158-2蛋白(SEQIDNO:1672)的蛋白质印迹,该蛋 白在琼脂平板分析中显示为转化表型。图3B显示了反映P77853-Tth-S158-4蛋白(SEQID NO:1673)的蛋白质印迹,该蛋白在琼脂平板分析中也显示为转化表型。图3C显示了反映 P77853-Tth-S158-7蛋白(SEQIDNO:1674)的蛋白质印迹,该蛋白在琼脂平板分析中也显 示为转化表型。图3D显示了反映P77853-Tth-S158-19蛋白(SEQIDNO:1675)的蛋白质印 迹,该蛋白显示为热敏转化剪接表型。图3E显示了反映P77853-Tth-S158-20蛋白(SEQID NO:1676)的蛋白质印迹,该蛋白在琼脂平板分析中显示为许可表型。图3F显示了反映 P77853-Tth-S158-21蛋白(SEQIDNO:1677)的蛋白质印迹,该蛋白在琼脂平板分析中显 示为转化表型。图3G显示了反映P77853-Tth-S158-25蛋白(SEQIDNO:1678)的蛋白质印 迹,该蛋白显示为热敏转化剪接表型。图3H显示了反映P77853-Tth-S158-38蛋白(SEQID NO:1679)的蛋白质印迹,该蛋白显示为热敏转化剪接表型。图3I显示了反映P77853-Tth- S158-39蛋白(SEQIDNO:1680)的蛋白质印迹,该蛋白显示为热敏转化剪接表型。图3J显示 了反映P77853-Tth-S158-42蛋白(SEQIDNO:1681)的蛋白质印迹,该蛋白显示为热敏转化 剪接表型。图3K显示了反映P77853-Tth-S158-138蛋白(SEQIDNO:1691)的蛋白质印迹,该 蛋白显示为热敏转化剪接表型。
图3L显示了反映P77853-Tth-T134-1蛋白(SEQIDNO:1629)(系列1)、P77853- Tth-T134-2蛋白(SEQIDNO:1630)(系列2)、P77853-Tth-T134-3蛋白(SEQIDNO:1631) (系列3)、P77853-Tth-T134-9蛋白(SEQIDNO:1632)(系列9)、P77853-Tth-T134-91蛋白 (SEQIDNO:1644)(系列91)、P77853-Tth-T134-48蛋白(SEQIDNO:1638)(系列48)、 P77853-Tth-T134-80蛋白(SEQIDNO:1640)(系列80)和P77853-Tth-T134-95蛋白(SEQID NO:1645)(系列95)的蛋白质印迹,这些蛋白在37℃(前述每个系列的左泳道)和70℃(前述 每个系列的游泳道)下进行了1小时的预热处理。同时该图还显示了含有空载体对照(VCT) 蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两种蛋白进行预热处理。将各个 蛋白表型列于其对应的泳道上方。
根据图3A-3L中的酶法数据和蛋白质印迹数据,在55-70℃的温度下进行4小时的 培养能提高内含肽剪接在多数Tth内含肽修饰的P77853木聚糖酶候选者中的发生。
对在蛋白质印迹中具有增加的内含肽剪接的T134候选者进行液相分析测试,在37 ℃下进行预处理或在59℃下预处理(PT)4小时后,在37℃下与底物进行12小时的反应。可选 择地,在不对这些候选者进行预处理(NPT)的情况下,在37℃或70℃下进行5小时的反应。将 结果制表列于下表3中。通过测量染料从标记底物中的释放(在590nm波长下用分光光度计 或酶标仪进行测量)来对活性进行定量分析,该结果以任意吸光度单位表示。59℃栏中附加 的百分数表示的是将59℃PT与37℃PT相比之后的活性倍率变化,计算为倍率变化=([(59℃ PT之后的活性)/(37℃PT之后的活性)]-1)×100。ND表示未测到。
表3
内含肽修饰的P77853木聚糖酶中产生的其它T134插入位点包含在SEQIDNO: 1711-1712中。
采用上文描述的预处理分析(PT)对转化剖面进行分析,从而对大肠杆菌SOLRTM细 胞(Stratagene)中的具有超过300个Tth内含肽修饰的P77853木聚糖酶候选者的使温度诱 导型木聚糖酶发生再激活。收集在进行或不进行预测处理时,所有样品的木聚糖酶活性数 据各两份。进行预热处理时,样品中的一组在37℃下培养4小时,另一种在59℃下培养4小 时。将这些样品在冰上进行冷却后,加入AZCL-木聚糖底物,将混合物置于37℃下最多12小 时的时间。在没有进行预热的另外两组中,直接向样品中加入AZCL-木聚糖底物,并置于37 ℃下进行5个小时的反应。针对TthS158P77853木聚糖酶的结果列于下表1中。虽然通常在 59℃下进行了预热的样品往往常具有更高的活性,但是全部Tth内含肽修饰的P77853木聚 糖酶候选者中,有近1/3的证实在37℃时和在59℃进行预热处理后的活性存在至少2倍的差 异(增加)。换而言之,37℃测得的活性通常是在59℃进行预热处理后的样品活性的两倍,高 于在37℃下进行预热处理后的样品活性的两倍。进一步对候选者的蛋白质印迹进行分析。 将通过酶标仪在590nm波长处进行测量的结果以以任意吸光度单位表示为活性。59℃栏中 附加的百分数表示的是将59℃PT与37℃PT相比之后的活性变化,计算为倍率变化百分比= ([(59℃PT之后的活性)/(PT前的活性)]-1)×100%。ND表示未测到。
表4
内含肽修饰的P77853木聚糖酶中产生的其它S158插入位点包含在SEQIDNO: 1700-1710中。
进行剪接时间过程分析(timecoursesplicingassay),并通过蛋白质印迹对上 表中具有T134插入部位或S158插入部位的每一个内含肽修饰的P77853候选者样品中的剪 接进行确认。图4A显示了针对S158-19样品的剪接时间过程分析。将蛋白提取物在59℃下培 养6个小时,在第0个小时、第1个小时、第2个小时、第3个小时、第4个小时和第6个小时的时 候取出样品(如图4A所标)。图4A右侧显示了空表达载体对照和野生P77853阳性对照,以及 分子量标准。对于能够使蛋白前体积累至较高水平的Tth内含肽修饰的P77853木聚糖酶候 选者S158-19来说,内含肽修饰酶前体水平的降低直接关系到剪接后的成熟蛋白的积累过 程。对样品进行59℃的热处理时,经剪接的成熟木聚糖酶的积累过程在4小时的时候达到顶 峰。但对59℃下发生的剪接进行6小时的观察。观察到,在50-59℃温度处发生剪接。随着培 养时间的增加,NICTth内含肽修饰的P77853-S158-19的数量下降,同时P77853的数量却有 增加,这说明在59℃培养过程中,内含肽剪接也随着时间进程而增加。类似地,图4B显示了 针对S158-30-103Tth内含肽修饰的P77853木聚糖酶(SEQIDNO:1701)的蛋白质印迹分析。 如图4B所示地,使蛋白样品在37℃、50℃、59℃和65℃下进行不同时间的培养(1小时、2小 时、3小时、4小时和6小时)。空载体和野生型P77853对照样品按分子量梯度显示在最右侧。 从图4B可以看出,随着时间和温度的增加,形成的成熟P77853酶(NC)也在增加,而Tth内含 肽修饰的S158-30-103P77853木聚糖酶(NIC)却发生了下降。类似地,图4C显示了针对T134- 100-101Tth内含肽修饰的P77853木聚糖酶(SEQIDNO:1711)的蛋白质印迹分析。在37℃、 50℃、59℃和65℃下进行不同时间的培养(1小时、2小时、4小时、6小时和17小时)。空载体和 野生型P77853对照样品按分子量梯度显示在最右侧。从图4C可以看出,随着时间和温度的 增加,形成的野生型P77853(NC)也在增加,而Tth内含肽修饰的S158-30-103P77853木聚糖 酶(NIC)的数量却发生了下降,这说明内含肽剪接增加了。本图显示随着时间和温度的增 加,形成的P77853也在增加,而Tth内含肽修饰的S158-30-103P77853木聚糖酶的数量却发 生了下降,这说明内含肽剪接增加了。
与上述基于活性的预处理分析(该分析能对进行预热处理的酶再活化过程提供定 量分析)不同的是,以蛋白质印迹为基础的剪接分析的优势在于,能提供剪接的可视证明。 对在预处理分析中表现较好的约90个内含肽修饰酶候选者进行蛋白质印迹分析。建立了针 对每个被分析的候选者的剪接剖面(splicingprofile)。剪接剖面包括前体水平、前体稳 定性、经剪接的成熟蛋白水平以及切割产物水平中的每一个在两个温度(通常选自室温、25 ℃、37℃、50℃、55℃、59℃、65℃或其它期望的温度)下的分布。对于一些内含肽修饰蛋白来 说,在加热预处理过程中随时间取出部分样品进行蛋白质印迹分析,进而对剪接动力学进 行研究。
按照下面的描述,对一些内含肽修饰酶中能够增强内含肽转化和剪接(DNA序列数 据)的发生在氨基酸上的突变进行确认。通过单一靶蛋白、单一内含肽和单一插入位点产生 的限定作用,这些突变对特定内含肽修饰酶具有特异性。
将来自Tth内含肽修饰的P77853木聚糖酶候选者中的转化候选者和TSP候选者,和 在蛋白质印迹分析中证实发生剪接的Tth内含肽修饰的P77853木聚糖酶候选者一起用来进 行DNA测序。确认了上述两种Tth内含肽中的氨基酸和位于内含肽-外显肽接头处的P77853 残基与增强的转化和剪接有关。通过将Tth内含肽在P77853的T134位点插入P77853而产生 的候选者来说,从P71(Tth内含肽中第71个氨基酸)到L、T或Q发生的Tth内含肽突变(SEQID NOS:1928、1929和1930)与TSP表型有关。单个P136(C-外显肽的+3位置)插入物也与TSP表型 有关(SEQIDNO:1931)。在所测序的TSP候选者中没有产生上述突变的结合(P71到L/T/Q, 或P136处的插入物)。在P136插入物的情况中还存在其它的突变,大多是在S135位点(C-外 显肽的+2位置)S被取代为V(SEQIDNO:1932)。这些双重突变也被划分为隶属TSP族。61个 候选者中余下的虽展现了转化表型,但却难以检测到其是否发生了热敏剪接。
对通过在S158插入内含肽构造得到的Tth内含肽修饰的P77853木聚糖酶进行分 析,并对不同的TSP构造进行了确认。Tth内含肽(SEQIDNO:91)中的17个R51G(S)(内含肽 中第51个氨基酸)取代物得到了确认(SEQIDNOS:1675、1678-1681、1689、1691、1700-1708 和1710),并且这些取代物均与TSP有关。测序数据显示,这些与TSP表型有关的内含肽突变 被插入这些特定位置后,在对Tth内含肽修饰的P77853木聚糖酶发生依赖于接触温度的剪 接时发挥了重要作用。其他支持TSP元件对剪接产生作用的证据来自对内含肽表面上的突 变进行的结构分析。预测Tth中的R51和P71与内含肽-外显肽结构十分接近,因此成为进行 内含肽切割和剪接的活性位点。
对实施例1-5结果的小结。如上文所述地,用内含肽对一种木聚糖酶P77853进行修 饰并对其进行分析。向酶中插入诱变内含肽能产生多个P77853诱变内含肽文库。使用多个 诱变内含肽和多个内含肽插入位点来获得文库。文库中每一个被修饰的酶中含有插入到一 个插入位点的一个诱变内含肽。从文库中的约一千万个突变体中分离出500个候选物。通过 DNA测序、酶活性分析对候选物进行分析,并分析其在活性和剪接方面与温度改变之间的敏 感性。证实了在60℃附近温度下进行预测处理时最可能诱发内含肽修饰酶发生转化,即活 性发生改变。在一些候选者中,转化是于内含肽剪接相关的。还发现内含肽和外显肽中的特 定氨基酸改变(尤其是在内含肽-外显肽接头附近的那些)能显著地增强内含肽剪接,或热 敏性。这些氨基酸改变与特定的内含肽、靶酶和内含肽插入位点有关。
根据上文实施例的描述,将Tth内含肽插入P77853(其天然序列中不含内含肽)后 得到TSP转化表型。P77853的T134位点位于β-片状结构和环形区域的接头,因此SVM评分将 其分为前5个最可能发生剪接位点。此外,剪接增加的同时在插入位点附近发生突变引入了 +2脯氨酸,这与较高的SVM分数有关。将Tth内含肽插入P77853的S158位点(这是与活性位点 残基第七接近的位点(仅相距6.6埃),同时这也发生在β-片状环形屈居的接头处)时,得到 能够根据温度发生剪接并同时具有转化和TSP表示的内含肽修饰的候选者。
在SEQIDNOS:1629-1712中提供了内含肽修饰的木聚糖酶的实例。
实施例6.在SEQIDNOS:1713-1784中提供了内含肽修饰的纤维素酶。
实施例7——对纤维素酶进行分析和提纯。纤维素酶Acel(来自解纤维热酸菌11B 的内切葡聚糖酶E1)是来自解纤维热酸菌(基因库中的登录号为P54583)的内切葡聚糖酶 (EC3.2.1.4)。该酶具有N-末端催化结构域(CD)(与糖基水解酶第5家族中的酶具有同源 性)和C-末端纤维素结合域(与碳水化合物结合结构域第2家族(CBM2)中的蛋白具有同源 性)。P54583中的CD和CBM2域通过富含丝氨酸-、苏氨酸-和脯氨酸的连接域进行连接。在异 源系统(包括植物)中对P54583进行表达,并表现能有效地水解植物源的纤维素材料。
P54583的表达和表征。参见图5,显示了具有纤维素酶插入物质粒pGAPZα和 pAL410。所述质粒没有按比例进行绘制。在图5中的注释代表以下内容:P-GAP,名义构造酵 母GAP的启动子;α,来自酵母交配因子α的分泌信号肽,它被翻译成与内切葡聚糖酶发生融 合的N-末端;P54583,Ace1内切葡聚糖酶的编码序列(见下文);AOXt,源于酵母AOX基因的转 录终止子和多腺苷酸化信号;P-TEF1,来自酵母TEF1基因的启动子;P-EM7源于酵母AM7基因 的启动子;zeo,酵母和大肠杆菌内产生博莱霉素(zeocin)耐药性的编码序列;CYC1t,源自 酵母CYC1基因的转录终止子和多腺苷酸化信号;ColEI,大肠杆菌内能对质粒进行复制的区 域;f1ori,产生单个标准质粒衍生物的序列;KanMX,酵母内具有G418耐药性的基因;2u ori,2微米起点,使质粒能在酵母细胞内进行复制;bla,在细菌细胞中产生氨苄西林耐药性 的基因。注意到表达出的P54583具有从pGAPZα-P54583和pAL410-P54583中翻译融合的C-末 端6组氨酸和myc。
获得了P54583优化版密码子。下文列举了能在植物中进行表达的优化P54583的 DNA序列。注意到:该序列仅对应解纤维热酸菌中天然多肽上第42-562号氨基酸残基,该氨 基酸残基与内切葡聚糖酶的“成熟”形式对应,同时不含信号肽(第1-4号氨基酸残基)。在 ATC起始密码子之后的GCT密码子编码了第42号氨基酸。
P54583优化版密码子
ATGGCTGGAGGAGGATACTGGCACACTTCCGGCAGGGAGATCCTCGACGCA
AATAACGTTCCAGTCAGAATCGCCGGGATTAATTGGTTTGGCTTCGAAACGT
GTAACTACGTGGTTCACGGCCTGTGGTCTCGGGATTACAGATCAATGCTCGA
CCAGATCAAATCCTTGGGGTATAATACAATTAGGCTGCCCTACAGCGATGAC
ATTCTTAAGCCTGGAACCATGCCGAACTCGATTAATTTCTACCAAATGAACCA
GGATCTGCAGGGATTGACTTCTCTGCAGGTTATGGACAAGATCGTGGCGTAC
GCCGGCCAAATCGGGCTCAGAATTATTTTGGATCGGCACAGGCCAGACTGCT
CAGGTCAGTCGGCCCTGTGGTACACAAGCTCCGTGTCAGAGGCAACATGGAT
TTCAGATCTTCAAGCCCTCGCACAACGCTATAAAGGCAACCCCACGGTTGTG
GGATTCGACCTTCACAACGAACCTCACGATCCGGCCTGTTGGGGCTGCGGGG
ACCCTTCGATCGACTGGAGACTGGCAGCGGAGAGGGCTGGTAACGCCGTTCT
CAGCGTCAATCCCAACTTGCTGATCTTTGTGGAGGGAGTTCAGTCCTACAAC
GGCGATTCTTACTGGTGGGGCGGAAATCTCCAAGGCGCAGGGCAGTATCCTG
TCGTGCTTAACGTTCCGAATCGCCTGGTCTACTCAGCACACGACTACGCGAC
TAGCGTGTACCCACAGACGTGGTTCTCCGATCCCACATTTCCTAACAATATGC
CGGGAATCTGGAACAAGAATTGGGGTTACTTGTTTAACCAAAACATTGCTCC
AGTTTGGTTGGGTGAATTTGGCACCACTCTTCAGTCGACGACAGACCAAACC
TGGCTGAAAACCCTCGTCCAGTATTTGCGGCCAACTGCTCAGTACGGAGCAG
ATTCTTTTCAATGGACGTTCTGGTCTTGGAATCCTGACTCCGGGGATACAGG
CGGTATCCTGAAAGACGATTGGCAGACCGTGGACACTGTTAAGGACGGGTAC
TTGGCGCCGATTAAAAGCTCGATCTTTGACCCAGTCGGCGCTAGCGCTTCCC
CATCTTCACAACCTTCGCCGAGCGTCAGCCCCAGCCCAAGCCCAAGCCCGTC
TGCCAGCAGAACCCCCACTCCCACACCTACCCCCACGGCCTCACCAACTCCG
ACGCTCACTCCTACGGCGACGCCAACACCAACTGCTTCACCCACTCCTAGCC
CCACCGCAGCGAGCGGGGCTAGGTGCACCGCTTCTTACCAGGTCAACTCTGA
CTGGGGTAATGGCTTCACCGTGACTGTGGCGGTCACTAACTCAGGAAGCGTC
GCGACGAAAACCTGGACTGTGTCCTGGACGTTCGGGGGCAACCAAACAATCA
CCAACAGCTGGAACGCTGCAGTTACGCAGAATGGGCAAAGCGTCACGGCGC
GCAATATGAGCTACAACAACGTGATTCAACCAGGCCAGAATACCACATTCGG
TTTTCAAGCAAGCTATACCGGGTCAAACGCTGCCCCAACTGTCGCTTGTGCT
GCCTCA(SEQIDNO:1933)。
将携带该序列的DNA片段与上文描述的巴斯德毕赤酵母(Pichiapastoris)整合 型表达载体pGAPZα(invitrogen,CarlsbadCA)。pGAPZα是用来对巴斯德毕赤酵母GS115进 行转化的整合型载体。接着遵照Invitrogen指南,将得到的质粒pGAPZα-P54583(图5)引入 巴斯德毕赤酵母GS115细胞中。根据博莱霉素耐药性的选择重组体,并对它们在琼脂平板上 驱动染料脱离AZCL-HE-纤维素(MegazymeInternationalIreland有限公司)中的能力进 行评分。
存在博莱霉素时,使表达P54583(来自在里氏木霉(糖基水解酶第7家族中的 P07981)的无关内切葡聚糖酶)或白蛋白的毕赤酵母菌株在丰富培养基中进行生长。收集这 些培养物的上清液,用纤维素内切酶检测底物(CellazymeC)分析法(见下文)对内切葡聚 糖酶活性进行分析,其中,所述内切葡聚糖酶将蓝色染料(AZCL)从纤维素底物(Megazyme InternationalIreland有限公司)中释放出来。这些分析证实了表达P54583的毕赤酵母克 隆体产生的内切葡聚糖酶活性大约是表达P07981克隆体的2倍。参见图6。在图6中的空白 (blank)是含有未接种培养基的样品,用纤维素酶单位来表达活性。
鉴于在酿酒酵母中可以更容易发生诱变,将P54583的编码序列从pGAPZα-P54583 转移到pAL410上,生成质粒pAL410-P54583(图5)。pAL410是在酿酒酵母转化中的自主复制 载体。在YPD琼脂平板上对携带pAL410-P54583质粒或pAL410质粒的酿酒酵母菌株进行评 分,所述YPD琼脂平板中含有100mg/L的G418,其上还涂覆了0.2%的AZCL-HE-纤维素 (Megazyme)在2%的琼脂覆层。下文提供了详细的平板活性分析法。如图7所示,将2个携带 pAL410-P54583的独立转化体和两个携带pAL410在AZCL-HE-纤维素表面划线。仅在分泌活 性内切葡聚糖的克隆体附近可以清楚地看到AZCL染料的移动。
测量内切葡聚糖酶和内含肽修饰的衍生物的活性:
平板活性分析法。将含有0.2%的AZCL-HE纤维素底物的液体琼脂薄层施覆到含 100mg/L的G418的YPD选择模板上,从而制得活性分析平板。平板固化后,将含有目标基因酵 母细胞接种到底物覆层上。随后使细胞在30℃下生长。具有活性的内纤维素酶将驱动AZCL 染料,并在周围培养基上形成蓝晕。这是针对不同宿主菌株中活性、以及构造随着温度和时 间框的改变而进行的定性分析。这还能用来测试观察内含肽修饰的P54583衍生物中的活 性。
液相活性分析。液相分析考虑了在分析和样品制备条件中的较大改变,通过分光 光度计的吸光度读数给出可计量的结果。分析条件可以在较大范围的pH、温度、持续时间和 样品的制备中变化。用于本分析的样品制备可以包括不同的生长条件、浓缩或提纯方法以 及预处理。可以对本分析法进行改良,从而对培养物上清液或细胞团块(cellpellet)内的 活性进行测量。
对纤维素内切酶检测底物片剂(Megazyme)进行的液相分析。纤维素酶检测底物片 剂是预先团块化的AZCL-HE纤维素底物(MegazymeInternationalIreland有限公司)。本 分析法得到的结果与平板法的结果具有较高的对应性。按下文记载进行标准纤维素内切酶 检测底物片剂分析。将液体培养物中的蛋白样品与25mM的NaOAc缓冲液(pH4.5)混合定容至 500uL。使样品在42℃下平衡5分钟。向每个样品你中加入1片纤维素检测底物,然后在42℃ 下培养30分钟。加入lmL的20%的tris碱来使反应停止。在酶标仪上用透明平地板测量吸光 值590。含有较多内纤维素酶活性的样品能跟迅速地对底物进行讲解,进而使吸光值590增加。 通过这一分析,测出P54583活性在pH5.0周围最佳,且活性随着温度升高(到至少70℃)而增 加。更长的反应持续时间将使吸光值(590nm)读数增加(图8和图9)。如图8所示,P54583的活 性从pH4.5到pH8.0发生了增加。但阴性对照组在超过pH2.0的条件下没有表现出显著活性 了。如图9所示,可以用纤维素内切酶检测底物来证实P54583活性随着温度增加而增加,信 号强度(吸光值590)随着时间增加。
PNP-C液相分析。还可以用对硝基苯基纤二糖苷(PNP-C)底物检测内切葡聚糖酶 (如P54583)的活性。标准PNP-C分析为50μl的反应液,其中含有5mM的PNP-C底物、活性酶和 用来控制pH的缓冲液。这一分析可以在较宽范围的pH和温度条件下进行。在特定时间点加 入100μl的碳酸钠,来终止反应并放大信号强度。在分光光度读数板(spectrophotometric platereader)上测量405纳米下的吸光值(Abs.405)。活性增加则读数越大(图10)。如图10 所示,对P54583进行的PNP-C分析显示酶活性随着分析温度升高而升高。
Enzchek(Invitrogen)液相分析。Enzchek是能用于内其葡聚糖酶活性分析的合成 荧光底物。下面记载了有关Enzchek底物标准分析法。将体积相同的室温底物和室温酶混 合,将pH缓冲为5.0左右,在黑色孔板(例如,康宁(Corning)黑色384孔板#3820)上进行荧光 读数。在室温下进行避光培养,在340/450的激发/放射波长下进行荧光测量。荧光读数随着 时间和样品浓度的增加而增大。可以在不终止反应的情况下,自分析开始之后5分钟或者对 水平活性较低的样品进行数小时培养后开始读数。可以通过终止反应的方法来对进行了相 同时间培养的样品进行读数,这在对成百上千的样品进行处理的过程中十分有用。加入相 同体积的20%的tris碱来终止反应。这能立即增加荧光读数(这在全部样品中呈现出了一致 性),并保持数小时的稳定。本活性分析具有敏感性、可重复实现,并且能用于液体处理器上 进行的高通量分析。可以将标准液体处理器条件设定为在康宁#3820板上使用含有全部培 养物的10μl的反应物。
选择用来表达内含肽修饰的内切葡聚糖酶的酵母宿主。为了测试各种酵母住宿是 否更适于进行i)诱变和ii)对表达内含肽修饰的内切葡聚糖酶的克隆体进行筛选,对两种 酵母菌株(INVSc-1(Invitrogen,CarlsbadCA)和SCBJ(a.k.a.BJ5465,美国典型培养物保 藏中心(AmericanTypeCultureCollection),ManassasVA,目录编号:20829))接受外来 DNA的能力进行了比较。制备质粒DNA(超螺旋或线性DNA)样品,并通过ZymoResearch’sEZ 酵母转化试剂盒用这些DNA来对样品进行转化。下表5显示了酿酒酵母两种菌株的相对转化 率。从表中可以看出,使用SCBJ的转化率比用INVScl的转化率高100倍。SCBJ比INVSc-1细胞 在更短时间内形成了明显的菌落。
表5
宿主 DNA #菌落 SCBJ 160ng线性DNA 5000 INVSc-1 160ng线性DNA 30 SCBJ 超螺旋质粒 7000 INVSc-1 超螺旋质粒 50
酵母表达的内切葡聚糖酶的蛋白沉降(pulldown)浓度和纯度。许多内切葡聚糖 酶中常见的P54583具有能将酶限制在其结晶底物上的C-末端的碳水化合物结合域。以该特 点为基础,对通过碳水化合物类似物来降低或部分纯化内切葡聚糖酶的方法进行测试。收 集6等份的表达P54583的培养物或携带阴性对照空载体(pAL410,图5)的上清液。向5个等份 (除去一个保留作为未处理样品的全部等份)中加入AvicelTM(微晶纤维素)。然后,在室温 下对全部等份进行1小时的摇晃。进行培养后,微晶纤维素呈团块状,将上清液倒掉。用洗提 缓冲液对4份团块进行洗涤,示于图11中。迅速将洗出液转移到赶紧试管内,并调节至中性 pH。第5份微晶纤维素未进行洗提。随后用纤维素内切酶检测底物片剂来测量全部6等份的 活性。如图11所示,可以使用微晶纤维素将活性纤维素酶从培养物样品中分离出来。这是一 种简单、廉价而且迅速地进行蛋白提纯并对上清液和细胞裂解液进行浓缩的方法。随后可 以通过蛋白质印迹分析对酶进行分析,也可以直接用AvicelTM进行活性分析,或者用各种缓 冲液将其洗提至更低的程度。
免疫分析法。可以通过免疫分析法(如蛋白质印迹)直接对P54583进行检测。图12 显示了蛋白印迹的结果。为了进行上述分析,从培养物上清液或者细胞团块的裂解液中获 得蛋白后,在电泳前对其进行脱糖基化。该分析显示大多数可检测到的蛋白来自培养物上 清液,这说明对酶进行基于抗体的亲和提纯法能用来对蛋白进行浓缩和提纯。
实施例8——对P54583内切葡聚糖酶进行内含肽修饰。通过前文详细描述的方法 对P54583内含肽插入位点进行确认。图13显示了P54583中被选择插入Tth内含肽位点的相 对位置。显示了催化结构域(GH5)、连接域(窄条形)以及碳水化合物结合结构域(CBM2)的相 对位置。两种催化谷氨酸盐是GH5家族中的保守成员。所示的丝氨酸、苏氨酸和半胱氨酸的 残基编号全部是相对于α信号肽被切割后,从酿酒酵母中分泌的“成熟”形式多肽而言的(除 了C75和C465,它们实际上位于相对于切割位点的35号和425号位置)。
随后如图14所示地,通过SOEPCR策略(HortonRM,HuntHD,HoSN,PullenJK, PeaseLR.1989.Engineeringhybridgeneswithouttheuseofrestriction enzymes:genesplicingbyoverlapextension.Gene.77(l):61-8,通过引用该文献全部 记载而将其整体与本文结合。)将重组P54583蛋白的编码序列进行组装。该策略与上文中用 来组装内含肽修饰的木聚糖酶基因的策略相似。将引物设计成退火到:
(A)pAL410-P54583(见图5)中α信号肽的编码序列;
(B)P54583编码序列内与插入位点相邻的区域;
(C)Tth内含肽编码序列的5’端;
(D)Tth内含肽编码序列的3’端;
(E)P54583编码序列内与插入位点(注意:该位点不与引物C覆盖的区域发生重叠) 相邻的区域;和
(F)来源于pAL410P54583的CYC终止序列中的区域。
PCR1使用引物A和引物B组装的短产物含有针对部分α信号和内切葡聚糖酶 (P54583-N)的N-末端部分的编码序列。PCR产物1的3’末端上含有与Tth内含肽5’末端同源 的短区段。PCR2使用了引物C和引物D来对Tth内含肽编码序列进行扩增。PCR3使用了引物E 和引物E来对内切葡聚糖酶的C-末端部分的编码序列(P54583-C,可以含有全部或一部分的 催化结构域和碳水化合物结合结构域)进行扩增,包括“C+1”氨基酸和与Tth内含肽5’末端 同源的短区段,以及一部分的pAL410P54583中的CYC1终止子(CYC1t)。然后将PCR产物1、PCR 产物2和PCR产物3在一个PCR反应中进行组合。鉴于其与Tth内含肽端部的同源性,PCR产物1 和PCR产物3能退火到PCR产物2上。用最外层引物(引物A和引物F)进行的DNA合成或扩增能 生成大量的完整长度产品(如最下方图所示)。通常将该终产品简称为“NIC”(N-末端片段, 内含肽和C-末端片段)。通过选择合适的引物,可以用这种方法在任意插入位点构建任意类 型的内含肽修饰蛋白。通过在0位置使用天然亲核氨基酸,或者将0位置处氨基酸诱变为亲 核氨基酸的方法,可以选择蛋白质中的任意氨基酸作为内含肽插入物的位点。所述亲核氨 基酸可以是C、T或S的残基。
用于SOEPCR的典型环化条件包括:20μl的反应物、10μl的PhusionHF(New EnglandBiolabs,IpswichMA)DNA聚合酶主混合、4μl的各引物(来自浓度为1μΜ的原料) 和2μl的合适模板,稀释至接近0.1-1ng/l。按照PhusionHFDNA聚合酶指南的说明进行热 环化。进行第一轮PCR反应后,通过WizardSV凝胶和PCRCleanup试剂盒(Promega, Madison,WI)对产物进行凝胶提纯,将1μl的各个第一轮产物进行混合后在随后的PCR反应 中组装成第二轮(完整长度)产物,其条件基本与第一轮条件相同,不同的是延伸时间从30 秒增加为60秒。
对适合于各个内含肽插入位置的PCR产物进行制备,以得到所有期望的内含肽修 饰P54583衍生物。但是本实验步骤中的一些组成被模块化了。例如,可以用引物C和引物D来 制备PCR产物2,然后可以用PCR产物2对所有计划的重组物进行组装。类似地,无论插入物位 置在哪里,都可以用引物A和引物F分别制备PCR产物1和PCR产物3。这样一来,只有引物B和 引物E能唯一地获得特定内含肽插入物。下表6列举了用来组装各个内含肽修饰的内切葡聚 糖酶的寡核苷酸引物序列(从5’到3’方向)。虽然引物B和引物E对各个产物来说都是唯一 的,但它们均含有与Tth内含肽的末端同源的区域(如图14中讨论所示)。下表6中,将这一区 域在每个引物中用下划线标记出来。
表6
Tth内含肽在C75位置的插入还伴随少量的在内含肽/外显肽接头附近的保守氨基 酸改变。为了适应这些改变,按照下面记载地用不同类型的引物C和引物D对用来组装 C75Tth内含肽产物的Tth内含肽(PCR2)进行扩增。
CG75Tth,5’TGCCTTGCCGAGGGTACCCGAGTCTTGGACGCGGCTACCGGGCA3’(SEQIDNO: 1968)
DG75Tth,5’GTTGTGCACGACAACCCCTCGCTCACGAAGTTTGCAAAGGGT3’(SEQIDNO: 1969)
表2所列插入位点与图13所绘相同。还设计了一系列的引物来将PspPol内含肽和 RecA内含肽插入到P54583内的多个位点上。插入这些内含肽的策略与图14中描述的相同, 不同的是,引物B、引物C、引物D和引物E全与特定的内含肽相匹配。上述引物的组合物列于 表7(用来组装编码PspPol内含肽修饰的P54583内切葡聚糖酶的引物)和表8(用来组装编码 RecA内含肽修饰的P54583内切葡聚糖酶的引物)。
表7
表8
用上述引物针对全部设计的内含肽修饰的内切葡聚糖酶进行SOEPCR反应。然后 将完整长度PCR产物与pCRBluntIITOPO(Invitrogen)连接,并对单个克隆体进行完全测 序,以确保在PCR和/或克隆过程中没有发生不期望的碱基改变。一旦发现突变,重复全部或 部分受影响的PCR反应并将错误进行校正。当编码内含肽修饰的P54583的产物组成得到确 认后,将整个片段从pCRBluntII载体中切除,并连接到pAL410(或相关载体)上。再次将得 到的载体引入酵母细胞。通过菌落PCR和小量制备的质粒还原(使用来自ZymoPrep酵母小量 制备试剂盒II,ZymoResearch,OrangeCA)的组合来对酵母转化体进行典型性验证。接着, 将从酵母细胞中还原的质粒再引入大肠杆菌细胞,通过大肠杆菌质粒小量制备进行传播和 分离,通过限制酶切进行检测,来测定质粒自引入原始酵母细胞之后是否经历了突变或重 排。通过这种方式将完全验证的质粒还原,相应的酵母菌株可以用于随后有关内含肽修饰 的内切葡聚糖酶的实验中。
随后在平行YPD平板(A和B)上对携带内含肽修饰的内切葡聚糖酶的表达载体的酿 酒酵母转化体进行评分,所述YPD平板中含有100mg/L的G418,其上施覆有0.2%的AZCL-HE- 纤维素覆层。将这些平板在30℃下培养2个晚上。然后将平板B移至70℃下数小时。图15显示 了平板A和B及各自对应的顺序:条纹1-21分别为P54583T154Tth、P54583S135Tth、 P54583S134Tth、P54583S96Tth、P54583S94Tth、P54583T93Tth、P54583C75Tth、 P54583S67Tth、P54583T61Tth、P54583S56Tth、P54583S10Tth、P54583-野生型、pAL410空载 体、P54583S393Tth、P54583S353Tth、P54583S330Tth、P54583S321Tth、P54583S314Tth、 P54583S277Tth、P54583S237Tth和P54583S192,它们含有具有序列SEQIDNO:1753-1758、 1741、1759、1760、1739、1761、111、2006、1762-1767、1743和1742。在一些细胞附近出现的蓝 晕说明P54583具有活性。本实验的结果说明Tth内含肽插入物根据其插入位点对P54583产 生了不同程度的干扰,且这些内含肽修饰的内切葡聚糖酶中的一种或更多种展现出热敏酶 活性。
插入P54583野生型的Tth内含肽对酶表达和活性水平产生了影响,这可以通过蛋 白质印迹分析和活性分析测量得到。对20个NIC和对照组进行Enzchek活性分析。20个NIC和 Tth内含肽插入到S10、S56、T61、S67、(C75)、T93、S94、(S96)、S134、(S135)、T154、S192、 S237、S290、S314、S321、S353和(S393)位置处。这20个NIC具有序列(SEQIDNO:1761、1739、 1760、1759、1741、1758、1757、1756、1755、1754、1753、1742、1743、1768、1766、1765、1763和 1762)。将培养物上清液分成两等份。从这些等份中取出一半在52.5℃下进行6小时的加热 预处理,另一半则保存在4℃下。进行预处理的温度和持续时间可以不同。随后使这些样品 在室温下进行平衡,并进行Enzchek分析(与底物进行3小时的培养)。分析的最后,根据各个 样品中的荧光量来推断内切葡聚糖酶的活性。如图16所示地,Enzchek活性分析反映了内含 肽修饰的内切葡聚糖酶产生超过其本底的酶活性(pAL410,空载体对照)在52.5℃下进行预 温育时,该部分人显示出较高的活性。图16中的wt表示野生型P54583内切葡聚糖酶。鉴于对 结构(显示了不含信号肽的P54583的不成熟形式或不成熟形式)进行的编号上存在差异,相 对于不成熟形式的氨基酸插入位点的位置表示在括号内,作为NIC的子集。
图16所示构造在羧基端上含有可以被His标签抗体检测到的His标签。将来自对应 培养物的上清液浓缩20倍,并用于蛋白质印迹分析中(图17)。在图17中,wt表示P54583野生 型,pAL410表示具有His抗体(Genscript,PiscatawayNJ)的空载体,成熟的剪接蛋白由 60kDa带状表示。如图17所示,还通过蛋白质印迹对其它Tth内含肽修饰的P54583——C465 (SEQIDNO:1769)进行分析。用星形标记的泳道在平板法中也表现出显著的活性(见图15)。 通过蛋白质印迹显示,表达内含肽修饰酶的培养物中可以检测到分子量与野生型酶相似的 蛋白质,这说明在重组蛋白中发生了内含肽剪接。也能在一些样品中检测到具有较高分子 量的种类,它们可能对应于未剪接的NIC、剪接中间体、聚集体或其他形式的重组蛋白。NIC 显示了不同水平的蛋白积累,这在一定程度上对应于图16所示的活性测量结果。
实施例9——对内含肽修饰的内切葡聚糖酶的诱变。
用同源重组在酿酒酵母(SwersJS,KelloggBA,WittrupKD.2004,通过活体内同 源重组产生的洗牌抗体文库及酵母表面展示(Shuffledantibodylibrariescreatedby invivohomologousrecombinationandyeastsurfacedisplay),NucleicAcids Res.32:e36,通过引用该文献全部记载而将其整体与本文结合。)的DNA文库中产生大量的 多样性。在该系统中,可以将携带有多肽(已生成)编码序列的线性DNA通过共转化到酵母内 的方法插入到线性表达载体上。可以使用易错PCR或其他策略来对诱变整个或部分(例如, 内含肽)的内含肽修饰的核酸内切酶。得到的产物可以与合适的线性表达载体(例如, pAL410或其衍生物)一起共转化到酿酒酵母细胞中,这能催化分子之间发生同源重,并使数 千个酵母克隆体发生聚集,其中每个克隆体都携带唯一的重组表达载体。通过这种或体内 重组方案产生的酵母菌落可以对多个被修饰的蛋白进行表达,所述蛋白的多样性又直接与 发生诱变的编码序列水平相关(或者超过了该水平)。
培育一系列的用于酵母或体内重组的重组载体。各个重组载体携带截断的Tth内 含肽。截断的Tth内含肽失去了大部分的内含肽序列,仅留下从内含肽编码序列5’端和3’端 开始70-80bp。在该DNA序列的中心是唯一的EcoRV位点。下面显示了具有截断Tth的DNA序 列,其中EcoRV位点用下划线标记。
TGCCTGGCCGAGGGCTCGCTCGTCTTGGACGCGGCTACCGGGCAGAGGGTC
CCTATCGAAAAGGTGCGTCCGGGGATATCGAACCGGCCGGTAAGGCGAGAA
CATTCGACTTGCGCGTTCCACCCTTTGCAAACTTCGTGAGCGAGGACCTGGT
GGTGCATAAC(SEQIDNO:2007)
通过EcoRV酶切可以简单地使携带上述截断内含肽的表达载体线性化。由于这种 载体缺乏大部分“野生型”内含肽序列,在酵母内进行的同源重组过程中产生的表达载体更 可能携带在易错PCR过程中产生的突变,这是因为在重组过程中与突变体竞争的“野生型” 内含肽变少了。此外,载体在高通量筛选模式下发生的自连接可能产生假阳性,而在重组载 体中使用所述截断内含肽就能降低假阳性数量方面具有更大的优势。鉴于截断的性质,截 断内含肽会在内切葡聚糖酶基因内产生移码(frameshift),产生的酶的翻译过程被过早地 终止了。这种翻译产物具有酶活性的可能性较低。因此,在文库筛选中产生的功能性酶更有 可能来自于涉及DNA片段编码诱变内含肽的真重组事件。
使用类似于图14中描述的策略制备源于无His的pAL410-P54583的表达载体。在这 些表达载体中,在S56、C75、S192、或S237位置处引入截断内含肽Tth内含肽序列来代替完整 长度的内含肽。随后,使用该重组载体的集合来产生酵母SCBJ细胞内的内含肽修饰的内切 葡聚糖酶诱变文库。图18A-图18C中描述了PCR内含肽诱变机制。在模板表达载体(无His的 pAL410-P54583S237Tth(图18A))的内含肽插入位点侧翼的引物(例如,S237上游和S237下 游)可以用来对重组载体的特定区域进行扩增,所述重组载体含有完整内含肽编码序列和 部分侧翼外显肽编码序列。可选择地,也能使用仅能扩增内含肽序列的引物。在合适的条件 下生成了PCR产物,同时在扩增的DNA分子集合中分散有随机突变(五角星)。可以将这些诱 变DNA分子与合适载体进行混合,如图18C所示,通过用EcoRV限制性核酸内切酶进行酶切使 其线性化。随后可以将混合物引入酵母细胞中驱动重组进行。在下面的实施例中,将线性无 His的pAL410-P54583S237Tth-截断作为载体,利用图18B所示的DNA分子在S237位置产生诱 变内含肽文库。适用于S56、C75或S192位置的引物也能与各自的重组载体(图18C所示)结合 使用。该策略将携带有位于外显肽(本实施例中,为内切葡聚糖酶)侧翼区域内和位于内含 肽内部的突变的DNA分子包括进来。但是,如果在易错-PCR中使用PCR引物仅对内含肽序列 进行扩增,那么也可以使用任意重组载体作为改变后内含肽编码序列的宿主。图18A中, P54583-N和P54583-C指的是针对内切葡聚糖酶的N-末端部分和C-末端部分的编码序列。图 18B中,P54583*代表源于内切葡聚糖酶编码序列的小侧翼部分,它能通过明智设计的引物 而包含在诱变PCR产物中。图18C中,TthN和TthC代表Tth编码序列的N-末端部分和C-末端部 分,它们在截断内含肽内通过EcoRV位点发生分立。其他的缩写与图5中的相同。
实施例10——用微小内含肽对P54583进行修饰。
基于一开始的平板分析和液相或兴奋,选择上文描述的插入位点的子集与另外8 个微小Tth内含肽进行修饰,他们是mTth001(SEQIDNO:92)、mTTh002(SEQIDNO:93)、 mTth003(SEQIDNO:94)、mTth004(SEQIDNO:95)、mTth005(SEQIDNO:96)、mTth007(SEQ IDNO:98)、mTth008(SEQIDNO:99)、andmTth010(SEQIDNO:101)。每个构造从插入一种 内含肽。P54583中的S56位置是第一个被选择用微小内含肽进行修饰的位点。在单一酵母活 体内的重组反应中,将微小mini-Tth内含肽插入该部位。酵母在YPDG418平板上进行还原 和生长后,培养出36个独立的菌落以进行活性分析。36个菌落中有2个表达出超过了基线水 平。将质粒从这两个菌株中还原出来,并使其进行DNA测序分析。发现两种样品均携带 mTth010微小内含肽。下面是mTth010微小内含肽的DNA序列,其下方是对应的氨基酸序列。
mTth010
tgcctggccgagggctcgctcgtcttggacgcggctaccgggcagagggtccctatcgaa
CLAEGSLVLDAATGQRVPIE
aaggtgcgtccggggatggaagttttctccttgggacctgattacagactgtatcgggtg
KVRPGMEVFSLGPDYRLYRV
cccgttttggaggtccttgagagcggggttagggaagttgtgcgcctcagaactcggtca
PVLEVLESGVREVVRLRTRS
gggagaacgctggtgttgacaccagatcacccgcttttgacccccgaaggttggaaacct
GRTLVLTPDHPLLTPEGWKP
ctttgtgacctcccgcttggaactccaattgcagtcagagatgttgagactggagaggtt
LCDLPLGTPIAVRDVETGEV
ctctgggaccctattgttgctgtcgaaccggccggtaaggcgagaacattcgacttgcgc
LWDPIVAVEPAGKARTFDLR
gttccaccctttgcaaacttcgtgagcgaggacctggtggcgcataac(SEQIDNO:2008)
VPPFANFVSEDLVVHN(SEQIDNO:101)
为了测试携带微小内含肽的P54583衍生物(a.k.a.“P54583S56mTth010”)的内切 葡聚糖酶是否依赖于该微小内含肽发生剪接的能力,制备了被修饰的构造。在被修饰的构 造中,用丙氨酸取代内含肽的端部氨基酸(在半胱氨酸N-端残基处,和天冬氨酸C-端残基 处;见以上序列)。N-末端半胱氨酸和C-末端天端氨酸很可能在催化内含肽剪接过程中起到 关键作用,因此用丙氨酸取代这些残基是已知的或可能阻止内含肽进行剪接。参见图19,将 样品从SCBJ酵母培养物中取出,所述SCBJ酵母培养物中携带了空表达载体、pAL410(阴性对 照)、编码不间断酶的表达载体、P54583(野生型(wt))、编码在S56位置携带了微小内含肽的 衍生物的表达载体(P54583S56Tth139),或编码在S56位置携带了缺陷微小内含肽的衍生物 的表达载体(P54583S56AThA139)。在Enzchek分析中,通过在室温下进行4小时的培养来分 析样品中的内切葡聚糖酶活性。与微小内含肽不同的是,缺陷内含肽将内切葡聚糖酶活性 降低至接近阴性对照的水平。无论样品是否在进行分析前先在低温(4℃)或高温(55℃)下 进行5小时预处理都没有改变这种趋势。由此得出结论:不能在P54583的S56位置对微小内 含肽进行剪接将会对酶活性造成干扰,在同一位置处能发生剪接的微小内含肽则能重新构 建起大部分的天然酶活性。
为了调查位于该位置的微小内含肽能否表现出热敏剪接作用(即在特定温度下对 重组酶进行的预温育是否重新构建了不同程度的内切葡聚糖酶活性),使来自SCBJ酵母细 胞(表达P54583S56MTth010(a.k.a.P54583S56Tth139))单一培养物的样品在不同的温度下 进行6小时的预温育。之后,使样品均匀冷却至4℃,然后进行标准Enzchek分析(与与底物在 室温下进行培养)。参见图20,在46.6℃的预温育温度下重新构建的活性与4℃预温育温度 下重新构建的活性。但在50.8-53.6℃下对酶进行6小时的预温育后,酶活性以最平缓的方 式增加。在更高的温度处,内切葡聚糖酶活性开始下降到未在4℃以上进行加热的酶所达到 的活性水平。这种表观活度发生下降至少在一定程度上是由于本底“类似内切葡聚糖酶”活 性的丧失,改活性可以在酵母培养物的上清液中检测到。本底活性不能耐受所述提高温度 中的热量。当总内切葡聚糖酶活性较低时(如在特定实施例中),本底活性的效果就至关重 要。从某种程度上来说,可以从图19所示数据中观察到这一现象的效果,其中,在进行分析 前,培养物在55℃下进行的预温育使阴性对照样品(pAL410)的内切葡聚糖酶“活性”表现出 下降。在图20中,50.8-53.6℃之间的温度能重新构建最大程度的重组酶活性。
将8种微小内含肽引入P54583的S237位置处。所述8种微小内含肽分别含有SEQID NO:2009-2016的序列。每个构造中插入一种内含肽。通过体内重组将微小内含肽引入S237 位置处。使每个案例中的候选重组酵母菌落发生还原,其中携带的质粒进行分离并通过DNA 测序进行测试来证实负责内含肽修饰的内切葡聚糖酶的基因是否完整,是否不存在突变点 或其它的改变。确认了产生各个微小内含肽修饰的内切葡聚糖酶的酵母菌株后,对全体进 行内切葡聚糖酶分析。经证实,携带mTth010微小内含肽的菌株具有内切葡聚糖酶活性。如 图21所示,内含肽修饰的内切葡聚糖酶显示在52.5℃附近具有最佳诱导温度。在50.8-53.6 ℃下对酶进行的预温育能使酶活性增加约75%。用Enzchek底物在室温下进行1小时的分析。 对其它被分离出来的P54583-mTth010-S237内含肽修饰蛋白(表现出更高的活性水平)指定 SEQIDNOS:1751,1752。
已示出的是,mTth010活性可以通过在接近52.5℃的温度下进行预温育而从 P54583S237MTth010内含肽修饰的内切葡聚糖酶中恢复,然后测试该预温育步骤的长度是 否对酶活性产生影响。将4个来自SCBJ(无His的pAL410P54583S237Tth139)培养物的独立菌 落各自在丰富培养基内进行培养。从各个培养物中取出等份样品后,将每个等份分割成多 个样品,并且每一个分割样品(splitsample)在52.5℃按下面进行不同时间长度的预温 育:0小时(未经加热,经在4℃下进行了预温育)、2小时、4小时、6小时、8小时或10小时。进行 预温育步骤后,将单个分割样品保存在4℃下直到进行分析。接着,在室温下通过Enzchek分 析对每个分割样品进行分析。如图22所示地,4种受测培养物中有3种在2-4小时内就达到了 它们最高的活性水平。比上述时间更长的预温育时间即不会提高酶活性,也不会降低所回 复的活性程度。
实施例11——对内含肽修饰的内切葡聚糖酶进行诱变和筛选。
采用图18所提出的策略,使用易错PCR来产生携带其中碱基对发生改变的DNA的突 变体集合(文库),所述DNA编码内含肽及内切葡聚糖酶的连续部分。得到了P54583内多个位 置(包括S56、C75、S192和S237位置)之一上的完整长度内含肽和微小内含肽的衍生物的文 库。收集来自每个文库的酵母克隆体进行初步分析。使用菌落PCR(采用来自KAPA Biosystems的KAPA2GRobustTaq,WalthamMA)来对部分编码内切葡聚糖酶的基因(每个 案例中均为含有诱变内含肽)进行扩增。接着对这些PCR产物进行DNA测序,以评估文库中突 变的频率和性质。
对突变频率进行初步评估后,将来自单个文库的克隆体涂覆在选择培养基(添加 了100mg/L的G418的YPD凝胶)上,并使他们在30℃下生长2-3天。从这些平板上挑出3760个 菌落,同时还有多个阳性[SCBJ(无His的pAL410P54583)]和阴性[SCBJ(pAL410)]对照,并将 其接种到1ml体积的添加了100mg/L的G418的YPD液体培养基(已分散到96深孔板上)。然后 使这些培养物在连续搅拌的条件下在30℃培养3天。从各个液体培养物中取出等份,将等份 分成两组重抽样品(replicatesample),并对其进行Enzchek分析。对每个培养物来说,将 重抽样品中的一份在52.5℃下进行4小时的预温育,而余下的一份被保存在室温下。在这之 后,使所有的重抽样品在室温下达到平衡,在与Enzchek底物混合之前将其分割成三重样品 (triplicatesample)。90分钟后,通过加入等体积的20%的tris碱来使内切葡聚糖酶反应 停止,并对总荧光单元进行测量。通过针对每个样品中进行加热和未经加热处理后测得的 活性差,来推断热敏酶的活性程度。然后将克隆体在两种预处理条件上表现出的活性差异 计算成诱导倍数,其中1倍表示活性没有发生变化。略去酶活性的热敏程度的增加(或降 低),将落入各范畴的克隆体的数量在图23中标出。如图23所示,文库中克隆体的多种行为 (热敏性)集中在亲本克隆者,其中,P54583内切葡聚糖酶在S56位置携带了MTth010微小内 含肽,它同时还表现处在约52.5℃进行预温育时能提高10%的活性(即1.1-诱导倍数;见图 23)。
在近4000个克隆体中对热敏性进行分级可以对候选者进行识别以用于更进一步 的分析。对来自“文库14”(Libl4,携带pAL410P54583S56Tth139衍生物的SCBJ细胞)的文库 的克隆体进行分析。进一步分析图23所示试验中表现出最大差异的克隆体,将部分数据列 于图24的表格中。所选的克隆体含有下表9所列的内含肽修饰酶突变体。图24中每个突变体 的左边条形表示的是在室温下进行处理的样品中的活性,每个突变体右边条形表示的是经 过热处理的样品中的活性。图24中的误差线反映了三重分析中的活性差。在这些分析中,野 生型P54583阳性对照和pAL410阴性对照均显示:在提高温度下进行预温育后,活性下降得 最平缓。这样一来,在40个活性增加最多的克隆体中,没有将上述对照样品示于图24中。
表9
突变 序列 AA0002.C8 SEQ ID NO:1745 110021.C10 SEQ ID NO:1746 AA0057.F3 SEQ ID NO:1747 AA0057.D5 SEQ ID NO:1748 AA0063.C5 SEQ ID NO:1749 AA0064.B7 SEQ ID NO:1750
从上面经提纯的组和菌落中收集单一克隆体(Individualclone)。新鲜培养物 (在YPDG418中)从各个克隆体产生的3种单菌落中生长出来,对这些培养物进行Enzchek分 析以测定其热敏内切葡聚糖酶活性,由此构成了对上述候选者的第二次分析。接着,将3种 单菌落中(在第二次分析中使用的)的一种菌落接种到3份独立的1mL的YPDG418上,使其在 30℃下生长,并通过Enzchek进行测试,这构成了对上述候选者的第三次分析。每种情况中, 对活性增加倍数进行技术,这就能够测定各个克隆体表现的再现性。将这一针对6种收集自 文库的克隆体的比较示于图25中。图25中,分析1指的是各个克隆体进行高通量筛选的第一 次结果。该分析中的数据对应于这样的单培养物:从其中产生了6份技巧性重复样本(3份进 行预热,3份不进行加热),并进行分析。分析2中的数据反映了3个生物学样品(来自3个独立 菌落的单一培养物),从中制得复样(一个进行预热,另一个不进行加热),在进行分析前,将 所述复样又各自分割成2份技巧性重复样本。分析3反映了来自单一菌落(从初始培养物中 提纯得到,该培养物在分析1中进行了测量)的培养物的结果。分析3中的结构是最小12次分 析(6个在室温下进行预温育,6个在52.5℃下进行预温育)的平均数,每组6个结果对应于2 个技巧性重复样本(对应于最少为3个生物学重复样本)。虽然图25所示的每个候选者在接 下来的分析中显示出>1.5的诱导倍数,但这些结果表示第一次的筛选可能稍微夸大了活性 (可以从特定基因中恢复)变化程度。
通过菌落PCR将部分的编码内含肽修饰的内切葡聚糖酶的DNA序列从多个候选者 (对文库14进行第一筛选后确认的)中分离出来。对图25所示的各个克隆体中内含肽编码区 域的序列进行的检测显示,每个序列携带了能导致微小内含肽MTth010序列内至少一个氨 基酸改变的突变,所述克隆体之一还含有能导致位于相邻N-外显肽序列中的氨基酸改变的 突变。这些突变列于下表10中。
表10
*相对于MTth010的计数
相对于成熟形式的P54583内切葡聚糖酶的编号
在表10所总结的实施例中,仅对紧邻内含肽的区域进行了测序。令人感兴趣的是, 发现从内含肽中同一个突变上还原出来两个无关的克隆体(Lib14AA0057.F3和 Lib14AA0057.D5中的R55C)。
还构造了其他文库,其中,靶定完整长度Tth内含肽内的单个氨基酸进行饱和诱变 (saturatingmutagenesis)。先前的木聚糖酶(SwissProt登录号为P77853)中的内含肽诱 变结果反映,当Tth插入P77853中的某些位置处时,内含肽内的突变(感染了的精氨酸51)能 使内含肽修饰的木聚糖酶具有较强的热敏转化表型。为了测试类似的突变是否能在内含肽 修饰的内切葡聚糖酶引起热敏性为,发明人在Tth内含肽中51位置处引入了随机突变,其 中,所述内含肽位于054583中的S56、C75、S192或S237位置处。通过与上文描述相同的高通 量Enzchek分析,对具有这些突变的内含肽修饰的内切葡聚糖酶进行表达的酵母克隆体的 文库进行筛选。将数据分类,以识别对具有最强热敏诱导性进行表达的酶的克隆体。如图26 所示,经该筛选得到的候选者在进行预处理时显示出最温和的活性诱导(1.5-2倍)。绝大多 数的最佳表现者来携带了位于P54583的S192位置或S56位置处的内含肽的克隆体。
实施例12——白蚁内切葡聚糖酶。
用内含肽对来自高山象白蚁的内切葡聚糖酶进行修饰使内含肽对内切葡聚糖酶 的活性造成损害,而切除内含肽(自发性地或对刺激(例如温度变化)作出的应答)能是内切 葡聚糖酶的活性发生重构。可以将内含肽修饰的内切葡聚糖酶用在需要对纤维素材料和/ 或其他多糖进行传统水解的应用中,内切葡聚糖酶将所述纤维素材料和/或其他多糖识别 作为底物。与其它内切葡聚糖酶相比,白蚁源性内切葡聚糖酶可以在pH耐受性、表达和/或 比活性方面具有优势。例如,可以将pH诱导的内含肽插入内切葡聚糖酶中。
鉴于白蚁独特的解剖结构、生理结构和共生菌群,它们能能自然代谢多种木素纤 维素材料。当白蚁对木素纤维素材料进行消化时,它们将颗粒物质与多种酶进行混合。这些 材料穿过白蚁肠道时经历了pH从弱酸到强碱的改变。接着这些颗粒被白蚁肠道内的共生体 摄入并进一步被消化。共生体和白蚁之间有机代谢物的交换提供了这样的方式:白蚁通过 该方式从摄入的物质中获得了间接的营养利益。
并不是白蚁体内所有能分解木素纤维素材料的消化酶都源于微生物。白蚁系统内 的一些最具活性的酶实际上是由白蚁自身进行表达和分泌,随后由共生体将其与颗粒材料 一起摄入的。在一些白蚁种(如黄胸散白蚁(Reticulitermessperatus)或达尔文澳白蚁 (Mastotermesdarwiniensis))中,内切葡聚糖酶由唾液腺分泌,在咀嚼的过程中与木质材 料混合,在此之后它们进入肠道然后由共生体摄入。其他的种属中(如高山象白蚁),这些酶 被直接分泌到中肠内。
图27显示了白蚁内切葡聚糖酶的进化史。对来自不同糖基水解酶第9家族(GH9)的 内切葡聚糖酶的催化结构域的氨基刷序列进行的比较显示,白蚁(象白蚁(Nasutitermes)、 散白蚁(Reticulitermes))源性酶、微生物源性酶和植物源性酶具有极大的相似度。如图所 示地,由原始白蚁和更高级的白蚁表达的内切葡聚糖酶(EC3.1.2.4)不仅彼此具有显著的 同源性,它们与来源于细菌和植物的配也具有显著的同源性。与GH9家族酶的许多其他成员 不同的是,白蚁内切葡聚糖酶通常不含碳水化合物结合域,而仅含有催化结构域。高山象白 蚁产生的内切葡聚糖酶NtEG可以作为功能酶在大肠杆菌中得到表达。源于家白蚁 (Coptotermesformosanus)并能在大肠杆菌中进行表达的纤维素酶在天然形式和C-末端 标记形式下具有不同的纤维素分解活性,它使酶的衍生物能够在体外进化成具有更强的性 能(如热稳定性)。通过家族改组(familyshuffling)在4种亲本白蚁纤维素酶之间的随机 交换的非保守氨基酸残基同样也能提高热稳定性。可以按照本文记载地用内含肽对上述酶 中的任意一种进行修饰。
NtEG内切葡聚糖酶显示出在极酸性条件下的结构稳定性。这反映了一个事实:如 前文所描述第,可以将白蚁源性内切葡聚糖酶暴露于较宽的肠内pH范围中。使主要来源于 高山象白蚁(NtEG)的内切葡聚糖酶结晶化,并在pH从6.5-2.5变化时,该内切葡聚糖酶中仅 在结构上发生了非常细微的改变。可以将白蚁源性内含肽修饰的内切葡聚糖酶提供在需要 暴露在强烈pH改变的条件中。
实施例13——对白蚁内切葡聚糖酶进行表达及其特征。
制得NtEG(077044,SEQIDNO:2017)优化版密码子。下文显示了能在植物中进行 表达的优化NtEG的DNA序列。该序列中包含了编码N-末端多肽(约16个氨基酸)的区域(在下 面的序列中以下划线标出),当蛋白在白蚁细胞中得到表达时,所述多肽很可能起到分泌信 号肽的作用。
密码子优化的NtEG
ATGAGGGTGTTCCTTTGCCTGCTCTCGGCGCTAGCTTTGTGCCAGGCGGCTT
ACGACTACAAGCAGGTGTTGCGGGACTCGCTACTATTCTATGAGGCCCAGAG
ATCCGGCCGGCTCCCAGCCGACCAGAAGGTCACGTGGAGGAAGGATAGCGC
GCTGAATGACCAGGGTGACCAGGGACAAGACTTGACCGGCGGCTACTTTGAC
GCTGGGGACTTCGTCAAGTTCGGGTTCCCCATGGCTTATACCGCAACCGTGC
TGGCATGGGGCCTCATAGATTTTGAGGCCGGCTACAGCAGTGCCGGGGCCTT
GGATGATGGACGGAAGGCTGTCAAATGGGCCACCGACTATTTCATAAAGGCC
CACACAAGTCAAAATGAGTTCTATGGTCAGGTCGGCCAGGGTGACGCCGATC
ACGCTTTCTGGGGAAGACCAGAGGATATGACGATGGCGCGCCCGGCGTACA
AGATAGACACCTCAAGGCCTGGCTCTGATCTGGCAGGCGAGACAGCGGCTGC
TCTTGCCGCTGCTTCAATCGTGTTCCGGAACGTCGATGGCACTTACTCAAATA
ACCTGTTAACACACGCTCGCCAGCTATTCGACTTCGCGAACAACTACCGGGG
AAAGTATAGTGACTCTATTACTGACGCAAGAAATTTCTACGCAAGCGCAGAC
TACAGAGACGAGTTGGTTTGGGCTGCTGCGTGGTTATACAGAGCGACCAACG
ACAACACCTACCTCAACACTGCTGAGTCACTGTACGATGAGTTTGGGCTACA
GAACTGGGGGGGGGGCCTGAACTGGGATAGCAAGGTGTCTGGCGTGCAGGT
GTTGTTGGCCAAGCTTACCAATAAGCAGGCCTACAAGGACACGGTGCAGTCT
TACGTCAATTACCTAATTAATAACCAGCAGAAGACTCCCAAGGGCCTCCTCTA
CATCGACATGTGGGGCACCCTTCGCCACGCTGCCAACGCCGCATTCATCATG
CTCGAAGCCGCCGAGCTGGGCTTGTCCGCCTCCTCTTATAGACAGTTCGCGC
AAACGCAAATCGACTACGCCCTGGGCGATGGTGGCCGCTCCTTTGTGTGCGG
GTTCGGGAGTAATCCTCCTACGAGACCGCACCACAGATCCTCGTCGTGCCCG
CCAGCTCCCGCTACTTGCGACTGGAATACATTCAACTCACCTGACCCAAACT
ACCACGTCCTCTCTGGGGCCCTAGTGGGCGGACCTGATCAGAATGACAACTA
CGTCGATGACCGTTCAGACTATGTTCACAACGAAGTCGCCACTGATTACAAC
GCGGGTTTCCAGTCCGCGTTAGCTGCTTTGGTGGCCCTTGGTTAC(SEQIDNO:2017)
使携带这种序列的DNA片段连接到酿酒酵母表达载体pAL410上。得到的构造 pAL410NtEG示于图28中。在图28中,P-GAP是名义组成型酵母GAP启动子;α为来自酵母α交配 因子的分泌信号肽,它被翻译成与白蚁源性内切葡聚糖酶发生融合的N-末端;NtEG-SP假定 存在的16个氨基酸的信号序列,它能驱使NtEG从白蚁细胞中进行分泌;BAA33708NtEG是白 蚁源性内切葡聚糖酶的编码序列的余下部分;CYCt是源于酵母CYC1基因的转录终止子和多 腺苷酸化信号;f1ori是产生单个标准质粒衍生物的序列;KanMX,酵母内具有G418耐药性 的基因;2uori是2微米起点,使质粒能在酵母细胞内进行复制;bla是在细菌细胞中产生氨 苄西林耐药性的基因;以及ColEI是大肠杆菌内能对质粒进行复制的区域。
两个信号肽(一个来自酵母,另一个来自NtEG)在从pAL410进行表达时很可能产生 冲突。为了测定是否能通过移除天然信号肽来增强NtEG的表达,制备这样的NtEG衍生物表 达载体:它与原始载体的区别仅在于缺少从NtEG开放阅读框架开始的48个碱基对。这48个 碱基对编码的是天然信号肽。将这种载体(pAL410NtEGm)引入酵母细胞内。
将携带pAL410、pAL410NtEG或pAL410NtEGm之一的酵母细胞划线于YPD琼脂平板上 (含100mg/L的G418),该平板上施覆了1.5%的琼脂糖和0.2%的AZCL-HE-纤维素(Megazyme InternationalIreland有限公司)覆层。如图29所示,在携带pAL410NtEGm的菌落附近极易 检测到内切葡聚糖酶活性,这说明酶具有活性,且它由生长细胞分泌出来。
接着,使携带pAL410NtEG、pAL410NtEGm或pAL410-P54583(Ace1内切葡聚糖酶,见 实施例7)质粒的酵母细胞,以及携带空pAL410作为对照的载体的菌株在丰富培养基上生 长,并通过纤维素内切酶检测底物分析(MegazymeInternationalIreland有限公司)来分 析培养物上清液的内切葡聚糖酶活性,该方法对染料从AZCL-HE-纤维素中的释放量进行测 量(590nm下的吸光值)。如图30所示地,成熟形式的白蚁内切葡聚糖酶(NtEGm)比完整长度 形式(保留了天然信号序列)的明显表现出更高的活性。NtEGm还表现出高于P54583的活性。 虽然NtEGm和P54583的活性都随着温度增加而增加,但在70℃下进行培养时,NtEGm却失去 其活性,而P54583的活性则继续增加。这些分析显示,NtEGm中的表达产生了比P54583中的 表达产生了更易于检测的内切葡聚糖酶活性。
对被表达酶的耐pH性进行初步测量时,将表达NtEGm或P54583的培养物中的上清 液进行收集。鉴于其较低的整体活性,进行分析前,使来自P54583培养物的上清液通过截留 分子量10000的Millicon滤膜(Millipore,BedfordMA)过滤进行20倍浓缩。然后在不同pH 的缓冲液中以及不同的温度下进行纤维素内切酶检测底物分析。如图31所示,NtEGm在pH等 于4.5和8.0时显示出比P54583更高的活性(通过测量释放出的染料在590nm下的吸光值)。 将培养物在40℃或58℃下进行预温育时也发生了这种现象。虽然前文也记载了在更高的pH 环境中,P54583在70℃下的活性高于NtEGm。
按下面记载对pH在酶稳定性方面的效果对pH在酶活性方面的效果进行分析。根据 上文描述从培养物上清液中制备P54583和NtEGm。然后使培养物暴露在不同pH的缓冲液中1 小时。进行该处理后,用分析缓冲液(pH4.5)通过UltracelYM-30再生纤维素滤膜 (Millipore)进行过滤来置换缓冲液。通过这一分析得到的结果说明NtEGm承受了pH值高达 10.5时的预处理,在pH2或pH3的预处理中(数据未示出)的耐受性稍差。
为了测定His标间能否加入NtEGm中,以及它是否对活性产生任何影响,制备这样 的pAL410NtEGm:其中,在紧接NtEGm编码序列的终止密码子之前引入6个组氨酸密码子。将 这种质粒pAL410NtEGmHis引入酵母细胞中。随后从携带pAL410、pAL410NtEGm或 pAL410NtEGmHis的酵母细胞培养物中收集上清液,并按前文所述对内切葡聚糖酶活性进行 分析。通过这些实验(图32),可以发现His标签的引入会损害内切葡聚糖酶活性。
实施例14——对白蚁源性内切葡聚糖酶进行内含肽修饰。
制备一系列的融合蛋白,其中内含肽从不同的位置插入NtEG。通过本文描述的方 法对内含肽插入位点进行测定,且所述位点通常与丝氨酸、苏氨酸或半胱氨酸连续。随后通 过图33所示的SOEPCR策略(也可以参见实施例6b)将重组NtEG蛋白的编码序列进行组装。 如图33所示,将引物设计成退火到:
(A)pAL410NtEGm中α信号肽的编码序列;
(B)NtEGm编码序列内与插入位点相邻的区域(本例中为丝氨酸84);
(C)Tth内含肽编码序列的5’端;
(D)Tth内含肽编码序列的3’端;
(E)NtEGm编码序列内与插入位点(本例中,该位点不与引物C覆盖的区域发生重 叠)相邻的区域;和
(F)来源于pAL410NtEGm的CYC终止序列中的区域。
PCR1使用引物A和引物B组装的短产物含有针对部分α信号和内切葡聚糖酶(NtEG- N)的N-末端部分的编码序列。PCR产物1的3’末端上含有与Tth内含肽5’末端同源的短区段。 PCR2使用了引物C和引物D来对Tth内含肽编码序列进行扩增。PCR3使用了引物E和引物E来 对内切葡聚糖酶的C-末端部分的编码序列(NtEG-C)进行扩增,包括“C+1”氨基酸(本例中为 丝氨酸84)和与Tth内含肽5’末端同源的短区段,以及一部分的pAL410中的CYC1终止子 (CYC1t)。然后将PCR产物1、PCR产物2和PCR产物3在一个PCR反应中进行组合;鉴于其与Tth 内含肽端部的同源性,PCR产物1和PCR产物3能退火到PCR产物2上。用最外层引物(引物A和 引物F)进行的DNA合成或扩增能生成大量的完整长度产品(如最下方图所示)。
对适合于各个内含肽插入位置的PCR产物进行制备,以得到所有期望的内含肽修 饰P54583衍生物。但是本实验步骤中的一些组成被模块化了。例如,可以用引物C和引物D来 制备PCR产物2,然后可以用PCR产物2对所有计划的重组物进行组装。类似地,无论插入物位 置在哪里,都可以用引物A和引物F分别制备PCR产物1和PCR产物3。这样一来,只有引物B和 引物E能唯一地获得特定内含肽插入物。下表11列举了用来组装各个内含肽修饰的NtEG内 切葡聚糖酶的寡核苷酸引物序列(从5’到3’方向)。虽然引物B和引物E对各个产物来说都是 唯一的,但它们均含有与Tth内含肽的末端同源的区域。下表11中,将这一恒定区域在每个 引物中用下划线标记出来。
表11所列插入位点指的是确定位置和外显肽C+1位置处的氨基酸残基的相对位 置。编号是与预测的NtEGm多肽氨基酸序列相对应,其中2-5对应于天然NtEG序列(O77044) (SEQIDNO:112)中的氨基酸17-20(丙氨酸-酪氨酸-天冬氨酸-酪氨酸,Ala-tYr-Asp- Tyr)。
用上述引物针进行SOEPCR反应。使这些重组PCR产物与pCRBluntIITOPO (Invitrogen,CarlsbadCA)连接,测序以证实其组成,随后转移到pAL410酵母表达载体上。 从携带pAL410、pAL410NtEGm或其中Tth内含肽插入丝氨酸84、苏氨酸303、丝氨酸325或苏氨 酸333的pAL410NtEGm的酵母细胞的培养物中收集上清液。随后在纤维素内切酶检测底物分 析中对上清液进行检测,通过在590nm下吸光值的增加(因为染料从AZCL-HE-纤维素底物中 释放出来了)来监测内切葡聚糖酶活性,以作为实践的函数。图34显示,将Tth内含肽插入任 意的4个测试位置中均能显著地降低酶的活性。
实施例15——P77853,内含肽修饰的木聚糖酶
内含肽的插入
从Inbase数据库中选择内含肽氨基酸序列(公开于2007/7)。该数据库含有多个连 在一起的反式间接内含肽,由此将该列表减少至408个内含肽。除去以下的内含肽:Mth RIR1内含肽、Tth-HB8DnaE-1内含肽、Tth-HB27DnaE-1内含肽、TagPol-3(Tsp-TYPol-3)内 含肽、Tac-ATCC25905VMA内含肽、Psp-GBDPol内含肽。将以下来自致病物种的内含肽也排 除在外:Mtu(5个内含肽)、Mch(1)、Mma(1)、Mbo(5)、Mfa(1)、Mfl(2)、Mga(3)、Mgo(1)、Min (1)、Mkas(1)、Mle(4)、Msh(1)、Msm(2)、Msp(4)、Mthe(1)、Mtu(5)、Mvan(2)、Mxe(1)。余下的 361个序列中,除去与其他剩余序列具有>62%同一性的序列。例如,一组A、B、C和D序列中全 都具有>62%的同一性,就除去其中的三个序列。对于成对的相似序列来说,根据具有较低嗜 热性来选择除去的序列,其中,嗜热性从最高级到最低级的顺序为超嗜热>嗜热>嗜常温=未 知(UNK)。使用原核生物深圳温度数据库(ProkaryoticGrowthTemperatureDatabase, PGTdb)和其它来源的文献,根据序列宿主生物的最佳生长条件来对序列进行分类。超嗜热 指的是生物的最佳生长温度高于80℃,嗜热为45-80℃,嗜常温为抵御45℃。UNK分类是针对 那些无法分类的生物。进行这一过程后,余下157个用于测试的序列,其中70个来自超嗜热 生物,19个来自嗜热微生物,64个来自嗜常温生物和4个来自未知组的生物。
对内含肽修饰的P77853进行构造
所选择的全部内含肽的DNA序列是GenScript针对玉米(玉蜀黍)进行优化的密码 子。接着对内含肽的以下限制位点进行检测,以确保它们不存在:GAATTC,EcoRI;CTCGAG, XhoI和CATATG,Ndel。数个序列具有突变了的Ndel位点,将他们翻译到相同的氨基酸对(产 生通过原始Ndel位点形成的密码子)上。SEQIDNO:2059-2215列举了进行密码子优化并除 去EcoRI、XhoI或Ndel位点(如果存在)后的内含肽序列。一个序列含有突变为CTGGAG之前的 Xhol位点。SEQIDNO:2059-2215中的每一个编码的氨基酸序列分别列于SEQIDNO:2216- 2372中。然后,将全部内含肽插入对密码子进行了优化的含有P77853酶(SEQIDNO:104)的 质粒中。插入位点在T138密码子或S158密码子之前,下面的序列显示了对密码子进行了优 化的P77853编码核酸、质粒核酸序列和内含肽插入位点。此外,SEQIDNO:2687-3000列举 了本实施例采用的每一个内含肽修饰的P77853核酸编码序列。下面描述的实验列举了AS-1 到AS-157的样品和AT-1到AT-157的样品。SEQIDNO:2373-2529分别对应于AS-1到AS-157 的蛋白样品的氨基酸序列。SEQIDNO:2530-2686分别对应于AT-1到AT-157的蛋白样品的 氨基酸序列。SEQIDNO:2687-2843分别对应于编码AS-1到AS-157蛋白样品的核酸序列。 SEQIDNO:2844-3000分别对应于编码AT-1到AT-157蛋白样品的核酸序列。SEQIDNO: 3001-3157分别对应于pBluescript中编码AS-1到AS-157蛋白样品的核酸序列。SEQIDNO: 3158-3314分别对应于pBluescript中编码AT-1到AT-157蛋白样品的核酸序列。下面两段序 列含有插入pBlueScript质粒(前一段)的P77853(后面一段)以及内含肽插入位点(在两个 尖角括号(“>>”)内)。参见插入了内含肽编码核酸序列的SEQIDNO:2059-2215以及被编码 的各个内含肽氨基酸序列SEQIDNO:2216-2372。
>供P77853-S158插入的质粒
GCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATA
CATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATA
ATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTC
CCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTG
AAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAAC
TGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTT
TCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGT
ATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATG
ACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGAC
AGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCC
AACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGC
ACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAA
TGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCA
ACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGC
AACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCG
CTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAG
CGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCC
CGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAA
ATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTC
AGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATT
TAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTT
AACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGG
ATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAA
AACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCT
TTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTT
CTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTA
CATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAA
GTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAG
CGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACG
ACCTACACCGAACTGAGATACCTACAGCGTGAGCTAATGAGAAAGCGCCACGC
TTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAA
CAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATA
GTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTC
GTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACG
GTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCC
CTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCG
CCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGA
GCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGC
AGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCA
ATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCT
TCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGA
AACAGCATatgcaaacaagcattactctgacatccaacgcatccggtacgtttgacggttactattacg aactct
ggaaggatactggcaatacaacaatgacggtctacactcaaggtcgcttttcctgccagtggtcga acatcaataac
gcgttgtttaggaccgggaagaaatacaaccagaattggcagtctcttggcacaatccggatcacgta ctctgcgact
tacaacccaaacgggaactcctacttgtgtatctatggctggtctaccaacccattggtcgagttctac atcgttgagt
cctgggggaactggagaccgcctggtgccacgtccctgggccaagtgacaatcgatggcgggacctac gacatctat
aggacgacacgcgtcaaccagcct《在此插入内含肽S158;》tccattgtggggacagccacgtt
cgatcagtactggagcgtgcgcacctctaagcggacttcaggaacagtgaccgtgaccgatcacttcc gcgcctgggc
gaaccggggcctgaacctcggcacaatagaccaaattacattgtgcgtggagggttaccaaagctctgg atcagcca
acatcacccagaacaccttctctcagggctcttcttccggcagttcgggtggctcatccggctccacaa cgactactcgc
atcgagtgtgagaacatgtccttgtccggaccctacgttagcaggatcaccaatccctttaatggtatt gcgctgtacg
ccaacggagacacagcccgcgctaccgttaacttccccgcaagtcgcaactacaatttccgcctgcggg gttgcggca
acaacaataatcttgcccgtgtggacctgaggatcgacggacggaccgtcgggaccttttattaccagg gcacatacc
cctgggaggccccaattgacaatgtttatgtcagtgcggggagtcatacagtcgaaatcactgttactg cggataac
ggcacatgggacgtgtatgccgactacctggtgatacagtgaCTCGAGGGGGGGCCCGGTACCCA
ATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAACGT
CGTGACTGGGAAAACCCTGGCGTTACCCAACTTTATCGCCTTGCAGCACATC
CCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTC
CCAACAGTTGCGCAGCCTGAATGGCGAATGGAAATTGTAAGCGTTAATATTT
TGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAATAG
GCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAATAGACCGAGATAGGGT
TGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTC
CAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGA
ACCATCACCCTAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAAT
CGGAACCCTAAAGGGAGCCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCG
AACGTGGCGAGAAAGGAAGGGAAGAAAGCGAAAGGAGCGGGCGCTAGGGC
GCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCACCACACCCGCCGCGCT
TAATGCGCCGCTACAGGGCGCGTCAGGTG(SEQIDNOS:3001-3157)
>供P77853-T134插入的质粒
GCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATA
CATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATA
ATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTC
CCTTTTTTGCGGCATTTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTG
AAAGTAAAAGATGCTGAAGATCACTTGGGTGCACGAGTGGGTTACATCGAAC
TGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTT
TCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGT
ATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATG
ACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGAC
AGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCC
AACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGC
ACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAA
TGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCA
ACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGC
AACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCG
CTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAG
CGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCC
CGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAA
ATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTC
AGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATT
TAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTT
AACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGG
ATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAA
AACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCT
TTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTT
CTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTA
CATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAA
GTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAG
CGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACG
ACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGC
TTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAA
CAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATA
GTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTC
GTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACG
GTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCC
CTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCG
CCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGA
GCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGC
AGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCA
ATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCT
TCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGA
AACAGCATatgcaaacaagcattactctgacatccaacgcatccggtacgtttgacggttactattacgaactct
ggaaggatactggcaatacaacaatgacggtctacactcaaggtcgcttttcctgccagtggtcgaaca tcaataac
gcgttgtttaggaccgggaagaaatacaaccagaattggcagtctcttggcacaatccggatcacgtac tctgcgact
tacaacccaaacgggaactcctacttgtgtatctatggctggtctaccaacccattggtcgagttctac atcgttgagt
cctgggggaactggagaccgcctggtgcc《在此插入内含肽T134》acgtccctgggccaagtg
acaatcgatggcgggacctacgacatctataggacgacacgcgtcaaccagccttccattgtggggaca gccacgtt
cgatcagtactggagcgtgcgcacctctaagcggacttcaggaacagtgaccgtgaccgatcacttccg cgcctgggc
gaaccggggcctgaacctcggcacaatagaccaaattacattgtgcgtggagggttaaccaaagctctg gatcagcca
acatcacccagaacaccttctctcagggctcttcttccggcagttcgggtggctcatccggctccacaa cgactactcgc
atcgagtgtgagaacatgtccttgtccggaccctacgttagcaggatcaccaatccctttaatggtatt gcgctgtacg
ccaacggagacacagcccgcgctaccgttaacttccccgcaagtcgcaactacaatttccgcctgcggg gttgcggca
acaacaataatcttgcccgtgtggacctgaggatcgacggacggaccgtcgggaccttttattaccagg gcacatacc
cctgggaggccccaattgacaatgtttatgtcagtgcggggagtcatacagtcgaaatcactgttactg cggataac
ggcacatgggacgtgtatgccgactacctggtgatacagtgaCTCGAGGGGGGGCCCGGTACCCA
ATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAACGT
CGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATC
CCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTC
CCAACAGTTGCGCAGCCTGAATGGCGAATGGAAATTGTAAGCGTTAATATTT
TGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAATAG
GCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAATAGACCGAGATAGGGT
TGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTC
CAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGA
ACCATCACCCTAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAAT
CGGAACCCTAAAGGGAGCCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCG
AACGTGGCGAGAAAGGAAGGGAAGAAAGCGAAAGGAGCGGGCGCTAGGGC
GCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCACCACACCCGCCGCGCT
TAATGCGCCGCTACAGGGCGCGTCAGGTG(SEQIDNOS:3158-3314)
转化分析
将pBlueScript质粒编码内含肽修饰的P77853转到了前10个大肠杆菌宿主 (Invitrogen)中,并析出在LB琼脂(添加有100gm/l的氨苄西林)上。在37℃下培养整夜后, 从每个构造中选出8个菌落(生物学重复样本)并置于96孔板中的1ml的自诱导培养基(AIM, Novagen)(添加了100mg/l的羧苄青霉素)。使培养物在Multitron振荡培养箱(InforsHT) 中以900rpm在37℃下生长10小时,然后在30℃下生长6-8小时。将细胞进行采集,在100μl的 Polybuffer(在不同的pH中:4.5、5.5、6.5或7.5)中30℃下进行1个小时的裂解,所述 Polybuffer含有10%的10×FastBreak(Promega)和Benzonase(0.1μl/ml的25KUN, Novagen)。用Polybuffer(与裂解缓冲液pH相同)将裂解液稀释至定容1ml,将其分割以进行 热处理。热处理温度为37℃、50℃、55℃或60℃下进行2小时、4小时或6小时。将样品放在冰 上。在37℃下,对30μl裂解液和40μlPolybuffer(与裂解缓冲液pH相同)的反应混合物中的 木聚糖酶活性进行30分钟、45分钟、65分钟或100分钟的分析,其中固态底物AZCL-木聚糖桦 木(Megazyme):乳糖=25%:75%,用VP724B固体分散剂(V&PScientific)分散在384孔板上。 在Paradigm酶标仪(BeckmanCoulter)上获得590nm下的吸光值。
下图36A-D和图37A-D显示了针对P77853的T134和S158插入位点的pH6.5和pH7.5 的酶活性分析结果。图36A-D显示了pH6.5的结果,图37A-D显示了pH7.5的结果。将低温和高 温下的活性与野生型p77853相比(图36A和C)。还描绘了高温活性对诱导倍数(高温下的活 性/低温下的活性)(图36B和D)。内含肽根据其宿主的嗜热性而发生分解。纵向的短划线代 表10%的低温野生型活性。横向短划线代表40%的高温野生型活性。对R134和S158两个插入 位点来说,有多个内含肽能产生大诱导倍数。但仅S158插入位点所示候选者接近或达到基 度值(低温获悉小于或等于天然(无内含肽修饰的)酶活性的10%,高温活性大于天然(无内 含肽修饰的)酶活性的40%)。
用于各个pH和插入位点的前几位内含肽修饰的木聚糖酶候选者(根据总高温活 性)示于图38A-图38D中。该组内含肽插入到P77853的S158位置(图38A和C)和T134位置(图 38B和C)。将前20个最高活性候选者经过pH6.5(图38A和B)和pH7.5(图38C和D)下进行的 高温热处理(每个样品的右侧条形表示)和低温热处理(每个样品的左侧条形表示)后的活 性与野生型和空载体进行比较绘制成图。活性轴上2到4之间的短划线代表40%的高温野生 型活性。活性轴2下方的短划线代表10%的低温野生型活性。如图38A-D所示,S158插入位点 和T134插入位点来说,经过高温热处理后,最优(topranking)采样数的活性接近或高于 40%的野生型活性。但是,在S158位点观察到比T134位点更多的具有更大诱导倍数的最优候 选者。此外,少数候选者达到或非常接近S158位点的基度组(剪接前活性<10%的野生型活 性,暴露在间接条件下之后,活性>40%的野生型活性)。,包括pH6.5的AS-146和AS-79和pH 7.5的AS-79、AS-2和AS-83。T134的所有最优候选者在进行低温处理后活性变得更高。
通过在转化分析中的表现,将针对每个插入位点和pH的全部候选者进行分组。根 据其暴露在高温和暴露在低温下的活性来建组。在活性分类上,将组分为非许可型((NP=< 10%的野生型(WT)活性),弱活性(W=10-30%的野生型活性)和强活性(>30%的野生型活性)。 在转化方面,各组分为许可型(P=<2X倍率,高温活性:低温活性),转化型((S=2-3X倍率,高 温活性:低温活性)以及强转化型(SS=>3X倍率,高温活性:低温活性)。针对各个pH的分布及 性能列于下表12中,魅族中代表内含肽的活性数据列于图39A-D中。图39A和C显示了针对 S158P77853内含肽插入物的数据。图39B和D显示了针对T134P77853内含肽插入物的DNA。图 39A和B对应的是在pH为6.5时进行的热处理。图39C和D对应的是在pH为7.5时进行的热处 理。活性轴上2到4之间的短划线代表40%的高温野生型活性。活性轴2下方的短划线代表10% 的低温野生型活性。如图39A-D所示,各个情况下都存在少数具有弱活性或强活性的转化 型。但T134位点比S158位点具有更多的许可型内含肽。这与之前对这些位点的Tth插入物的 发现相似的原因在于,插入T134的内含肽通常不会足够有力地阻断活性,而保留了较高的 本底活性。
表12
参见图40,恢复通过先前筛选获得的最优候选者(AS-146、AS-2、AS-79、AS-83)作 为热诱导酶活性,并与非许可型候选者(AS-8)、野生型酶P77853以及空载体Pbs进行比较。 活性轴上1上方的短划线代表40%的高温野生型活性。活性轴上0.5下方的短划线代表10%的 低温野生型活性。本复测中,AS-79和AS-83达到了>=40%高温活性基度(分别为58%和40%)和 <=10%低温活性(分别为6%和10%)。虽然AS-146接近基度(略低于40%高温活性(34%)),但仍 低于低温活性基度(7%)。高温下诱导活性和低温下不发生诱导的活性可能是这些酶期望的 特性。
蛋白质印迹。
参见图41,通过蛋白质印迹来分析在P77853上的S158插入位点(AS-2、AS-79、AS- 83和AS-146)和T134(AT-2、AT-83、AT-149、AT-154)插入位点具有最优表现候选者的热诱导 剪接。培养条件和裂解液与转化分析中使用的相同,不同的是Polybuffer为pH6.5,且热处 理温度为在37℃和60℃下进行4小时。用兔抗-P77853第一抗体通过标准操作来产生蛋白质 印迹。
图41中,pBS为空载体对照,P77为阳性对照(P77853)。每个样品的左侧和右侧条形 分别代表来自相同裂解液的低温等分(37℃/4小时)和加热等分(60℃/4小时)。箭头代表内 含肽修饰的P77853前体,NC标记了成熟蛋白的位点。AS-83、AS-146和AS-79以及更低程度的 AT-154、A-149和AT83显示出适中的热诱导成熟蛋白(NC)积累。这与热诱导剪接相符。但是, 单独的热诱导剪接程度不能定量地反映出AS-79、AS-83和AS-146的热诱导酶活性(将图41 与图40进行比较)。
最优候选者的普遍特点
宿主生物的耐热性
观察到,高活性候选者中较大一部分和转化候选者中较大一部分中含有的内含肽 来自超嗜热和嗜热生物多于来自嗜常温/UNK。这可以在下面的表格中观察到,该表格将表1 中的数据分解为针对来自超嗜热和嗜热生物的内含肽(表13)以及针对来自嗜常温和UNK生 物的内含肽(表14)进行的内含肽转化分析中的分布和表现。所示分布为使数据标准化成耐 热组中的总候选者部分。将来自超嗜热/嗜热生物的内含肽(每4个样品的右侧条形)与来自 嗜常温/UNK生物的内含肽(每4个样品的左侧条形)相比,候选者部分在高温下具有高活性 (图42A)和高于2X的转化(图42B)。通过卡方分析,可以看出这两组在T134的活性和转化具 有显著差异(p值<0.05),而仅S158插入位点的转化比较显著。对原始活性数据进行 Wilcoxon秩和检验来代替在显示出显著差异性(p值<0.05)的分组数据(包括两个位点、 pH6.5和pH7.5热处理)。尽管通过嗜热和超嗜热策略确认的高活性候选者的数量越多,最大 数量的构造仍然出现在针对全部内含肽测试的非许可型、弱许可型以及强许可型中。
表13
表14
内含肽大小或核酸内切酶区域的存在
参见图43A和图43B,在图43A和图43B中测试了不同的内含肽长度与活性和转化的 关系。图43A和图43B显示,活性和剪接基于内含肽长度不同而存在差别。将高温下具有高活 性(图43A)和高于2X转化(图43B)的候选者分数与长度<240个氨基酸的内含肽(每四个样品 标签的左侧条形)到长度>240个氨基酸的内含肽(每四个样品标签的右侧条形)进行比较。 长度>240个氨基酸的较长的内含肽中普遍含有核酸内切酶域,而较短的内含肽中则没有核 酸内切酶域。下表15和16显示了针对内含肽长度>240个氨基酸的内含肽转化分析中的表现 分布(表15),以及针对内含肽长度<240个氨基酸的内含肽转化分析中的表现分布(表16)。 测量这两组数据采样之间是否在显著差异。通过将组分成较长内含肽和较短内含肽,可以 发现较短长度内含肽的在两个位点上的高温活性提高了,而在T134和T158位点之间的转化 存在差异。对未分组的原始活性数据进行Wilcoxon秩和检验,只显示T134位点内的较短内 含肽的活性增加,而T134位点内的较长内含肽的转化提高具有显著性(p值<0.05)。这一事 实可能与T134位点与P77853活性位点的接近程度有关。由于离S158位点较远,较短内含肽 可能不够长以阻断活性位点,因此在剪接前具有较高活性。相反,较大内含肽由于占有更多 空间而可以更好地阻断活性位点,这就产生更高的转化。S158数据缺乏显著性的原因可能 是因为它太接近活性位点,小内含肽就足够阻断其活性,因此较大内含肽也没有为此作出 更多的贡献。
表15
表16
序列相似性
大多数内含肽具有数个保守域(也被称为“区”),由字母A、B、C、D、E、F、G和H表示。 这些区中,C、D、E和H通常在大多数内含肽的核酸内切酶于内发现。最优采样和A区、B区、F区 和G区的序列未表现出明显团聚成相对于其余部分序列的小组。这说明,在所有的最优候选 者中没有有力的单一序列特点,将其与余下部分序列区分开来。但图44A和图44D中显示, S158插入位点上的产生最优采样(按照>40%野生型活性或>30%野生型活性,且>2x转化进行 划分)的内含肽在统计学比不产生最优采样的内含肽更有可能具有能产生最优采样的类似 序列(Blast对比的E值<1e-20)。图44A-图44D显示了最优采样之间的序列相似度。图44A和 图44C显示了针对S158P77853内含肽插入物的,图44B合和44D显示了针对T134内含肽插入 物的。图44A和图44B显示了在pH6.5下进行热处理。图44C和图44D显示了在pH7.5下进行热 处理。“无采样”代表余的下序列不再顶级采样组中。图44A-图44D显示了同时是最优采样 (每个系列左侧条纹的“类似最优采样”)或无采样(每个系列右侧条纹衫的“类似无采样”) 的类似序列(E值<le-20)分数。通过卡方分析使这些结果显示具有统计学上的显著性。 pH6.5和pH7.5的合成p值小于0.05。这说明,与顶部采样相似的序列比整套序列更可能产生 良好的候选者(至少在S158位点上如此)。结果,可以有效地至少将接近本文实施方式中顶 部采样的序列包含在其中。顶部采样样品包括具有以下序列之一的内含肽修饰蛋白:SEQ IDNO:2374、2423、2424、2431、2451、2455、2461、2466、2467、2471、2479、2483、2493、2507、 2510、2511、2518、2531、2540、2541、2543、2545、2548、2569、2571、2574、2575、2581、2582、 2584、2585、2586、2587、2588、2590、2591、2594、2602、2608、2610、2612、2613、2617、2618、 2619、2620、2624、2626、2630、2636、2637、2639、2643、2645、2652、2656、2657、2661、2664、 2666、2667、2668、2678、2680、2682和2683。
本实施例中针对内含肽修饰酶的活性分析原始数据列于下表17中。下表17所列的 AS-2到AS-147的样品和AT-1到AT-157的样品中的各个内含肽修饰蛋白序列分别提供在 NOS:2374-2519和2530-2686中。
表17
实施例16——实施例15中内含肽修饰蛋白的突变体
使来自实施例15的AS-146样品发生诱变。下面提供的AS-146的内含肽修饰蛋白的 氨基酸序列(SEQIDNO:2518)后连接了8个AS-146突变体(SEQIDNO:3315-3322)。用下划 线将SEQIDNO:2518和3315-3322中的内含肽氨基酸序列标记出来。SEQIDNO:3314-3322 的内含肽修饰蛋白中的有关SEQIDNO:2518内含肽修饰蛋白的突变在下面以较大的粗体 字表示。在氨基酸序列之后,示出了核酸编码的AS-146(SEQIDNO:2832)内含肽修饰蛋白 的,接着是SEQIDNO:3323-3330的核酸序列,它分别对SEQIDNO:3315-3322的内含肽修饰 蛋白突变体进行编码。用下划线将下面示出的SEQIDNO:2832and3323-3330中的内含肽 编码序列标记出来。SEQIDNO:3323-3330的内含肽修饰蛋白中的突变在下面以较大的粗 体字表示。由于对这些内含肽进行筛选时不知道它们是否能产生效果,因此所有这些结构 都是不能事先预料的。大部分没有事先经过实验室方法来证实其作为内含肽的功能。
综上,应该理解本发明不限于所公开的具体实施方式,而意在囊括说所有未背离 本发明实质和随附权利要求书、说明书和/或附图所限定的范围内的改进。