基于蛋白环境描述小分子片段属性的指纹设计方法.pdf

上传人:万林****人 文档编号:10590533 上传时间:2021-06-25 格式:PDF 页数:15 大小:1,006.65KB
收藏 版权申诉 举报 下载
基于蛋白环境描述小分子片段属性的指纹设计方法.pdf_第1页
第1页 / 共15页
基于蛋白环境描述小分子片段属性的指纹设计方法.pdf_第2页
第2页 / 共15页
基于蛋白环境描述小分子片段属性的指纹设计方法.pdf_第3页
第3页 / 共15页
文档描述:

《基于蛋白环境描述小分子片段属性的指纹设计方法.pdf》由会员分享,可在线阅读,更多相关《基于蛋白环境描述小分子片段属性的指纹设计方法.pdf(15页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010150513.6 (22)申请日 2020.03.06 (71)申请人 华东师范大学 地址 200241 上海市闵行区东川路500号 (72)发明人 季长鸽单金文张增辉 (74)专利代理机构 上海蓝迪专利商标事务所 (普通合伙) 31215 代理人 徐筱梅张翔 (51)Int.Cl. G16C 20/50(2019.01) (54)发明名称 一种基于蛋白环境描述小分子片段属性的 指纹设计方法 (57)摘要 本发明公开了一种基于蛋白环境描述小分 子片段属性的指纹设计方法。

2、, 其特点是该方法通 过识别蛋白的口袋表层氨基酸原子, 计算蛋白口 袋原子和对接后的小分子的相互作用关系, 及其 对应的蛋白原子和小分子原子, 设计两种不同描 述小分子片段属性的指纹, 一种是分别定义蛋白 属性指纹和小分子属性指纹一一对应, 通过寻找 相似蛋白属性指纹找到相似的小分子属性指纹, 另一种是根据蛋白环境设计描述整个分子的指 纹, 通过计算两组指纹的相似性判断两个小分子 片段的相似性。 本发明与现有技术相比具有快速 生成两种指纹, 将其应用于实际药物分子的设计 和修改过程中, 能够快速找到多个相似片段, 生 成多个新分子, 有效的帮助药物化学家快速进行 药物分子设计与修改。 权利要求。

3、书2页 说明书7页 附图5页 CN 111326218 A 2020.06.23 CN 111326218 A 1.一种基于蛋白环境描述小分子片段属性的指纹设计方法, 其特征在于采用识别蛋白 的口袋表层氨基酸原子, 计算蛋白口袋原子和对接后的小分子的相互作用关系所对应的蛋 白原子和小分子原子的方法, 设计两种不同描述小分子片段属性的指纹, 其具体计算包括 以下步骤: 步骤1: 从输入的蛋白三维结构中找出蛋白表面原子, 根据对接后的小分子的三维结构 找出蛋白口袋表层氨基酸原子集合A; 步骤2: 计算蛋白口袋表层氨基酸原子集合A和对接后的小分子的相互作用, 将蛋白和 小分子的相互作用属性原子记录为。

4、集合B; 步骤3: 将小分子上所有的氢原子作为连接点, 区分出一个连接点和多个连接点; 步骤4: 根据不同的使用目的, 按一个连接点和多个连接点的情况, 分别设计基于数据 库搜索目的和基于相似性计算搜索目的的两类不同指纹, 所述设计两类不同指纹是根据连 接点b和氢原子t, 及其一一对应的相互作用关系, 并定义蛋白上能够产生相互作用的原子 为pi, 小分子上对应的和蛋白产生相互作用的原子为li, 其两类不同指纹的具体计算如下: 1)一个连接点 第一类指纹计算包括: 确认pi原子和li原子属性, 即属于氢键受体还是氢键给体, 计算 pi原子和b原子的距离, 以及pi与b和t三个原子点所构成的三角形。

5、中以b原子为顶点的角 度; 计算li原子和b原子的距离, 以及li与b和t三个原子点所构成的三角形中以b原子为顶 点的角度; 找出距离b原子最远的重原子, 并标记该距离为LD; 第二类指纹计算包括: 将集合B中所有的小分子的原子标记为list, 并分别计算list中 所有的原子和b原子的距离, 以及list中所有原子和list中其他原子的距离, 并将距离重新 划分归类为一个二十二维度的指纹; 2)多个连接点 多个连接点可以两个连接点为基础定义指纹, 由于两个连接点的两类指纹设计有一个 共同之处, 定义两个连接点之间的三维空间位置关系, 计算两个连接点重原子b1和b2的欧 式距离, 以及两端连接。

6、点重原子和氢原子的角度, 其分别为t1、 b1、 b2的角度和t2、 b2、 b的角 度; 计算两个连接点重原子、 两个氢原子的二面角, 即t1、 b1、 b2和t2的二面角; 3)两类指纹的集中化处理 将所有连接点的距离放大五倍, 所有角度缩小20倍进行两类指纹的集中化处理, 所述 距离按下述(1)式计算: 所述角度按下述(2)式计算: angle(AB*BC)/(|AB|*|BC|) (2) 其中: AB为连接原子和属性原子的向量; BC为连接原子和氢原子的向量。 2.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法, 其特征在 于所述步骤1中找出蛋白口袋表层氨基酸原子集合A。

7、的方法为: 利用naccess软件计算蛋白 三维结构中所有蛋白重原子的相对暴露表面积, 并定义距离对接后小分子距离之内的 重原子为蛋白口袋表层氨基酸原子集合A。 3.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法, 其特征在 权利要求书 1/2 页 2 CN 111326218 A 2 于所述步骤2中, 计算蛋白口袋表层氨基酸原子集合A和对接后的小分子的相互作用, 对于 集合A中的原子ai, 计算原子ai与小分子原子的相互作用关系; 所述原子ai为集合A中第i个 原子; 所述小分子原子为对接后小分子结构中的所有重原子; 所述原子ai与小分子原子的 相互作用关系主要是氢键相互作用。

8、, 其原子ai为氢键给体, 小分子原子为氢键受体或原子 ai为氢键受体, 小分子原子为氢键给体; 所述氢键相互作用形成的具体定义为: 要求两原子 分别为氢键供体和氢键受体, 且两原子间的距离小于供体重原子、 供体氢原子、 受体 重原子三者之间的夹角大于120度。 4.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法, 其特征在 于所述步骤3中的一个连接点是指小分子上所有的氢原子所连接的重原子可以认为是连接 点原子, 记录为b原子, 同时氢原子可以定义为t原子。 5.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法, 其特征在 于所述步骤3中的所述多个连接点是以两个连。

9、接点为基础的, 具体是指一个连接点的两两 组合, 任意两个不相同的氢原子分别定义为t1, t2, 其对应的两个重原子分别定义为b1, b2。 6.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法, 其特征在 于所述步骤4中的重新划分归类为一个二十二维度的指纹是将距离大于1, 小于等于6, 每隔 0.5为一个维度; 距离大于6, 小于等于10.2, 每隔0.6为一个维度; 距离大于10.2, 小于等于 15.2, 每隔1.0为一个维度。 7.据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法, 其特征在于 所述步骤4中的两个连接点的两类指纹设计, 其第一类指纹当有一个属性。

10、原子时, 分别将属 性原子与b1和b2原子如同一个连接点的指纹计算, 即计算两条指纹并记录两次; 第二类指 纹从小分子片段的相似性出发, 除两个连接点的三维空间位置关系外, 还包括: 分别从b1和 b2原子计算如同一个连接点的第二类指纹计算, 然后合并成一条指纹。 权利要求书 2/2 页 3 CN 111326218 A 3 一种基于蛋白环境描述小分子片段属性的指纹设计方法 技术领域 0001 本发明涉及计算机辅助药物设计技术领域, 具体地说是一种基于蛋白环境描述小 分子片段属性的指纹设计方法。 背景技术 0002 在药物设计的整个过程中, 对于小分子片段修改是主要的工作之一, 其准确有效 的。

11、修改有利于降低药物开发的成本和减少时间周期。 一般情况下, 药物化学研究人员在进 行药物小分子设计和修改的时候, 总是要依靠对小分子结构的观察并结合个人经验对于小 分子的一部分官能团进行修饰或者改变。 或依靠已有的计算软件, 如薛定谔或者LeadIT等 提供界面的软件, 可以通过手动的方式结合个人经验进行修改。 这两类方式都要求过于依 赖研究人员的经验, 导致效率低下。 0003 现有技术的药物小分子设计和修改过于依赖研究人员的经验, 导致效率低下, 大 大影响了药物化学研究人员更具有目的性的并且更为高效的进行药物分子设计与修饰。 发明内容 0004 本发明的目的是针对现有技术的不足而设计的一。

12、种基于蛋白环境描述小分子片 段属性的指纹设计方法, 采用识别蛋白的口袋表层氨基酸原子, 计算蛋白口袋原子和对接 后的小分子的相互作用关系所对应的蛋白原子和小分子原子, 设计指纹描述小分子的方 法, 并定义了两种不同的指纹, 可根据不同的使用场景, 一种是分别定义蛋白属性指纹和小 分子属性指纹一一对应, 可以通过寻找相似蛋白属性指纹找到相似的小分子属性指纹, 另 一种是根据蛋白环境设计描述整个分子的指纹, 通过计算两组指纹的相似性判断两个小分 子片段的相似性, 可以快速的生成两种指纹, 将这两类指纹应用于实际药物分子的设计和 修改过程中, 能够快速找到多个相似片段, 生成多个新分子, 有效的帮助。

13、药物化学家快速的 进行药物分子设计与修改。 0005 本发明的目的是这样实现的: 一种基于蛋白环境描述小分子片段属性的指纹设计 方法, 其特点是采用识别蛋白的口袋表层氨基酸原子, 计算蛋白口袋原子和对接后的小分 子的相互作用关系所对应的蛋白原子和小分子原子的方法, 设计两种不同描述小分子片段 属性的指纹, 其具体计算包括以下步骤: 0006 步骤1: 从输入的蛋白三维结构中找出蛋白表面原子, 根据对接后的蛋白和小分子 的三维结构, 利用naccess软件计算蛋白三维结构中所有蛋白重原子的相对暴露表面积, 并 定义距离对接后小分子距离之内的重原子为蛋白口袋表层氨基酸原子集合A。 0007 步骤2。

14、: 计算蛋白口袋表层氨基酸原子集合A和对接后的小分子的相互作用, 对于 集合A中的原子ai, 计算原子ai与小分子原子的相互作用关系; 原子ai与小分子原子的相互 作用关系主要是氢键相互作用: 原子ai为氢键给体, 小分子原子为氢键受体或者原子ai为 氢键受体, 小分子原子为氢键给体, 所述原子ai为集合A中第i个原子; 所述小分子原子为对 接后小分子结构中的所有重原子; 所述氢键相互作用形成的具体定义为: 要求两原子分别 说明书 1/7 页 4 CN 111326218 A 4 为氢键供体和氢键受体, 且两原子间的距离小于供体重原子、 供体氢原子、 受体重原 子三者之间的夹角大于120度。 。

15、0008 步骤3: 将小分子上所有的氢原子作为连接点, 区分出一个连接点和多个连接点的 情况, 所述一个连接点是指小分子上所有的氢原子相连接的重原子可以作为连接点, 并定 义为b原子, 其相应的氢原子定义为t原子; 所述多个连接点一般是以两个连接点为基础, 将 一个连接点的情况两两组合, 任意两个氢原子分别定义为t1、 t2, 其对应的两个重原子分别 定义为b1和b2。 0009 步骤4: 根据不同的使用目的设计两类指纹: 一类基于数据库搜索的目的, 另一类 基于相似性计算搜索的目的, 根据上述定义的连接点b, 氢原子t, 及其一一对应的相互作用 关系, 定义蛋白上能够产生相互作用的原子为pi。

16、; 小分子上对应的和蛋白产生相互作用的 原子为li, 两类不同指纹的具体计算如下: 0010 1)一个连接点 0011 第一类指纹计算: 计算pi原子和b原子的距离, 以及pi与b和t三个原子点所构成的 三角形中以b原子为顶点的角度; 计算li原子和b原子的距离, 以及li与b和t三个原子点所 构成的三角形中以b原子为顶点的角度; 为描述片段大小, 找出距离b原子最远的重原子, 其 距离标记为LD。 0012 第二类指纹计算: 将所有的小分子上能够和蛋白产生相互作用的原子标记为 list, 分别计算list中所有的原子和b原子的距离, 以及list中所有原子和list中其他原子 的距离; 将距。

17、离重新划分归类为一个二十二维度的指纹, 其距离大于1, 小于等于6, 每隔0.5 算为一个维度; 距离大于6, 小于等于10.2, 每隔0.6为一个维度; 距离大于10.2, 小于等于 15.2, 每个1.0为一个维度。 0013 2)多个连接点 0014 多个连接点可以两个连接点为基础定义指纹, 由于两个连接点的两类指纹设计有 一个共同之处, 定义两个连接点之间的三维空间位置关系, 计算两个连接点重原子b1和b2 的欧式距离, 以及两端连接点重原子和氢原子的角度, 其分别为t1、 b1、 b2的角度和t2、 b2、 b 的角度; 计算两个连接点重原子、 两个氢原子的二面角, 即t1、 b1、。

18、 b2和t2的二面角; 两个以 上的多个连接点可在两个连接点的基础上进行拓展来定义指纹; 0015 3)两类指纹的集中化处理 0016 将所有连接点的距离放大五倍, 所有角度缩小20倍进行两类指纹的集中化处理, 所述距离按下述(1)式计算: 0017 0018 所述角度按下述(2)式计算: 0019 angle(AB*BC)/(|AB|*|BC|) (2) 0020 其中: AB为连接原子和属性原子的向量; BC为连接原子和氢原子的向量。 0021 所述第一类指纹计算还包括: 因为上述已经定义了小分子片段两个连接点之间的 三维空间位置关系, 当有一个属性原子时, 分别将属性原子与b1, b2原。

19、子计算如上述一个连 接点时候的指纹即可, 即计算两条指纹并记录两次。 0022 所述第二类指纹从小分子片段的相似性出发, 除了上述的两个连接点的三维空间 说明书 2/7 页 5 CN 111326218 A 5 位置关系之外, 还包括: 分别从b1, b2原子计算如上述一个连接点时的第二类指纹, 然后合 并。 0023 本发明与现有技术相比具有以帮助药物化学研究人员进行药物设计和修改, 在进 行药物小分子结构修饰的时候, 蛋白环境的影响极其重要, 如氢键相互作用。 因此, 本发明 在寻找一种可以描述小分子片段的时候, 加入蛋白环境的因素, 能够更好的贴切实际使用 情况, 可以有效地替代传统的研。

20、究人员的经验, 有利于药物化学研究人员更具有目的性的 并且更为高效的进行药物分子修饰。 附图说明 0024 图1为本发明流程图; 0025 图2为蛋白口袋氨基酸原子vmd图; 0026 图3为以b原子为顶点的示意图; 0027 图4为蛋白小分子一一对应的指纹结构示意图; 0028 图5为最远距离LD示意图; 0029 图6为计算相似性为目的的指纹结构示意图; 0030 图7两个连接点时空间结构指纹图; 0031 图8数据库搜索的应用结果图; 0032 图9相似性计算的应用结果图。 具体实施方式 0033 本发明通过识别蛋白口袋表层氨基酸原子与结合小分子的相互作用关系, 主要是 氢键作用关系, 。

21、将小分子片段分为一个连接点和多个连接点的情况, 按照数据库搜索的目 的和小分子相似性计算搜索的目的, 定义了两种不同的指纹。 并根据三维蛋白结构和对接 好的小分子结构, 设计两种不同描述小分子片段属性的指纹, 其具体计算包括以下步骤: 0034 步骤1: 从输入的蛋白三维结构中找出蛋白表面原子, 根据对接后的小分子的三维 结构找出蛋白口袋表层氨基酸原子集合A, 所述找出蛋白口袋表层氨基酸原子集合A的方法 为: 利用naccess软件计算蛋白三维结构中所有蛋白重原子的相对暴露表面积, 并定义距离 对接后小分子距离之内的重原子为蛋白口袋表层氨基酸原子集合A。 0035 步骤2: 计算蛋白口袋表层氨。

22、基酸原子集合A和对接后的小分子的相互作用, 将蛋 白和小分子的相互作用属性原子记录为集合B, 所述计算蛋白口袋表层氨基酸原子集合A和 对接后的小分子的相互作用, 对于集合A中的原子ai, 计算原子ai与小分子原子的相互作用 关系; 所述原子ai为集合A中第i个原子; 所述小分子原子为对接后小分子结构中的所有重 原子; 所述原子ai与小分子原子的相互作用关系主要是氢键相互作用, 其原子ai为氢键给 体, 小分子原子为氢键受体或原子ai为氢键受体, 小分子原子为氢键给体; 所述氢键相互作 用形成的具体定义为: 要求两原子分别为氢键供体和氢键受体, 且两原子间的距离小于 供体重原子、 供体氢原子、 。

23、受体重原子三者之间的夹角大于120度。 0036 步骤3: 将小分子上所有的氢原子作为连接点, 区分出一个连接点和多个连接点, 所述一个连接点是指小分子上所有的氢原子所连接的重原子可以认为是连接点原子, 记录 为b原子, 同时氢原子可以定义为t原子; 所述多个连接点是以两个连接点为基础的, 具体是 说明书 3/7 页 6 CN 111326218 A 6 指一个连接点的两两组合, 任意两个不相同的氢原子分别定义为t1, t2, 其对应的两个重原 子分别定义为b1, b2。 0037 步骤4: 根据不同的使用目的, 按一个连接点和多个连接点的情况, 分别设计基于 数据库搜索目的和基于相似性计算搜。

24、索目的的两类不同指纹, 所述设计两类不同指纹是根 据连接点b和氢原子t, 及其一一对应的相互作用关系, 并定义蛋白上能够产生相互作用的 原子为pi, 小分子上对应的和蛋白产生相互作用的原子为li, 其两类不同指纹的具体计算 如下: 0038 1)一个连接点 0039 第一类指纹计算包括: 确认pi原子和li原子属性的确认, 即属于氢键受体还是氢 键给体, 计算pi原子和b原子的距离, 以及pi与b和t三个原子点所构成的三角形中以b原子 为顶点的角度; 计算li原子和b原子的距离, 以及li与b和t三个原子点所构成的三角形中以 b原子为顶点的角度; 为描述片段大小, 找出距离b原子最远的重原子,。

25、 并标记该距离为LD。 0040 第二类指纹计算包括: 将集合B中所有的小分子的原子标记为list, 并分别计算 list中所有的原子和b原子的距离, 以及list中所有原子和list中其他原子的距离, 并将距 离重新划分归类为一个二十二维度的指纹。 0041 2)多个连接点 0042 多个连接点可以两个连接点为基础定义指纹, 由于两个连接点的两类指纹设计有 一个共同之处, 定义两个连接点之间的三维空间位置关系, 计算两个连接点重原子b1和b2 的欧式距离, 以及两端连接点重原子和氢原子的角度, 其分别为t1、 b1、 b2的角度和t2、 b2、 b 的角度; 计算两个连接点重原子、 两个氢原。

26、子的二面角, 即t1、 b1、 b2和t2的二面角; 两个以 上的多个连接点可在两个连接点的基础上进行拓展来定义指纹。 0043 3)两类指纹的集中化处理 0044 将所有连接点的距离放大五倍, 所有角度缩小20倍进行两类指纹的集中化处理, 所述距离按下述(1)式计算: 0045 0046 所述角度按下述(2)式计算: 0047 angle(AB*BC)/(|AB|*|BC|) (2) 0048 其中: AB为连接原子和属性原子的向量; BC为连接原子和氢原子的向量。 0049 所述二十二维度的指纹是将距离大于1, 小于等于6, 每隔0.5为一个维度, 分成十 个维度; 距离大于6, 小于等于。

27、10.2, 每隔0.6为一个维度, 分成七个维度; 距离大于10.2, 小 于等于15.2, 每隔1.0为一个维度, 分成五个维度。 0050 所述两个连接点的两类指纹设计, 其第一类指纹计算, 因为已经定义了小分子片 段两个连接点之间的三维空间位置关系, 当有一个属性原子时, 分别将属性原子与b1和b2 原子计算如同一个连接点的指纹计算, 即计算两条指纹并记录两次; 第二类指纹计算从小 分子片段的相似性出发, 除两个连接点的三维空间位置关系外, 还包括: 分别从b1和b2原子 计算如同一个连接点的第二类指纹计算, 然后合并一条指纹。 0051 以下通过具体实施例对本发明作进一步的详细说明。 。

28、0052 实施例1 0053 参阅附图1, 本发明通过输入蛋白三维结构和对接后的小分子文件, 然后识别蛋白 说明书 4/7 页 7 CN 111326218 A 7 口袋表层原子和结合小分子的相互作用关系, 分别根据单个连接点和多个连接点计算两类 不同的指纹, 从而根据不同的目的描述小分子的属性, 其具体计算包括下述步骤: 0054 步骤1: 参阅附图2, 选取蛋白的5v3x口袋vmd图, 白色部分为蛋白原配体, 从输入的 蛋白三维结构中找出蛋白表面原子, 根据对接后的蛋白和小分子的三维结构, 利用naccess 软件计算蛋白三维结构中所有蛋白重原子的相对暴露表面积, 并定义距离对接后小分子 。

29、距离之内的重原子为蛋白口袋表层氨基酸原子集合A。 0055 步骤2: 计算蛋白口袋集合A和对接后的小分子的相互作用, 对于集合A中的原子 ai, 计算原子ai与小分子原子的相互作用关系; 其中, 原子ai具体指集合A中第i个原子, 小 分子原子具体指对接后小分子结构中的所有重原子; 原子ai与小分子原子的相互作用关系 主要是氢键相互作用: 原子ai为氢键给体, 小分子原子为氢键受体或者原子ai为氢键受体, 小分子原子为氢键给体。 0056 氢键相互作用形成的具体定义为: 要求两原子分别为氢键供体和氢键受体, 且两 原子间的距离小于供体重原子、 供体氢原子、 受体重原子三者之间的夹角大于120 。

30、度。 0057 步骤3: 将小分子上所有的氢原子作为连接点, 区分出一个连接点的情况和多个连 接点的情况, 所述一个连接点是指小分子上所有的氢原子都可以定义为t原子, 与氢原子连 接的重原子定义为b原子; 所述多个连接点是以两个连接点为基础, 具体是一个连接点的情 况两两组合, 任意两个氢原子分别定义为t1, t2, 对应的两个重原子分别定义为b1, b2。 0058 步骤4: 根据不同的使用目的, 设计一种用于数据库的搜索, 另一种用于相似性的 计算的两类指纹, 并根据上述定义的连接点b和氢原子t, 及其一一对应的相互作用关系, 定 义: pi为蛋白上能够产生相互作用的原子; li为小分子上。

31、对应的和蛋白产生相互作用的原 子, 两类不同指纹的具体设计如下: 0059 1)一个连接点 0060 a、 用于数据库搜索为目的设计指纹(第一类指纹): 确认pi原子属性(属于氢键受 体还是氢键给体), 计算pi原子和b原子的距离; 确认li原子属性(属于氢键给体还是氢键受 体), 计算li原子和b原子的距离。 0061 参阅附图3, 分别计算pi(li)原子与b原子和t原子三个原子点所构成的三角形中 以b原子为顶点的角度。 0062 参阅附图4a, 为蛋白小分子一一对应指纹结构, 图中表示的是示例蛋白与小分子 形成氢键相互作用的蛋白原子和小分子原子对。 0063 参阅附图4b, 设计指纹表示。

32、的两个原子的距离和角度定义。 0064 本发明具体计算的指纹示例如下述表1所示: 0065 表1指纹示例 0066 Filename_bLig_fpPro_fp ligand_5lig-D033015pro_A025015 ligand_6lig_A026013pro_D024012 ligand_6lig_D047011pro_A031012 ligand_7lig_D044009pro_A036010 说明书 5/7 页 8 CN 111326218 A 8 ligand_8lig_D047006pro_A058006 ligand_9lig_A028005pro_D025005 liga。

33、nd_12lig_A027010pro_D027012 0067 参阅附图5, 为了描述片段大小, 找出距离b原子最远的重原子, 图中LD表示的是b 原子和小分子上所有重原子的最远距离。 0068 b、 计算相似性为目的设计指纹(第二类指纹), 其每一位的定义指纹如下述表2所 示: 0069 表2自定义指纹结构 0070 Index 000102030405060708 Dist(1, 1.5(1.5, 2(2, 2.5(2.5, 3(3, 35(3.5, 4(4, 4.5(4.5, 5(5, 5, 5 lndex 091011121314151617 Dist(55, 6(6, 66(66,。

34、 72(7.2, 7.8(78, 8.4 (8.4, 90 (90, 9.6 (9.6, 10.2 (10.2, 11.2 Index 18192021 Dist(11.2, 12.2 (12.2, 13.2 (13.2, 14.2 (14.2, 15.2 0071 将所有的小分子上能够和蛋白产生相互作用的原子标记为list, 分别计算list中 所有的原子和b原子的距离, list中所有原子和list中其他原子的距离, 将距离重新划分归 类为一个22维度的指纹(距离大于1, 小于等于6, 每隔0.5算作一位; 距离大于6, 小于等于 10.2, 每隔0.6算作一位; 距离大于10.2, 小于。

35、等于15.2, 每个1.0算作一位, 0072 参阅附图6a, 图中表示的具体指纹为小分子与蛋白相互作用的原子标记下来, 然 后计算小分子上的b原子和属性原子的距离, 即为dist1, 并将dist1使用上述b步骤的方法 重新划分。 0073 参阅附图6b, 图中所示的0, 1指纹, 长度为22, 其中第二位是1, 其余位置为0, 可以 记为Fp1, 当有多个相互作用对时, 需要定义多个Fp, 为了保证所有的指纹长度一样, 所以提 前预制指纹长度, 一共是14*22。 0074 2)多个连接点 0075 在多个连接点的情况下两类指纹有一个共同之处, 所以多个连接点可以两个连接 点为基础进行定义。

36、指纹。 0076 参阅附图7, 定义两个连接点之间的三维空间位置关系: 两个连接点重原子b1, b2 的欧式距离; 两端连接点重原子和氢原子的角度, 分别是t1, b1, b2的角度, t2, b2, b的角度; 两个连接点重原子、 两个氢原子的二面角, 即t1, b1, b2, t2。 0077 本发明具体指纹示例如下述表3所示: 0078 表3指纹实例 0079 Filename_b1_b2Gid ligand_5_12030004005002 ligand_5_13035004007002 ligand_5_18033002001006 ligand_6_7006006005009 li。

37、gand_6_8012007007009 ligand_6_12036007005002 ligand_6_19043004007015 说明书 6/7 页 9 CN 111326218 A 9 0080 所述第一类指纹还包括: 因为上述已经定义了小分子片段两个连接点之间的三维 空间位置关系, 当有一个属性原子时, 分别将属性原子与b1, b2原子计算如上述一个连接点 时候的指纹即可, 即记录两条指纹; 所述第二类指纹从小分子片段的相似性出发, 除了上述 的两个连接点的三维空间位置关系之外, 还包括: 分别从b1, b2原子计算如上述一个连接点 时的第二类指纹, 然后合并成一个指纹。 0081。

38、 参阅附图8, 本发明设计的第一种指纹使用于药物分子的设计和修改, 图示中间的 小分子为上述5v3x蛋白的原配体, 中间结构的阴影部分为预计修改部分, 首先对PDBBind数 据库使用本发明的第一种指纹预先设计了数据库, 然后计算阴影部分的第一种指纹, 搜索 数据库找到相似的片段, 通过空间上坐标的平移旋转, 与剩余的部分片段拼接, 最后产生 200个新分子, 选择其中的6个展示在图示中, 外围阴影部分就是相似的片段。 0082 参阅附图9, 本发明设计的第二种指纹使用于药物分子的设计和修改, 为了方便对 比, 选取和附图7一样的修改片段, 首先对所有的chembl数据库使用本发明的第二种指纹。

39、预 先设计了指纹库, 然后计算阴影部分的第二种指纹, 计算相似性, 选择相似性大于0.5的片 段, 按照上述的方法拼接新的分子, 最后产生200个新分子, 选择其中的6个展示在图示中, 外围阴影部分就是相似的片段。 0083 上述实施例表明, 这两类指纹在药物分子设计的时候都有非常显著的效果, 尤其 在药物分子修改上有很大的成效。 第一类指纹主要是采取穷举所有情况的方法, 对于一次 传入的蛋白和小分子结构, 将蛋白与配体产生的氢键相互作用关系分别对小分子的每一个 氢原子出现的位置制作指纹, 所有的情况都被计算出来, 穷举片段可能出现的所有情况, 这 样如果在有很多体系的情况下, 本发明可以计算。

40、所有的体系, 将计算出来的结果以数据库 的形式储存, 帮助药物化学工作者根据蛋白环境进行药物分子设计和修改。 第二类指纹主 要采取尽可能描述小分子的所有特性, 包括产生相互作用, 分子空间大小等, 当出现新的体 系时, 可以通过相似性的计算快速找出外形和属性上相似的分子, 可以帮助药物化学工作 者进行快速的药物分子修改, 有利于方向性的药物分子修改。 0084 以上所述仅是对本发明的较佳实施例而已, 并非对本专利作任何形式上的限制, 凡为本发明等效实施所做的任何简单修改或等同变化与修饰, 均应包含于本发明专利的权 利要求范围之内。 说明书 7/7 页 10 CN 111326218 A 10 图1 说明书附图 1/5 页 11 CN 111326218 A 11 图2 图3 说明书附图 2/5 页 12 CN 111326218 A 12 图4 图5 说明书附图 3/5 页 13 CN 111326218 A 13 图6 图7 说明书附图 4/5 页 14 CN 111326218 A 14 图8 图9 说明书附图 5/5 页 15 CN 111326218 A 15 。

展开阅读全文
内容关键字: 基于 蛋白 环境 描述 分子 片段 属性 指纹 设计 方法
关于本文
本文标题:基于蛋白环境描述小分子片段属性的指纹设计方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10590533.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1