-
生物通官微
陪你抓住生命科技
跳动的脉搏
辅助虚拟筛选人工视检的蛋白-配体复合物深度聚类方法
【字体: 大 中 小 】 时间:2023年04月13日 来源:浙江大学药学院
编辑推荐:
在先导分子发现阶段的虚拟筛选最终决策过程中,分子聚类常被用于辅助人工视检以提高活性分子的命中概率,但是传统的基于分子指纹/分子描述符的分子聚类方法往往忽略了蛋白质-配体的相互作用信息,聚类效果不佳,导致命中率有限。因此,发展具有高信息保留度的分子聚类方法,提高发现命中率,对于发现新型靶蛋白配体以开展进一步新药创制研究具有重要意义。
在先导分子发现阶段的虚拟筛选最终决策过程中,分子聚类常被用于辅助人工视检以提高活性分子的命中概率,但是传统的基于分子指纹/分子描述符的分子聚类方法往往忽略了蛋白质-配体的相互作用信息,聚类效果不佳,导致命中率有限。因此,发展具有高信息保留度的分子聚类方法,提高发现命中率,对于发现新型靶蛋白配体以开展进一步新药创制研究具有重要意义。
围绕上述问题,2023年4月,浙江大学药学院董晓武教授、车金鑫特聘研究员团队和医学院吴健教授团队联合在《Briefings In Bioinformatics》上发表论文“ClusterX: a novel representation learning-based deep clustering framework for accurate visual inspection in virtual screening”,提出了一种用于辅助虚拟筛选目视检查的蛋白-配体复合物深度聚类新方法。该方法引入蛋白-配体复合物表征学习网络来学习更有利于聚类的分子表征,学习到的分子表征输入聚类模块进行聚类,并且在训练过程中使用共同优化策略对图表征学习模块和聚类模块进行共同优化,相较于传统的两步走的基于分子指纹/分子描述符的分子聚类方法,使用共同优化策略能够学习到更适合于聚类任务的分子表征,进而提升聚类性能(图1)。
为了验证该模型的有效性,在KLIFs激酶数据集上的激酶分型实验表明,对比现有的基于分子指纹的聚类方法,ClusterX可以很好地区分不同激酶抑制剂的结合模式(图2)。在虚拟筛选数据集上的聚类结果进一步表明,使用ClusterX辅助虚拟筛选决策中的top10/30命中率(挑选的前十/三十个分子中含有活性分子的概率)相较传统方法有较大地提升,可以帮助药物化学家进行虚拟筛选结果的目视检查以及最终决策,有效提升药物发现过程的效率。
该研究首次报道了基于蛋白-配体复合物表征学习的深度聚类方法,引入共同优化策略构建了端到端的蛋白-配体复合物聚类框架,相关工作为化合物与靶标的结合模式聚类分析提供了新的思路和工具。浙江大学药学院为本论文的第一署名单位,硕士研究生陈思康为论文第一作者,董晓武教授、吴健教授和车金鑫特聘研究员为共同通讯作者。本研究依托浙江大学智能创新药物研究院平台开展,得到了国家自然科学基金、浙江省自然科学基金杰出青年项目、浙江省重点研发计划等项目的支持。