本篇文章851字,读完约2分钟

近日,重庆理工大学数学科学研究中心助理教授刘健博士与密歇根州立大学Guo-Wei Wei讲席教授、博士后陈冬合作的题为TopoFormer: Multiscale Topology-enabled Structure-to-Sequence Transformer for Protein-Ligand Interaction Predictions研究成果,在人工智能领域顶级期刊Nature Machine Intelligence(IF:25.898)上发表。

论文截图

据了解,Nature Machine Intelligence是Nature期刊于2019年创立的子刊,目前被公认为人工智能及机器学领域的顶级国际期刊。该期刊在影响因子(Impact Factor)和谷歌指数(H-Index)方面均列前茅,覆盖计算生物学、模式识别、图像处理和计算机视觉等多个领域。2021年数据显示,其在“计算机科学和人工智能”类别的144个期刊、“计算机科学和跨学科应用”类别的113个期刊中均排名第一。

本次发表的论文提出了一种创新的工具——TopoFormer,结合了大语言模型(LLM)与多尺度拓扑技术,用于预测蛋白质-配体相互作用。TopoFormer的核心在于其独特的拓扑方法,即持续拓扑超图拉普拉斯(PTHL)技术。PTHL技术能够将复杂的3D蛋白质-配体复合物转换为LLM可处理的拓扑不变量和同胚形状序列,从而捕捉不同空间尺度上的关键相互作用。TopoFormer在评分、排序、对接和筛选等任务中表现优异,大幅超越了传统算法和最新的深度学模型。研究团队在多个基准数据集上验证了TopoFormer的性能,证明其在准确度和效率方面具有显著优势。这项研究不仅展示了TopoFormer在蛋白质-配体相互作用预测中的强大能力,还为拓扑学在其他结构数据中的应用提供了新的思路。

拓扑大语言模型示意图

此项研究工作得到了重庆理工大学科学技术研究院、理学院、数学科学研究中心的支持。(文/图 谢挺)