近日,信息科学与工程学院曾湘祥教授课题组提出了一种全新的分子表征框架——基于分子图像的无监督深度学习框架 ImageMol,能够对分子性质和药物靶点进行准确预测,为加速药物研发进程提供了新的途径。该成果以“Accurate prediction of molecular properties and drug targets using a self-supervised image representation learning framework”为题发表于国际顶级期刊《Nature Machine Intelligence》上。
药物的临床疗效和安全性取决于药物分子的性质和药物作用的靶点。然而,通过湿实验和临床实验的方式评估药物性质和药物靶点是代价巨大的,平均一款新药的研发需要花费10年以上时间,10亿美元成本。通过人工智能技术预测药物性质和药物靶点,可以加速药物研发进程,大幅减少药物研发成本。
目前,国内外分子性质及药物靶点预测的研究大多围绕序列(sequence)表示和图(graph)表示展开,它们在提取分子表征时存在一定的局限性。受到计算机视觉最新研究的启发,该研究提出了首个基于分子图像的无监督深度学习框架ImageMol,为性质预测与靶点预测提供了新范式,证明了分子图像在智能药物研发领域具有巨大的潜力。
该研究在51个药物发现的基准数据集上进行评估,展示了其在性质预测(如药物代谢、脑渗透、毒性)和靶点预测(如HIV、阿兹海默、GPCR、激酶)的性能均优于其他模型。此外,该研究关注到新冠药物研发的迫切需求,在美国国家转化科学推动中心(NCATS)的13个实验数据集中准确识别了抗SARS-CoV-2分子并确定了治疗COVID-19的临床候选3CL蛋白酶抑制剂,这对于加速新冠药物研发的进程具有重要意义。
相比于现有的基于序列和图的方法,该研究提供了分子结构重要性的实验观察,展示了模型对分子图像的全局注意力与局部注意力,这些结果使研究人员能够在视觉上直观地理解分子结构是如何影响性质和靶点。
计算机视觉是人工智能中最热门的研究领域之一,此次计算机视觉与分子领域交叉取得的成功展示了利用计算机视觉技术理解分子性质与药物靶点机制的巨大潜力,并为分子领域的研究提供了新的机遇。
湖南大学信息科学与工程学院为论文的第一单位。湖南大学国家超级计算长沙中心为该研究的开展提供了强大的算力支持。
论文地址:
https://www.nature.com/articles/s42256-022-00557-6
来源:信科院
通讯员:聂承锋
责任编辑:余楚倩