利用生成式AI加速药物研发进程:郑双佳的研究与成果

AI世纪 2024-12-03
大模型 2024-12-03

传统的药物研发往往漫长且昂贵。例如,开发一款药物,通常需要 10 年以上的时间,平均投入 26 亿美金。

AI 尤其是生成式 AI 的出现,已经开始改变这一过程。目前,它几乎全链条地覆盖到传统制药的每一个环节中,包括靶点发现、临床前药物研发和临床开发等。

不管是从为疾病定位有价值的生物靶点,还是从已知的化学空间里找到一个不错的起始分子,AI 都能在其中发挥有效作用。

利用生成式 AI 加速药物研发的进程,也正是郑双佳近年来专注的研究领域。

在该领域,他曾取得诸多优秀成果,比如,为实现动态复合物结构预测而设计的几何深度生成模型 [1],针对难成药靶点的生成式智能药物设计算法 [2],有效融合原子结构和分子网络尺度之间多尺度信息的学习框架 MUSE[3] 等。

凭借这些贡献,他成功获得 2024 亚洲青年科学家基金项目资助,成为生命科学领域的获奖人。

开发深度学习方法 ,实现对动态复合物的结构预测

谷歌 团队推出的 系列模型,让 AI 在实现静态蛋白质结构预测方面取得显著进展。

然而,由于其不具备预测蛋白质结构动态变化的能力,因此无法助力该领域的研究人员,更好地理解蛋白质功能和推进药物发现。

基于此,郑双佳带领团队开发深度学习方法 ,能够在 完成蛋白质静态结构预测的基础上,进行复合物结构的动态结合模式预测。

另外,值得一提的是,与只能预测蛋白质单体结构的 相比, 能够同时预测小分子和蛋白的结合模式和亲和力强弱。

“从这一点来看, 实现了从结构到功能的转变。也就是说,完成从仅仅进行结构预测,到能够有一定落地场景的药物发现的转变。”郑双佳表示。

与此同时,对于该成果而言,该团队也引入了一些 模块。

这是结构生物学家以及该领域许多研究人员都非常关注的模块,通常指的是动态建模或动态分析的组件或工具,旨在研究和描述生物分子(如蛋白质、核酸等)在时间和空间上的动态行为。

在研发药物的过程中,研究人员可能会看到一个蛋白结构出现多个口袋的情况,其中有些口袋在平常是不打开的,直到某些特定场景才会打开。

通过 预测的结构,往往捕捉不到这种被称为隐蔽口袋的东西,但由于引入了 模块, 能够很好地捕捉到这种隐蔽口袋是如何出现的,以及它们和小分子是怎么结合的。

“换言之,可以帮助我们找到特异性更好的药物,实现对症下药的目标。”郑双佳表示。

他指出,课题组很早就将 以及系列工作投入到实际应用中。

“我们当时做了一个比较暴力的事情,就是选了 15 至 20 个高价值靶点,包括一些难成药靶点,用 AI 的方法对每个靶点进行层次化的药物筛选,而后每个靶点都会送测 100 至 200 个分子去进行湿实验验证。”郑双佳说。

从中,他们也看到令人惊喜的效果。

那就是,在这 15 至 20 个靶点中,有 85% 的靶点都能找到很不错的苗头化合物。

同时,在整个过程中获得的筛选成功率,比用传统的计算化学方法以及高通量实验方法获得的成功率要高许多。

“我们每送测 100 至 200 个分子,按照生物学家制定的活性标准,平均在这近二十个靶点上的筛选命中率能达到 20%。”郑双佳表示。

如上所说,除了这个成果,他也系统地开发了一套针对难成药靶点的生成式智能药物设计算法,用于蛋白水解靶向嵌合体(,- )的设计。

需要说明的是, 作为一种创新的药物设计策略,拥有特异性地降解目标蛋白质的功能。

它的设计难点在于,让分子在拥有降解活性的同时,也有良好的选择性和成药性。也就是降低毒副作用且提高生物利用度。

为攻克这一问题,该团队通过生成式 AI 构建了一个化学大模型,然后配合强化学习的方式,去优化 中间的连接子。这就是上述算法背后的原理。

基于该算法,研究人员设计了 6 个分子,并进行实验验证。结果显示,其中 3 个都表现出很好的降解活性,且在成药性上得到明显提高。

“诺奖进入‘AI 时代’,未来会有更多 AI 学者获得该奖项”

2024 年,诺贝尔物理学和化学奖接连颁发给 AI 研究者。这在很多人看来,是诺奖进入“AI 时代”的表现。

那么,郑双佳是如何看待的呢?