百奥几何 投稿
量子位 | 公众号 QbitAI
AlphaFold3引起的浪潮下,一个新的抗体设计生成式AI大模型浮出水面。
名为GeoFlow,能够同时用于抗原-抗体复合物结构预测和抗体从头设计。
例如,给定抗原结构和特定表位,GeoFlow能够生成全新的抗体分子:
△基于GeoFlow的抗体从头生成示意图
在抗原-抗体复合物结构预测任务上,在由66个抗原-抗体复合物结构构成的测试集上,GeoFlow的Top-1成功率达43.9%,与AlphaFold3持平。
GeoFlow研发团队来自生成式AI驱动的蛋白质设计研发平台公司——百奥几何,百奥几何由AI药物发现科学家唐建博士于2022年创立,AI三巨头之一、图灵奖获得者Yoshua Bengio担任首席科学顾问。
GeoFlow长啥样?
近日,由Google DeepMind和Isomorphic Labs等团队开发的AlphaFold3登上Nature,引发了业界广泛关注。
与上一代方法相比,AlphaFold3将预测的范围扩充到了几乎所有的生命分子以及它们之间的相互作用,是生成式AI在生命科学领域的又一重要里程碑。
其模型的最大创新点之一,是用上了大火的生成式AI模型——扩散模型(AlphaFold 2为判别式AI模型),直接生成每个原子的3D坐标。
如果说传统的判别式AI是乐评人,可以对一首歌的节奏、风格、编曲进行识别和评价,那么生成式AI就是歌手,可以创作出新的作品。
从评价数据到生成数据,AI的应用场景得到了极大的拓展。例如,在结构预测场景中,生成式AI能更快地采样到更多的构象;在蛋白设计场景中,生成式AI能更高效地探索蛋白空间,设计具有预期功能的复杂蛋白分子。
扩散生成模型早期主要用于图像生成(近期也被用于三维视频的生成,如Sora)。
百奥几何的核心团队,2021年起将扩散模型用于分子的三维结构生成,曾发GeoDiff论文是2022年AI领域引用量排名前50的论文之一。
基于前期技术积累,他们研发了最新的生成式AI抗体设计大模型GeoFlow。
GeoFlow模型架构图如下:
GeoFlow基于几何深度学习架构和最新的流匹配生成模型(flow matching),能够同时用于:
在原子层面对抗原-抗体相互作用力进行建模是这两项任务的核心难点。
与现有的Transformer架构不同,GeoFlow采用了几何深度学习基础模型,能够更好地在三维空间上对原子-原子之间的关系进行建模。
在生成模型选择上,GeoFlow采用了最新的流匹配模型。与扩散生成模型相比,流匹配生成模型的训练和推理更高效,也更鲁棒。
抗原抗体复合物结构预测媲美AF3
对于GeoFlow的性能,研究团队在抗原-抗体复合物结构预测任务上进行了测评。
抗原-抗体复合物结构预测在抗体药物的发现中扮演着至关重要的角色。然而,无论是基于能量函数的传统方法(如HDock和MOE),还是基于深度学习的预测模型(如AlphaFold 2 Multimer),准确度目前都不太理想。
在由66个抗原-抗体复合物结构(2023年后发布的)构成的测试集上,GeoFlow模型的Top-1成功率(模型打分最高结构的DockQ水平为“Acceptable”以上则视为成功)达到了43.9%,与AlphaFold3持平,大约是AlphaFold2 Multimer的两倍。
△抗原-抗体复合物预测评测结果
传统的分子对接方法尽管也能生成多个可能的结构,但打分准确率较低,实际应用的价值相当有限。
△PDB 8BLQ(左)、8DOK(右)各模型预测结果对比
与AlphaFold3相比,GeoFlow不仅能够用于抗原-抗体复合物结构预测,还能够用于抗体的从头设计和优化。
对于传统AI方法来说,大分子从头设计非常困难。主要原因是难以快速采样高质量的样本,只能通过判别模型从浩瀚的分子空间中评估大量低质量样本,这个过程如同大海捞针。
生成式AI的出现为大分子设计带来了革命性的机遇。
以HER2靶点为例,基于上市的抗体药物Herceptin的结合表位,研究团队利用GeoFlow生成了一个小的抗体库,然后再利用噬菌体库进行筛选。在得到的十条候选序列中:
上述结果展现了生成式AI在大分子从头设计领域的应用前景。
关于百奥几何
百奥几何是一家生成式AI驱动的蛋白质设计研发平台公司,由AI科学家唐建博士于2022年创立,AI之父、图灵奖获得者Yoshua Bengio担任首席科学顾问。
公司业务主要是通过打造AIGC大模型理解生命语言,搭建自然语言与蛋白质语言多模态大模型,重新构建蛋白质药物发现及设计过程,打造可编程的蛋白质,应用于生物医药和生物制造。
百奥几何的生成式AI大模型,目前已覆盖了大分子设计、筛选和改造等环节,并开发了GeoBiologics一站式抗体发现平台。
目前GeoFlow模型已开放,可用于抗原-抗体复合物结构预测的非商用测试,每周支持预测八个复合物,每个任务输入支持1150个氨基酸。
测试地址:https://geobiologics-lite.biogeom.com/about
— 完—
量子位年度AI主题策划正在征集中!
欢迎投稿专题一千零一个AI应用,365行AI落地方案
或与我们分享你在寻找的AI产品,或发现的AI新动向
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~