当前位置:首页|资讯|生成式AI|医疗

分子之心许锦波:生成式AI帮助高效设计出所需特殊功能的蛋白质

作者:IPO早知道发布时间:2023-05-16

AI能很好地预测单个蛋白质结构,但蛋白质复合物结构预测等很多问题还没解决。

据IPO早知道消息,以“以终为始,致远尽微”为主题的2023红杉全球医疗健康产业峰会于5月10日和11日在上海张江科学会堂成功举办。

在“AI蛋白生成引领生物科学新时代”主旨演讲中,分子之心创始人、清华大学智能产业研究院(AIR)卓越访问教授许锦波分享了生成式AI生成蛋白质的优势及发展程度。

AI对蛋白质的研究在过去几年发生了颠覆式影响。用AI去做蛋白质的生成,相比传统的基于物理学的方法或者实验方法,AI有非常多的优点,首先AI效率非常高;第二,用AI设计的蛋白质,成功率超过以前传统的分子动力学模拟方法。

蛋白质在细胞里有执行功能,是细胞里面非常重要的一个大分子。蛋白质在细胞里面会折叠成某一种特殊形状,去执行功能。“而蛋白质的结构是由氨基酸序列决定的,也就是说如果我们有了它的氨基酸序列,原则上来说,这个蛋白质的结构其实是确定的。我们想通过用计算的方法,而不是用湿实验的方法,去把这个蛋白质里面所有的三维坐标确定出来。”

从CASP发起人John Moult教授总结的图表来看,科学家在用计算的方法预测蛋白质三维结构的30年中,2016年开始到2020年,使用AI技术,可以把蛋白质结构预测精度从30几分大幅提高到80几分。

最近几年,AI可以把单个蛋白质预测做得非常好,改变了很多分子生物学家研究蛋白质的行为方式。但还是有很多问题没有解决。比如AlphaFold2可以预测单个蛋白质结构,但是它在预测蛋白质复合物结构的时候效果不是那么好。AlphaFold2还有很多事情不能做,例如它本来只能做结构预测,也就是氨基酸序列到三维坐标的映射,不能用来做蛋白质的优化和设计,也不能用来预测蛋白质跟其他的分子,比如跟DNA、RNA、小分子的结合,我们要开发新的AI算法才能实现这些。

我们能不能通过AI去设计出自然界中不存在的蛋白质,找到一个结构或功能都满足特定需求的氨基酸序列?蛋白质序列搜索空间巨大,如果我们想设计只有100个氨基酸的蛋白质,自然界有20种常见的氨基酸,这个空间是20的100次方。找到满足我们需求的蛋白质氨基酸序列相当于大海捞针的过程。

蛋白质设计在各行各业有很多的应用,例如应用在药物设计上面,可以用AI方法设计抗体、结合蛋白等。而在合成生物学方面的应用,常常包括用AI改造一个酶,甚至完全重新设计一个酶。

分子之心开发了AI蛋白优化和设计平台MolecureOS,以生成而非发现蛋白质。平台架构包含基础层、能力层、应用层、产品层。基础层包含AI蛋白质大模型及一些大的数据库和算力支撑平台,基础层上面的各种下游功能模块可以做单个蛋白质结构预测,也可以预测蛋白质复合物结构、抗体抗原如何结合等。分子之心在基于AI的蛋白质从头设计、基于AI的抗体抗原复合物预测、抗体CDR从头设计,基于AI的蛋白疫苗设计等场景都有了应用产品并完成了一定的测试。例如,在给定抗体、抗原的结合表位,预测抗体抗原复合物结构的应用中,分子之心算法成功率为70%-80%,高于AlphaFold-Multiplier(约34%)的准确度。

许锦波表示,AI不仅可以用来预测自然界里面蛋白质的三维构型,也可以用来产生各种各样我们所需要的基于某种特殊功能的蛋白,“相信在不远的将来,AI可以用来产生一些大分子药物。”

本文为IPO早知道原创

编辑|C叔

微信公众号|ipozaozhidao


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1