6月下旬,专注于生物学的人工智能初创公司Evolutionary Scale宣布在种子融资中筹集了 1.42亿美元,将用于构建可生成新型蛋白质的人工智能模型,以满足科学研究的需要。本轮融资由Nat Friedman、Daniel Gross和Lux Capital领投,亚马逊网络服务公司和Nvidia参投。这家初创公司还发布了一种被认为是“生物学的里程碑式AI模型”的ESM3,该模型可以设计新型蛋白质,用于药物研发和材料科学研究等。
Evolutionary Scale成立于2023年7月,聚焦前沿人工智能研究,致力于为生命科学开发人工智能,其AI模型产品支持健康、环境科学等领域的突破性研究和开发。该公司联合创始人兼首席科学家Alex Rives此前就职于Meta公司的AI研究团队FAIR,曾首次开发了蛋白质的生成式AI模型 ESM1,该模型被广泛认为是第一个蛋白质大型语言模型(LLM)。团队解散后,他离开了Meta,并与Tom Sercu和Sal Candido一起创立了Evolutionary Scale来继续这项工作。
Alexander Rive表示,ESM3 经过 27.8 亿种蛋白质的数据集训练,可以“推理”蛋白质的序列、结构和功能,从而使该模型能够生成新的蛋白质。Evolutionary Scale正在通过其云端Forge开发平台将完整的980亿参数模型用于非商业用途,并发布较小版本的模型供离线使用。
通过模拟新型蛋白质,科学家们有可能揭示疾病的机制,并找到减缓甚至逆转疾病进展的方法。同时,创造新的蛋白质有助于科学家开发出全新的药物和疗法。然而,现有的实验室蛋白质设计过程既缓慢又昂贵。
设计蛋白质的挑战在于,研究人员必须首先创建一种可能在人体中发挥特定功能的结构,然后找到可以折叠成该结构的氨基酸序列。蛋白质必须正确折叠成特定的三维形状,才能发挥预期的功能。新的蛋白质形成需要经过数百万年的进化,Evolutionary Scale旨在加速这一过程。
其 ESM3大模型已在包含超过 27.8 亿种蛋白质结构和序列的数据集上进行训练,并可以进行高级推理来设计全新的蛋白质。凭借这一能力,该模型有可能加速广泛应用领域的发现,从开发新的癌症治疗方法、到创造有助于捕获碳的蛋白质。
Evolutionary Scale宣布已经利用 ESM3 创建了一种新型绿色荧光蛋白(GFP),该蛋白家族负责自然界中发光的颜色,例如发光水母和珊瑚。该公司强调这种新蛋白质可能需要长达 5 亿年的时间才能完成自然进化。
Evolutionary Scale表示将很快通过云提供商的SageMaker AI开发平台、Bedrock AI平台和 HealthOmics服务向部分AWS客户推出 ESM3 及其衍生产品。ESM3还将提供给使用Nvidia的NIM微服务的部分客户,并由Nvidia企业软件许可证提供支持。AWS和Nvidia的客户都将能够使用自己的数据对ESM3进行微调。
事实上,Evolutionary Scale 并不是唯一一家希望利用人工智能加速蛋白质发现的公司。谷歌旗下的DeepMind正在利用其AlphaFold LLM进行类似的工作,同时OpenAI与法国制药公司 Sanofi SAS合作,利用其LLM推进药物开发。
Evolutionary Scale官网介绍,ESM3 向未来迈出了一步,未来 AI 将成为一种工具,可以从第一原理设计生物学,就像我们设计结构、机器和微芯片以及编写计算机程序一样。该初创公司表示,本轮融资的资金将用于训练下一代ESM3模型,并发展与生物技术行业的合作伙伴关系。
(文:刘宇梦)