图片来源@视觉中国
文 | 同写意,作者 | Daisy,编辑 | 于靖
2月14日,百度宣布完成对医疗信息化数据提供商GBI的并购,期望结合“文心一言”,利用AI技术为医疗垂直行业助力,以实现“AI+医疗大数据智能化全链条洞察”。
GBI的服务客户不仅覆盖礼来、赛诺菲、辉瑞等跨国药企,也包括信达生物、复星医药、基石药业等创新药企业和药明康德等CRO企业。随着GBI的加入、“文心一言”的发布在即,百度跨入制药行业并不是多么难以预料的事情。
早在2020年,百度就成立百图生科,专攻AI制药。2022年,百图生科透露,其将基于生物计算引擎de novo设计全新蛋白质药物。其实不只是百度,更多的科技公司对于这种结合表现出浓厚兴趣。
如果说,过去几年是以AlphaFold为代表的产品挑动业界的情绪,那么当下,ChatGPT似乎将“大行其道”。2月,随着ChatGPT在国内的热度走高,业界对AI制药产生了更多的遐想。
ChatGPT是一款基于AI技术驱动的自然语言处理工具,检索信息并综合处理的能力让人惊讶。比尔·盖茨称,ChatGPT等模型在全球范围内开启了一种新形式的革命。Forbes上的一篇文章也写道,ChatGPT等先进的生成式AI工具将深刻变革医疗健康领域。
我们走到AI制药的关键节点了吗?或许需要放置在更广泛的背景下讨论。
01 火热的AI制药
虽然AI制药“热潮”在去年似乎有所退却,但纵观全球,该领域还是取得了许多里程碑进展。
7月,DeepMind在官网公布,其与欧洲生物信息研究所(EMBL-EBI)合作,利用蛋白结构AI预测算法AlphaFold成功预测了来自100万个物种的约2亿种蛋白质结构,几乎涵盖了地球上所有已知的蛋白质。
11月,Meta(前身为Facebook)的研究人员使用AI仅花了2周时间预测了来自细菌、病毒和其他尚未表征的微生物约6亿种蛋白质的结构。
此外,Science和Nature Biotechnology也分别报道了利用AI生产全新蛋白和预测蛋白结构的新技术。
融资方面,虽增速放缓,但依旧吸引着大量资本的投入。
根据智药局不完全统计,2022年全年AI+药物研发相关融资总事件达144起(2021年是73起),总金额为62.02亿美元(2021年总金额为42亿美元)。
得益于AI制药的蓬勃发展,2022年,众多MNC不断加码与AI企业的合作,以期利用AI技术为自身研究添砖加瓦。
其中最大的订单来自赛诺菲与Exscientia的合作,潜在总额高达53亿美元。作为头部AI制药公司,Exscientia此前已与拜耳、BMS、华东医药等多家跨国药企建立合作。此次与赛诺菲签约也成为Exscientia有史以来单笔最高的订单。
此外,赛诺菲还与Atomwise建立了合作,将利用后者AtomNet平台进行计算发现和研究多达5个药物靶点。
来自国内的AI制药公司英矽智能也官宣了与赛诺菲的合作。赛诺菲将利用英矽智能的Pharma.AI药物发现平台,推进基于不超过6个创新靶点的候选药物研发,总潜在价值达12亿美元。
与赛诺菲同样大力布局AI赛道的还有礼来,在TOP10 AI合作中也占据了三席。
国内另一AI制药公司晶泰科技,也在去年与新加坡国家药物研发平台实验药物研发中心(EDDC)、 齐鲁制药、启德医药、正大天晴、青煜医药、联邦制药、华润医药研究院、杨森制药等达成或进一步扩大学术或商业合作,开发药物涉及新型ADC、抗肿瘤小分子新药等。
除了寻求合作之外,很多制药公司已经开始建立内部AI能力,GSK在2017年成立了内部AI部门,成为“第一个吃螃蟹的人”;2019年,诺华宣布成立AI创新实验室,并选择微软作为其AI战略和数据科学合作伙伴;罗氏、拜耳等公司也都开始尝试。
据市场研究机构Research and Markets发布的一份报告预测,全球医疗保健市场的AI规模预计将从2020年的42亿美元增长到2025年的272亿美元,年复合增长率为45.3%。
02 浅尝生成式AI
AI与制药已有诸多交叉,而ChatGPT这类语言生成模型的巨大突破,让研究者开始探索能否在生物制药领域搭建类似的AI模型。生成式AI因其在靶点发现上的优异表现引起了业界的兴趣。
生成式AI技术始于2014年,诞生于Yoshua Bengio与Ian Goodfellow发表的开创性论文“生成对抗网络(GAN)”。如今,生成式AI已被用于缩短各种用途的药物设计周期,减少了制药行业的药物研发成本和时间。
从条件来说,生成式AI模型通常要在大型数据集上进行训练学习,并使用机器学习算法生成与训练数据相似的新内容。比较有代表性的生成式AI模型包括DALL-E、DALL-E2、ProGen以及ChatGPT等。该算法的突破也意味着AI开始走向了创造新内容的发展路径。
那么,生成式AI能否为生物医药带来创造性变革?
Gartner分析师Brian Burke表示,制药公司正在使用生成式AI设计针对疾病的蛋白质模型的特性或功能。“几乎所有大型制药公司和许多小型制药初创公司都在致力于生成式人工智能,它已经开发了几年。一些药物现在正在进行临床试验。这将是制药行业的重大转变。”
早在2019年,研究人员发表在ACS Central Science上的一篇论文中就描述了如何使用ChatGPT识别新的抗菌药物。该研究表明,ChatGPT在药物发现中的应用可以帮助药物研发人员更快速、高效地开发新的化合物。
剑桥大学的研究人员已经利用ChatGPT确定了一个治疗阿尔茨海默病的新靶点;旧金山加利福尼亚大学的研究人员也通过ChatGPT分析电子健康记录,识别了现实环境中存在的潜在药物间相互作用关系。
ChatGPT之外,英矽智能刚于本月宣布其新冠小分子药物ISM3312正式获批进入临床,这是英矽智能第二款使用生成式AI设计的小分子药物。
去年12月,Meta AI利用其基于2.5亿条天然蛋白质序列的预训练语言模型,生成了228条蛋白质序列,其中152条序列能够进行可溶性表达,且蛋白序列的新颖性极佳。
Salesforce Research在Nature Biotechnology上发表的一篇文章也力证了生成式AI制药的可能性:通过ProGen模型进行蛋白质生成的工作,该模型生成的具备特定属性的蛋白序列多样性强,且生成的酶能够展现出与天然酶相似的活性。
除了药物发现外,生成式AI在药物设计、剂量选择等药物开发环节中也为提高效率、完善治疗效果扮演着令人惊喜的角色。
根据公开数据,去年生成式AI领域投资超过13.7亿美元。预计到2040年,生成式AI可能会为医疗健康行业带来1万亿美元的价值。
03 落地不易,道阻且长
在制药领域,生成式AI可能在某种程度上可以帮助发现靶点、生成分子,甚至产生一些之前未曾考虑过的新想法。业界也不仅仅满足于其在药物发现阶段的成功,但将其应用到其他环节还需要很多的研究和探索。
以ChatGPT举例,一方面,它是基于大数据大模型,核对事实能力有限,更适合比较宽泛的逻辑梳理和信息归纳。然而,生物医药领域对生成算法的结果有更高、更具体的要求,需要更精确的产出(比如同时具有多个特定性质的小分子或者蛋白质片段),以ChatGPT目前的能力还无法胜任。
另一方面,基础数据源无法得到保证。首当其冲的是准确性,ChatGPT没有接受过整个生物医学数据库的培训,也没有经过生物医学专家的测试或培训,所以AI系统的响应未必正确。临床部分,虽然ChatGPT可以进行一些医学检查,但AI工具具体的应用范围以及在通过监管机构认可等方面还需要更多讨论。此外,全球能否公开真实数据也还要打个问号。更重要的是,人类对医学仍然知之甚少。
晶泰科技联合创始人赖力鹏也曾表示,如何开源分享私有数据、防止滥用和数据偏见也都是类似生成式AI工具应用在生命科学领域中需要面对的问题。
而对于大分子药物能否利用生成式AI迅速生成,这个问题也仍然无解。
晶泰科技的一篇文章解释了一些原因:一是没有满足常规的以靶点为对象的药物设计理念,二是没有纳入对多种成药性目标(如免疫原性、理化性质)的考量。换句话说,上述技术可以一键生成接近“天然”、可以正常折叠表达的蛋白,并使其符合某种宽泛要求(如具备溶菌酶活性),但还不足以成药。
除了数据训练外,研发费用和时间精力也是不菲的一项投入,对于应用于医疗这一细分赛道众多且精细度高的领域更是如此。
另外,去年底由Facebook母公司Meta的Galactica生成式系统引发了大家对版权、剽窃等原创性问题的讨论,也为这类模型的发展添上了一些不稳定因素。该模型使用学术论文作为数据集进行训练,然而该系统按要求生成的文章实际上完全虚假。Meta几天后不得不撤回了这一系统。
从长远来看,生成式AI仍然具备颠覆现有AI的能力,而要获得更加通用、好用的模型,还需要更多领域相关的数据积累和算法创新。同时,由于相关方向跨学科的性质,各专业的科学家需要通力合作,以期产生新的变革。
说到底,AI只是一个辅助工具,即使帮助我们提高了寻找到靶点的概率,但成药的困难依旧,创新药仍然是一条漫长的“打怪升级”之路。
参考文献:
AI制药迈入临床,人工智能只是开发药的工具之一需冷静对待;贤集网ChatGPT是生物医药发展的新机遇?专家:暂不建议用于制药领域;生辉2022年回顾:风投宠儿AI+制药; 博勘医讯与默沙东、BMS携手同行!这些AI生物技术公司有何长处?| AI制药新风向;药明康德“生物版ChatGPT”,才是医药圈最值得关注的黑科技!;晶泰科技2022年AI制药投融资「图鉴」;医药魔方ChatGPT能够颠覆医疗AI吗?;动脉网