本文字数: 2000, 阅读完需: 10 分钟
在亚马逊云科技中国峰会2024上,演讲者黄庆春分享了生成式人工智能在生命科学领域的应用案例。他阐述了生成式人工智能如何加速药物研发过程,包括:1)通过融合私有数据和公开数据,生成式人工智能可以为医生提供个性化的诊断建议和临床试验推荐;2)在临床试验设计和监控过程中,生成式人工智能可以优化实验设计,降低实验失败率;3)生成式人工智能可以帮助企业快速验证创新想法,实现全员创新。演讲重点强调了生成式人工智能在提高药物研发效率、降低成本、加速创新方面的巨大潜力,同时也强调了在医疗领域应用人工智能需要遵循安全合规的原则。
以下是小编为您整理的本次演讲的精华,共1700字,阅读时间大约是8分钟。
在生命科学领域,当代药物研发已不再是单一学科可以完成的任务,而需要多学科知识的融合。知识呈现爆炸式增长,涌现出大量新兴学科,如基因组学、蛋白质组学、合成生物学等。与此同时,现代药物不仅限于小分子药物,还包括大分子药物、细胞治疗药物,甚至基因编辑药物等。因此,单一学科的知识已不足以应对这一挑战,我们进入了一个知识大爆发、多学科融合的时代。
第二个推动力来自计算能力的大幅提升。据演讲者所言,英伟达公司的股票已经突破2万亿美元,而他曾在那里工作时,英伟达的股票仅为80多美元,现在则超过1000美元。这反映出计算能力的飞跃进步。过去,要在10的64次方的化学空间中寻找一种药物,即使使用最早期的双路服务器,也需要耗费100多年的时间。但现在,借助GPU等新型算力,这一过程只需几个小时即可完成,且在亚马逊云科技云平台上变得更加简单高效。
有了多学科融合和强大的计算能力,我们开始进行创新,应用生成式人工智能。虽然人工智能在生命科学领域已有多年应用,但生成式人工智能与传统人工智能在药物研发链条中的区别在于,生成式人工智能能够融合私有数据与公开知识,为特定场景提供差异化的解决方案。
生成式人工智能在药物研发的全流程中都有应用,从早期研发到临床试验,再到上市后的营销合规等,无一例外。其中,临床试验环节是整个研发过程中最为耗时耗钱的部分。据统计,一款新药的研发周期超过10年,耗资20亿美元,但成功率不到3%。主要资金和时间被消耗在三期临床试验上,因为新药上市前必须确保其无毒且有效。
生成式人工智能可能无法将10年的研发周期缩短为5年,因为一些实验需要经历一定时间。但它能够提高那3%的低迷成功率。例如,通过优化试验设计,评估入组标准的合理性,避免在多年后发现实验终点设置不当。如演讲者所言,若一款降压药的实验终点被设置为130毫米汞柱,但实际上该药物无法达到这一指标,只能到140毫米汞柱,那么之前数年的努力就将付诸东流。生成式人工智能可以借鉴公开文献和企业自身历史数据,在试验设计阶段就发现并纠正这种缺陷。
另一方面,生成式人工智能还可以实时监控试验过程,一旦发现异常便报警,从而降低失败风险。通过对EDC(电子数据采集)和EHR(电子健康记录)等数据的学习,系统能够帮助临床人员及时发现并处理问题,避免多年努力白费。
为了展示生成式人工智能的应用,演讲者演示了一款名为”医学助理”的系统。这是一个融合了医生私有病历数据、公开医学文献等多源数据的对话系统。系统首先会根据具体病人情况,从电子病历中调取相关影像检查、基因检测结果、既往病史等私有信息。接着,它会检索公开文献数据库PubMed,找到与该病人基因变异相似的医学研究结果。
将私有数据与公开知识相结合后,医生可以进一步询问系统,是否有适合该病人参加的临床试验,系统会根据两者的融合,为临床决策提供支持和建议。整个过程展现了生成式人工智能将私有数据与公开知识相融合、为特定场景提供差异化解决方案的能力。该系统利用了亚马逊云科技的语音识别和自然语言处理等服务。
不过,生成式人工智能在医疗领域也面临一些挑战。首先是合规审批的问题,医疗领域对任何改变都需要向监管机构报备。其次是多源异构数据的整合,医疗数据来源复杂、格式多样,大部分为非结构化数据。再者是数据的私有化,当代药物研发已不再是单家机构的独立工作,而是多家机构的合作,数据分散在不同单位。根据麦肯锡的报告,超过50%的新药研发需要多家机构合作完成。最后是如何从海量数据中获得医学洞见,提出有价值的发现和见解。
为了应对这些挑战,演讲者提出了一些建议:首先是小步快跑,利用具有商业意义的场景快速尝试新技术;其次是融合私有数据,只有将企业自身数据融入,才能产生差异化的解决方案;再者是选择合适的场景,且该场景需有清晰的投入产出比;最后是持续生产,一旦解决方案进入真实环境,就需要考虑长期的运营策略。
接下来,演讲者分享了医药公司吉利德与亚马逊云科技在生成式人工智能领域的合作案例。吉利德曾凭借治愈乙型肝炎的药物而扬名,如今正在向肿瘤、细胞治疗等新领域转型,需要快速积累新知识和技术。为在肿瘤药物这一红海市场中占据差异化优势,吉利德充分利用了生成式人工智能。
在使用生成式人工智能时,吉利德遵循了以下原则:一是在安全合规的前提下,将数据存储在亚马逊云科技的私有云VPC(虚拟私有云)上,全程加密,数据不会流出;二是鼓励全员使用生成式人工智能,充分调动人员积极性;三是对有价值的想法进行验证,一旦ROI(投资回报率)充分,便积极将其推向市场。
吉利德为什么选择在亚马逊云科技云平台上实施生成式人工智能?首先是亚马逊云科技提供了安全合规的基础架构;其次是亚马逊云科技拥有数据清理、优化的工具,能够提升数据质量;最后是亚马逊云科技的三层架构,可自建模型、微调现有模型,或直接使用现成模型快速将想法转化为临床应用。
为推动全员创新,吉利德与亚马逊云科技共同建立了生成式人工智能创新工场。任何员工均可将自己的想法和数据在工场中进行概念验证,一旦通过验证并确认商业价值,便可推向生产环节。通过这一平台,来自一线员工的创新想法得以实现,目前已有30多个应用投入生产,覆盖药物研发的各个环节。
在临床试验领域,吉利德利用生成式人工智能分三步走:首先是数据清理,将来自不同源头的非结构化数据进行对齐整合;其次是问答挖掘,从海量数据中提取有价值的信息;最后是新idea生成,产生新的研究思路和解决方案。
具体到临床试验,吉利德运用生成式人工智能在两个方面:一是优化试验设计,通过学习公开文献和自身历史数据,评估新试验的入组标准、终点指标等是否合理;二是实时监控试验过程,对EDC和EHR等数据进行学习,一旦发现异常便报警,帮助临床人员及时发现并处理问题。
吉利德利用了亚马逊云科技的Amazon Health Lake等服务,将不同来源的医疗数据统一存储和分析。在监控试验过程时,它使用了一款名为AmaZing的对话系统,该系统能以自然语言的形式循序渐进地查询严谨的实验数据,为临床人员提供实时支持。
通过这些应用,吉利德显著降低了临床试验的失败率,避免了因设计缺陷或管理疏漏而导致的多年努力白费。除临床试验外,吉利德的创新工场还孵化了30多个应用,覆盖药物研发的各个环节,为企业注入了创新活力。
总的来说,生成式人工智能为传统的生命科学研发注入了新的动力。它能够融合多源异构数据,为特定场景提供差异化的解决方案,帮助企业在激烈的竞争中占据优势。虽然应用过程中存在合规审批、数据私有化等挑战,但只要遵循相应原则,选择合适的场景,融合私有数据,便可最大限度发挥生成式人工智能的价值。
生命科学是人工智能最有价值的应用领域之一。通过与亚马逊云科技的合作,利用其安全合规的基础架构、数据处理工具以及灵活的模型架构,吉利德等企业已在这一领域取得了卓越的创新成就。相信在不久的将来,生成式人工智能必将为生命科学的发展带来更多革命性的变革。
下面是一些演讲现场的精彩瞬间:
演讲者感谢在场观众,并表示希望自己的演讲能为大家带来收获,同时也感到有些紧张,因为演讲将被评分。
亚马逊云科技中国峰会2024:生命科学领域正处于知识大爆发和多学科融合的时代,传统的小分子药物正被大分子药物、细胞治疗和基因编辑技术所取代。
郑总解释了药物研发过程中临床试验的重要性,以及临床试验失败可能导致药企市值大幅下跌。
亚马逊云科技中国峰会2024上,演示了如何将患者的私有数据(如影像检查、基因测序等)融入大模型,为医生提供个性化的诊断建议。
通过生成式人工智能模型分析实验设计和公开数据,快速优化临床试验方案
吉利德通过云计算技术优化临床实验过程,提高实验效率,降低失败率,加快新药研发进程。
生成式人工智能正在加速生命科学领域的创新转型。在药物研发过程中,生成式人工智能可以发挥重要作用:
生成式人工智能的应用需要遵循安全合规、融入私有数据、选择合适场景并持续运营。通过与亚马逊云科技的合作,制药企业如吉利德已在临床试验、药物研发等领域广泛应用生成式人工智能,实现创新转型。生成式人工智能正成为推动生命科学创新的关键驱动力。
2024年5月29日,亚马逊云科技中国峰会在上海召开。峰会期间,亚马逊云科技全球副总裁、亚马逊云科技大中华区总裁储瑞松全面阐述了亚马逊云科技如何利用在算力、模型、以及应用层面丰富的产品和服务,成为企业构建和应用生成式 AI 的首选。此外,活动还详细介绍了亚马逊云科技秉承客户至尚的原则,通过与本地合作伙伴一起支持行业客户数字化转型和创新,提供安全、稳定、可信赖的服务,以及持续深耕本地、链接全球,助力客户在中国和全球化发展的道路上取得成功。