当前位置:首页|资讯|亚马逊|生成式AI

亚马逊云科技:生成式AI在生命科学领域的落地与展望

作者:沧海一生笑2024发布时间:2024-06-17

关键字: [亚马逊云科技中国峰会2024, OmniML, 生成式Ai, 生命科学, 数据价值, Ai模型, 工作流程]

本文字数: 3500, 阅读完需: 18 分钟

导读

在2024亚马逊云科技中国峰会上,张占分享了生成式AI在生命科学领域的展望。他阐述了生成式AI如何在新药研发、商业化、患者服务等环节赋能生命科学行业,提高效率和创新能力;介绍了亚马逊云科技的ByteRock、HealthLake、OmniML等服务,助力企业构建生成式AI应用;并分享了飞利浦利用生成式AI提升医疗服务质量、降低成本的实践案例。张占呼吁在2024年共同夯实数据、模型、平台等基础设施,加速生成式AI在生命科学领域的落地。

演讲精华

以下是小编为您整理的本次演讲的精华,共3200字,阅读时间大约是16分钟。

在2024年的亚马逊云科技中国峰会上,一位来自亚马逊云科技的主讲人分享了关于生成式人工智能(AI)在生命科学领域的应用前景,以及亚马逊云科技在这一领域的相关产品与服务。他的演讲内容详细总结如下:

主讲人首先回顾了过去一年生成式AI的发展历程。他提到,在去年的同一个峰会上,与会者们探讨了生成式AI的基础概念,如何定义生成式AI、基础模型的选择,以及如何选择合适的用例来开展第一次尝试。在过去的一年里,坐在会场的各位很可能与亚马逊云科技的团队一起开展了一些生成式AI的试点和概念验证。

同时,亚马逊云科技也发布了一项重磅合作,那就是与Anthropic达成全球战略合作,并陆续发布了Anthropic的CloudStreet等炙手可热的大模型系列。在与客户的合作方面,主讲人自豪地表示,全球十大制药企业中有9家已经是亚马逊生成式AI的客户,他们基于亚马逊云平台构建了自身的生成式AI应用,以及其他机器学习和AI应用。

作为例证,主讲人提到,在去年年底的Amazon Web Services re:re:Invent上,来自辉瑞的首席数字官和首席技术官Lydia分享了一个故事。辉瑞不仅进行了大量从内部数据中心迁移到云端的工作,而且借助亚马逊云平台的技术,构建了自身的生成式AI平台,取名为Vox。基于Vox平台,辉瑞自主开发了多达17个不同的生成式AI应用,应用场景涵盖从癌症靶点发现、专利申报文档初步撰写,到医学文档撰写、供应链风险事件识别与优化等多个领域。辉瑞预计,在未来几年,生成式AI将为公司带来高达10亿美元的成本节省。

除了与客户的广泛而深入的合作之外,整个生命科学行业也在生成式AI领域进行大量融合和创新。主讲人举例说,金泰科技与Lilly达成了一项AI小分子发现的合作。在这项合作中,金泰科技将借助其AI药物研发平台和自动化实验室技术,为Lilly从头设计并交付候选化合物。这个例子展示了中国生物科技行业的不断崛起,同时也反映出生物科技公司与传统制药企业在生成式AI领域的融合与合作日益紧密。

根据过去一年与客户的共同实践,主讲人总结出在生成式AI领域有三个关键路径:第一是选择合适的用例,并最大化数据价值;第二是构建并部署AI模型;第三是转变工作流程。

在选择用例方面,主讲人指出,生成式AI在生命科学领域有三大通用的业务场景分类:

第一类场景是关于用户,生成式AI可以通过生成功能增强用户体验,比如为客户提供聊天机器人、虚拟助手等个性化的交互式对话方式。

第二类场景是关于员工,即与生产力相关,通过生成式AI的赋能,可以让员工从繁复的日常重复低价值工作中解脱出来,聚焦于更具创造力的工作,如对话式内容搜索、内容总结,甚至基于生成式AI的精准翻译等。

第三类场景是商业运营,包括来自不同阶段或类型的文档处理、内容审查,在生产制造领域的预测性维护等,都可以通过生成式AI实现再造,获得更好的效果。

在生命科学这个纵深领域,生成式AI可以应用于从研发到患者的五个阶段。主讲人分别举例说明:

在研发阶段,以新药研发为例,一家医药公司想要研发一种新药,需要花费十年以上的时间、10亿美元以上的资金,但最终只有不到10%的成功率能够将新药推向上市。由于研发阶段的高成本、高风险特征,医药公司一直在探索如何利用生成式AI来加速这一阶段、节约时间和资金投入。

有些客户正在与亚马逊云科技合作,结合内部医学资料库和外部公开数据,通过生成式AI自动快速地筛选生物标志物、发现靶点。在高通量筛选领域,传统上医药公司通过人工方式进行升空版识别和后续筛选,效率较低。而现在,借助生成式AI中的计算机视觉技术,可以自动识别升空版反应,并通过机器人技术快速重复进行数百次实验,实现真正的高通量筛选。

在商业化领域,生成式AI系统可以更自主地从不同数据源获取信息,为市场人员提供更好的下一步行动决策,帮助他们更精准地服务医疗保健专业人士。在医学事务领域,很多生命科学公司正在利用生成式AI的能力自动识别不良反应事件,并撰写相关报告草稿,供人工进一步审核和提交。

最后是患者这一环节,生成式AI不仅可以为患者提供更具交互性的教育和服务支持,对于医疗器械公司而言,还可以赋能产品端,提供更智能的远程医疗、远程诊断等能力。医疗器械厂商的售后工程师也可以借助生成式AI,从海量售后文档中快速找到所需信息,完成售后任务,甚至可以将这一工作交给用户的运维人员自行服务。

在介绍了如何选择合适的用例后,主讲人转而探讨如何选择合适的AI模型。他表示,随着大模型技术的不断发展,尤其是当前参数量已经达到了非常高的量级,在绝大多数行业和具有一定纵深的领域场景下,通用大模型所具备的能力已经足以胜任绝大部分文字类的通用生成式AI应用。

用户可以结合通用大模型的基础能力,以及自身的私域数据,以AI驱动的方式为企业或组织提供具有上下文的生成式AI能力。对于生命科学行业来说,知识产权保护和安全合规至关重要。如果使用通用大模型或将内部私域数据合并进去,如何保护内部数据的安全和合规就成为一个问题。

主讲人介绍说,亚马逊的ByteRock就是这样一款平台级服务。ByteRock可以帮助用户通过私有化部署的方式,结合公开数据和私有数据,训练和部署企业内部的生成式AI,解决了业界普遍担心的大模型安全问题。ByteRock提供了多款内置模型供用户选择,包括之前提到的Anthropic的CloudStreet系列、亚马逊自有的Titan大模型,以及其他知名大模型,用户也可以自主导入其他模型。借助这一平台级大模型服务,用户可以在大模型技术不断迭代的当下,自由比对和选择不断涌现的新模型,而不需要被锁定在单一模型上。

主讲人继而指出,在生命科学领域,尤其是生物学领域,除了文字为主的通用大模型外,我们依然需要更多有行业细分的模型来更好处理相应的数据类型,比如蛋白质组学、DNA、RNA等。在大模型时代之前,这些领域就已经具备了非常完善的算法。那么,用户如何在大模型时代更方便地使用这些算法并编排工作流呢?

亚马逊的HealthLake服务可以帮助用户轻松选择、管理和编排生命科学的基础模型。科学家可以存储和管理多维数据,导入并存储多维数据,然后轻松搭建生物分析流程,调用预置的生物基础模型,或者导入自定义模型,从而获得多维度的生物学见解。传统上,用户需要自己进行不同算法的编排和调度,但有了HealthLake,这一切工作将变得更加简单。HealthLake还提供了一个生物学大模型集市,用户可以在这里寻找并采用商业化的生物学大模型。如果在座的同行也在产生自己的算法或大模型,也欢迎与亚马逊云科技探讨是否可以将算法和模型部署到HealthLake上,推广给更多用户。

介绍了选择合适用例和部署AI模型之后,主讲人转而探讨如何从用户问题出发,转变现有工作流程。他列举了三个可能来自用户或客户的典型问题,比如”我如何更好地结合内外部数据识别靶点”、“我如何应对不断变化的报表和数据需求”、“我如何快速了解某位关键意见领袖的医学观点”等。随着生成式AI的不断普及,用户的兴趣和问题也在逐渐增加。

因此,企业和组织需要构建一个生成式AI的基础平台,以便能够快速、可扩展地构建后续的生成式AI实验,应对不断增长的用户需求。亚马逊推出了OmniML这一平台服务,通过该解决方案,用户可以获取OmniML提供的各种基础模块,包括管理、实验、流水线、特征库模型、模型注册、运营时应用集市等。借助这些基础模块,用户在面对每一个新的用例时,不再需要从头开始构建,而可以互相叠加使用之前构建的能力。

除了基础平台之外,亚马逊云科技还推出了一些预置的生成式AI流程,包括应对前述三个典型问题的”医学文档检索”、“医学文档摘要”、“医药智能BI”和”市场分析”等模块。借助这些模块,用户可以更方便地使用和构建自身的大模型工作流。

亚马逊云科技所畅想的是,在不久的将来,企业内部的用户甚至都可以成为OmniML上的用户,自行构建基础级的生成式AI应用。通过介绍这三个关键步骤,主讲人总结了生成式AI构建的关键路径。

接下来,主讲人邀请了飞利浦大中华区副总裁IT负责人马赛尔分享飞利浦在数字化、数据以及生成式AI方面的历程。

马赛尔强调,AI已经来临并将长期存在,这已不再是炒作,而是从趋势转向现实。许多公司都在致力于生成式AI的用例,飞利浦也从概念验证阶段进入到将AI融入日常实践和产品的阶段。如果错过了AI的机遇,将来就难以保持竞争力。他预计,在未来3到5年内,生成式AI将变得非常成熟,如果到那时还没有拥抱这一技术,企业就可能面临关门的风险。因此,作为技术人员,我们有责任拥抱生成式AI,并确保业务部门看到其带来的好处,共同实现AI的落地应用。

马赛尔简要介绍了飞利浦的背景。飞利浦已有130多年的历史,但现在已不再是电视、收音机或灯泡的制造商,而是一家医疗公司。飞利浦的核心目标是改善人们的生活,到2030年,他们希望能够影响和改善25亿人的生活。飞利浦在100多个国家开展业务,中国是他们的第二大市场,在华员工超过8000人,目前已经影响了4.92亿中国人的生活。

飞利浦之所以能够持续130多年并取得成功,有两个关键原因:一是公司保持敏捷,随着技术或环境的变化而适时调整;二是不断创新,创新是飞利浦的关键。不同于过去,当今的创新已不能是孤军作战,如果孤军作战,将会过于缓慢。因此,飞利浦需要建立合作伙伴生态系统,共同推动创新。在生成式AI领域,IDeaOps就是飞利浦的合作伙伴之一,正在与飞利浦一起将AI应用于产品和业务中。

马赛尔分享了三个飞利浦应用生成式AI的例子:

第一个例子是”Model and Child Care”应用程序,面向准备生育的人群,从怀孕第一周到39周或41周,旨在让用户获得尽可能舒适的体验。该应用程序的底层数据库包含1500篇科学文章,可以为用户提供建议,确保怀孕过程尽可舒适。该应用还汇集了来自22个国家、65百万用户的多语种反馈。通过生成式AI,该应用可以提供简单的交互界面,让用户提出简单的问题,并从海量信息中获取最相关的答复,大幅提升用户体验。随着用户数量的增长,飞利浦也将获得更多数据,从而能够提供更好的生成式AI效果,形成一个良性循环。

第二个例子是医疗记录。在医院,医生花费大量时间在电脑前记录病历,这是一项低效的重复性工作。飞利浦希望通过语音转文本技术,让医生只需对着麦克风说话,就能自动生成文字记录,从而将医生的注意力集中在与患者的互动上。这种无缝记录方式可以确保医疗记录的一致性和完整性,进而为患者提供更好的服务。

第三个例子是在医学影像领域的应用。飞利浦的设备每年会产生大量医学影像,医生需要对这些影像进行解读,判断是否存在疾病。有经验的医生可以快速高效地完成这一工作,但对于初级医生来说,还需要一些实践。生成式AI可以为医生提供建议,辅助他们更好地解读影像,发现疾病的模式,从而实现更早期的预测和诊断。这听起来似乎有些违背常理,因为飞利浦是一家医疗设备公司,理应希望售出更多设备。但飞利浦的终极目标是预防疾病,避免人们生病,因此预防性医疗比被动治疗更加重要。

马赛尔接着解释了飞利浦如何通过创新来实现这一目标,并以合规和可扩展的方式交付服务。他总结了四个关键维度:提高患者健康结果、更好地服务医院、提高医院运营效率、以更实惠的方式提供医疗服务。数据技术和生成式AI正是实现这一目标的关键驱动力。

除了产品和客户视角,马赛尔还分享了飞利浦如何在内部流程中应用生成式AI。他表示,自己团队面临的最大挑战是数据质量,以及如何获取正确的数据来训练模型。正如主讲人所说,模型的好坏取决于数据质量。因此,飞利浦首先利用生成式AI来确保数据质量,因为只有高质量的数据,才能获得高质量的见解。飞利浦采取循序渐进的方式,从小处着手,再逐步扩大应用范围,包括客户渠道和用户界面的优化。

为了确保数据一致性,飞利浦实施了中国数据湖,完全基于亚马逊的技术,不仅能够导入原始数据,还可以创建飞利浦特有的数据模型,为生成式AI、客户洞见或供应链洞见等提供数据支持。

马赛尔分享了两个跨制造和商业领域的用例。在制造方面,飞利浦将所有质量数据上传到数据湖,从而获得预测工厂设备何时需要维护的能力,提高了设备运行时间和效率,这对于向客户交付产品至关重要。在商业领域,飞利浦引入了一种数据驱动的方法,取代了过去纯粹依赖个人经验和专家判断为客户提供建议的做法,这使得飞利浦能够为医院提供更多不同的商业建议。

最后,马赛尔介绍了飞利浦的远程服务。飞利浦在医院部署了大量设备,通过与亚马逊的合作,可以远程连接这些设备并捕获数据。这一方面可以确保第一次就能正确修复故障,无需现场服务人员到场即可远程修复;另一方面,通过采集的海量数据,飞利浦可以预测故障发生,实现预测性维护,从而避免医疗设备停机,确保为中国大量患者提供无间断服务。飞利浦还在开发新的硬件功能,以提高医院的运营效率,创造新的商业机会。

为确保合规,飞利浦在中国建立了本地数据中心,无需跨境传输数据。马赛尔最后呼吁,生成式AI已经来临并将长期存在,要充分利用好数据基础并应用合适的模型。现在开始学习和实践生成式AI,就能在未来几年内抢占先机,否则就有可能被竞争对手远远甩在身后。

总的来说,主讲人和马赛尔的分享全面介绍了生成式AI在生命科学领域的应用前景、亚马逊云科技的相关产品服务体系、以及飞利浦的实践案例,为在座人士描绘了一幅生成式AI在该行业落地的宏伟蓝图。

下面是一些演讲现场的精彩瞬间:

在亚马逊云科技中国峰会2024上,Rob和嘉宾们分享了语音计算和生成式AI的最新趋势,并宣布了雄心勃勃的计划和联盟成立。

如果你错过了人工智能的机遇,未来你将无法在市场上保持竞争力。

因此,我们必须紧抓人工智能技术,确保我们的业务从中获益。

亚马逊云科技中国峰会2024上,演讲者阐述了如何利用语音转文本技术来简化医疗记录流程,提高医生与患者的互动效率,为患者提供更好的服务。

通过人工智能辅助医生诊断疾病,利用图像识别技术发现疾病模式,提高诊断准确性。

亚马逊云科技致力于通过创新技术帮助医院提高工作效率,改善患者体验,降低医疗成本,为患者提供更优质、更实惠的医疗服务。

借助云技术和大数据分析,亚马逊云科技为医疗设备提供远程诊断和预测性维护服务,确保医院设备高效运行。

总结

生成式AI在生命科学领域的落地与展望:

生成式AI已成为日常接触的技术,在生命科学行业中具有广阔应用前景。本次峰会聚焦生命科学行业,探讨生成式AI在该领域的当下和未来。

  1. 生成式AI在生命科学行业中的三大关键路径:选择合适用例并最大化数据价值;构建并部署AI模型;转变工作流程。
  2. 通用大模型与行业特有模型的选择:通用大模型结合私域数据可满足大部分场景,亚马逊提供ByteRock和HealthLake等服务支持模型选择和部署。
  3. 工作流程再造:亚马逊推出OmniML平台和预置流程模块,帮助企业快速构建生成式AI工作流。
  4. 生成式AI在生命科学行业中的应用案例:新药研发加速、高通量筛选、商业化决策支持、医学事务自动化等,有望带来巨大价值。
  5. 亚马逊云科技致力成为生命科学与科技的纽带,提供全方位支持,共同夯实基础设施,加速生成式AI在生命科学领域的落地。2024年将是生命科学企业在该领域的落地之年。

2024年5月29日,亚马逊云科技中国峰会在上海召开。峰会期间,亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松全面阐述了亚马逊云科技如何利用在算力、模型、以及应用层面丰富的产品和服务,成为企业构建和应用生成式 AI 的首选。此外,活动还详细介绍了亚马逊云科技秉承客户至尚的原则,通过与本地合作伙伴一起支持行业客户数字化转型和创新,提供安全、稳定、可信赖的服务,以及持续深耕本地、链接全球,助力客户在中国和全球化发展的道路上取得成功。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1