在过去的半年里,生成式AI得以大爆发。据了解,目前国内已经和将要发布的大模型超过100个。
更进一步,现在有更多的行业用户在思考该如何将生成式AI落地应用。这其中,既需要适当的方法论支持,也需要配套的数据战略,当然还离不开相应的算力提供。
在近日举行的2023亚马逊云科技中国峰会上,亚马逊云科技大中华区产品部总经理陈晓建和亚马逊云科技全球产品副总裁Matt Wood分享了他们的观点。在这里,我们从方法论入手,来看看生成式AI应该如何在行业当中落地。
与企业开展其他战略性举措一样,在进入生成式AI领域之前,首先要确立自己的方法论。Matt Wood站在亚马逊云科技的角度,提出了一套开启生成式AI旅程的方法论建议。
这个方法论分为五步,分别是:基于自己现有的数据战略去做构建;在组织内实现更广泛、更安全的生成式AI实验;为需求场景定制化模型;携手亚马逊云科技,探索无限可能;选择场景,即刻启程,构建未来。
从中可以看出,他的建议是企业从已有数据入手,这是生成式AI的基础,没有相应的数据就无法构建自己的大模型;最后则要落实到场景化应用当中去,为企业创造业务价值。
对于如何解锁生成式AI的价值,Matt Wood也提了四条建议。他表示:企业应该利用已有的一流基础模型,构建出色的生成式 AI 应用程序;提供安全私密的环境,使用私有数据来定制化这些模型;利用低成本、低延迟的定制芯片,借助专门构建的机器学习基础设施;借助专业代码生成工具,消除繁重工作并提高效率。
在上述几个方面,亚马逊云科技能够为企业提供相应的支持。比如利用基础模型应用构建工具Amazon Bedrock,企业可以方便地调用多种基础模型,包括AI21 Labs、Anthropic、Stability AI和亚马逊云科技自己的Titan,并在此基础上进行调优训练。Amazon SageMaker则是一个机器学习开发平台,帮助企业开发自己的AI模型。对于训练和推理,则提供Inferentia和Trainium芯片,以及相应的实例Trn1n和Inf2。Amazon CodeWhisperer则是一个AI编程助手,为开发者实时生成代码建议。
数据是生成式AI的起点,数据也将推动生成式AI的广泛应用,对于所有的组织企业来说都十分重要。
Matt Wood认为,云原生数据战略有三大核心特征:全面——提供适合任何用例的工具集,集成——轻松连接所有数据,受治理——构建端到端的数据治理。为帮助企业贯彻云原生数据战略,亚马逊云科技分别提供了相应的服务和支持。
在工具集方面,亚马逊云科技推出15种专门构建的云上托管数据库服务,为各类用户的应用场景提供完美契合的数据服务;数据分析服务已实现Serverless化,包括交互式查询服务Amazon Athena、大数据处理服务Amazon Managed Streaming for Apache Kafka (Amazon MSK)、实时分析服务Amazon Kinesis、数据仓库服务Amazon Redshift、数据集成服务Amazon Glue、商业智能服务Amazon QuickSight以及运营分析服务Amazon OpenSearch Service。
在数据连接方面,亚马逊云科技提出了Zero-ETL的愿景,致力于实现无缝的数据转换和调用,而用户不用编写任何的代码。Amazon Aurora则可以与Amazon Redshift进行Zero-ETL集成,允许使用 Amazon Redshift 对来自Aurora的PB级事务数据进行近实时分析和机器学习,而不必构建和维护复杂的数据管道来执行提取、转换和加载 (ETL) 操作。
在数据治理方面,亚马逊云科技去年推出的数据管理服务Amazon DataZone,让客户可以更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。
AI创新风潮带来了算力资源需求爆发,高性价比的算力资源尤其短缺。
不同于互联网巨头,企业对于算力成本更为敏感。尤其是随着大模型的应用,未来生成式AI的算力需求主要集中在推理上。企业需要找到运维简单、性价比高、无处不在、安全合规的算力资源。
陈晓建介绍说,面对算力需求的井喷,亚马逊云科技通过自研芯片创新、弹性的计算存储组合以及Serverless架构等,来满足客户对于多样算力的需求。
针对算力紧缺需求,亚马逊云科技采用多种芯片来提供全面深入的基础设施能力,包括Intel、AMD、英伟达,和自研的CPU及加速芯片产品。其中自研产品包括基础架构芯片Nitro、Arm架构通用处理器Graviton3、机器学习训练芯片Trainium、机器学习推理芯片Inferentia等。
针对弹性计算资源需求,亚马逊云科技提供600多种不同的计算实例,从处理器、网络和存储等各种服务,都能够与计算进行很好的结合,以积木的方式搭建出丰富灵活的计算实例的资源,满足多种不同算力的要求。比如提供了多达八种的存储层级,无论是冷热温冻数据都可以找到合适的存储层级。
针对简化算力应用需求,亚马逊云科技推动云服务全面迈向Serverless,将云的弹性、敏捷性、按需付费的特性发挥到极致。随着云服务全面Serverless时代的开启,用户无需预置或管理基础设施,就可以运行几乎任何类型的应用程序或后端服务代码,最大限度减轻运维工作,并增加业务敏捷性,更好地应对业务的各种不确定性。
针对无处不在的算力需求,亚马逊云科技可以将云服务交付到客户需要的任何地方,从全球数据中心,到中心城市、5G网络,再到本地数据中心、边缘和物联网,甚至是弱网环境。同时,其遍布全球31个区域的99个可用区,可以覆盖245个国家和地区,能够为出海中国企业提供全球化的算力支持。
针对安全合规的需求,亚马逊云科技具有支持全球各个国家和地区业务合规能力,几乎能够满足全球所有监管机构的合规性要求。其支持143项安全标准与合规认证,有超过300种安全合规服务,能够帮助客户方便地搭建满足全球各地安全和合规要求的算力架构。
如今,生成式AI正在成为企业新一轮业务创新的重要工具,成为下一代的生产力工具。
陈晓建表示,现今创新至关重要,而云技术能更快、更高效地帮助企业创新,亚马逊云科技广泛和深入的服务可以让客户摆脱基础架构的束缚,专注于创新。