去年底,OpenAI掀起的生成式AI浪潮席卷全球。
如今,生成式AI赛道依然火爆,越来越多行业用户也意识到生成式AI将对于其业务带来巨大影响。但生成式AI应用的打造,除了大语言模型之外,其实更像是一个复杂的系统工程,涉及到计算、数据、模型调优、应用开发等一系列复杂的工作。
因此,“入局”大模型依然是一件很高门槛的事情。如何让生成式AI门槛降低、惠及行业用户?近日,在亚马逊云科技生成式AI构建者大会上,亚马逊云科技带来了它的答案。
亚马逊云科技大中华区产品部总经理陈晓建介绍,亚马逊云科技正从应用场景、工具和基础设施、数据基座、AI原生应用构建和生成式AI服务五个层面帮助企业降低生成式AI应用开发门槛,加速实现生成式AI潜力的全面释放。
麦肯锡《生成式人工智能的经济潜力:下一波生产力浪潮》报告显示,分析当前63种生成式AI应用于各行各业,将为全球经济每年带来2.6万亿至4.4万亿美元的增长。
可以说,生成式AI已经初具产业魅力,吸引了越来越多企业的目光。与此同时,生成式AI赛道也涌入了大批公司,中国市场更是上演了“百模大战”。对于亚马逊云科技等云服务商而言,生成式AI也是市场中必须争夺的一个战略制高点。
从今年4月起,亚马逊云科技推出包括Amazon Bedrock、Amazon Titan基础模型、Amazon CodeWhisperer AI编程工具等多款生成式AI产品和服务。
其中Amazon Bedrock是一项全托管生成式AI服务,它允许用户通过API访问亚马逊云科技和第三方基础模型提供商的预训练基础模型。目前,Amazon Bedrock支持Meta、Anthropic、Stability AI、AI21 Labs、Cohere等第三方开发商的主流大模型。
毫无疑问,Amazon Bedrock代表了云服务商在大模型服务上的一个重要方向,即利用云服务商自身的基础设施优势,通过大模型服务来屏蔽基础设施的复杂性,降低大模型使用的门槛。陈晓建介绍,Amazon Bedrock是无服务器化的云服务,并且提供广泛的模型选择和数据隐私保护,用户可以轻松构建和扩展生成式AI应用程序。
以金山办公为例,其在年初将大语言模型能力引入到办公产品之中时,就遇到了基础模型性能有限、数据安全难保障、高额投入等一系列挑战。为此,金山办公成为Amazon Bedrock国内第一批预览版用户,利用Amazon Bedrock支持大模型在金山办公软件多个场景中的需求。
此外,Amazon CodeWhisperer是一款AI编程工具。众所周知,编程是生成式AI技术快速应用的领域之一,众多开发者开始尝试利用AI编程工具来提升开发效率。Amazon CodeWhisperer在基础模型高级选项中使用,可以实时生成代码建议,使用Amazon CodeWhisperer的开发者完成任务的速度平均快57%,成功率高27%。
在数据处理层面,亚马逊云科技推出了,Amazon DataZone数据治理服务,可以跨组织边界发现、访问、共享和治理大规模数据,并减少企业内部成员访问数据和使用分析工具时繁重的工作量。针对检索增强生成(RAG,Retrieval Augment GenerationRAG)需要处理的向量数据,亚马逊云科技为Amazon OpenSearch Service、Amazon Aurora PostgreSQL和 Amazon RDS for PostgreSQL加入向量数据库功能。
在基础设施层面,亚马逊云科技提供客户最为广泛的GPU和AI加速器服务,包括英伟达最新GPU H100的计算实例Amazon EC2 P5,基于自研机器学习推理芯片Amazon Inferentia2的Amazon EC2 Inf2实例、基于自研机器学习训练芯片Amazon Trainium的Amazon EC2 Trn1实例等,用户可以根据需求来灵活选择不同的基础设施服务。
事实上,开发生成式AI应用就像一个充满挑战的系统工程,不是简单的产品、服务堆叠。陈晓建总结道:“生成式AI应用就像海面上的冰山,大模型是被大多数人看到的冰山一角,底部则需要数据分析、数据安全等一系列服务。亚马逊云科技提供完整的端到端生成式AI技术栈,来加速用户最终的商业化落地。”
毫无疑问,生成式AI正处于产业发展起步阶段,对绝大多数企业而言都是陌生的,很多企业对于生成式AI是“想入局却不知道怎么操作”的状态。
亚马逊云科技通过对大量企业服务的积累,逐步给出了“端到端的构建生成式AI应用”的关键路径五步走的方法论。
首先,亚马逊云科技建议用户在尝试生成式AI时需要选择合适的场景入手,尤其是典型、经过 验证的场景进行尝试。当前,生成式AI对营销与销售、产品与研发、软件工程和客户运营等工作能够带来显著收益,企业选择这些场景入手既能降低门槛和风险,也能够提升业务效率。
其次,亚马逊云科技建议认为用户需要通过专门构建的生成式AI工具和基础设施来快速搭建生成式AI应用。目前看,没有一个基础模型可以适用于所有的业务场景,用户需要根据自身业务场景的需求特点去选择最合适的模型。此时,大模型云服务的优势就得到凸显;类似Amazon Bedrock这样的大模型云服务可以快速让用户搭建生成式AI应用。
第三,生成式AI离不开强大的的数据基座,需要融合企业私有化数据。众所周知,大模型的背后是海量数据的存储、汇聚、打通、安全管理等一系列的数据工程化工作。为此,亚马逊云科技认为端到端的数据服务,有效集成和治理数据、安全策略,通过Zero ETL策略可以让数据在生成式AI应用开发中充分发挥作用。
以西门子中国为例,面对企业内部信息分散、数据信息传递能力不足、知识运营能力缺乏等情况,西门子与亚马逊云科技一起合作,利用坚实的数据底座,成功在三个月上线一款生成式AI应用--“小禹”助手。
第四,生成式AI应该是AI原生应用构建。亚马逊云科技认为微服务化、Serverless First、数据洞察、数据全等可以帮助企业减少重复造轮子的工作。例如,微服务化可以让应用在不断变化需求之际,还能保持快速进化和迭代;Serverless First则可以帮助用户从繁重的基础架构运维、部署中解脱出来。
最后,亚马逊云科技建议使用生成式AI服务来降低工作的复杂性。亚马逊云科技认为开箱即用的生成式AI服务、工具可以大幅提升效率。
总体来看,生成式AI正处于产业发展的早期,大模型、工具链当前正是百花齐放的状态,行业用户也在探寻生成式AI的落地场景,这无疑注定了生成式AI落地式一个复杂的过程。根据当前产业界面临的问题,亚马逊云科技的端到端全栈技术服务以及清晰的方法论路径,无疑为当前生成式AI普惠提供了重要的参考价值。
“生成式AI长期发展离不开强大的合作伙伴生态,需要大家一起努力去解决生成式AI引用构建中遇到的各种技术问题。面向未来,亚马逊云科技将继续携手生态伙伴逐步持续完善生成式AI的体系,助力生成式AI真正走向普惠。”陈晓建最后表示道。