亚马逊云科技大中华区产品部总经理 陈晓建先生
在“百模大战”的当下,以大模型为代表的生成式AI正在以前所未有的速度快速成为人工智能发展方向的排头兵。然而,生成式AI并不仅仅只有大模型,在10月下旬,亚马逊云科技举办的生成式AI构建者大会上,亚马逊云科技大中华区产品部总经理陈晓建在做主题为“赋能生成式AI新时代,助力数据和AI普惠”的演讲时提到,整个生成式AI应用就像是浮在海面的冰山,露在海面上方能被大多数人看到的冰山一角就像是基础模型,而在冰川的底部同样需要诸如如加速芯片,数据库,数据分析,数据安全服务等基础模型以外的服务来支撑。那么,生成式AI到底能够为创新性企业带来怎样的运营和服务改善?亚马逊云科技又能在生成式AI领域贡献什么?在这场汇集产业上下游的生成式AI构建者大会上已经有了答案。
此次大会设立了三大分会场,分别探讨应用基座、数据战略和AI原生等生成式AI领域的热门话题。同时,为了帮助更多的开发者体验到生成式AI时代开发的魅力,大会还设立了开发者论坛和动力训练营。这些活动旨在为开发者提供实用的指导和支持,能够帮助开发者更好地理解和应用生成式AI技术。另外,西门子集团、金山办公软件以及科思创中国等亚马逊云科技生成式AI创新的代表客户也在此次大会上分享了各自的创新案例,为参会者提供了宝贵的经验和启示。
而作为大会的举办方,亚马逊云科技目前正在致力于应用场景、工具和基础设施、数据基座、AI原生应用构建和生成式AI服务五个关键层面,以帮助企业和开发者充分挖掘生成式AI的潜力。亚马逊CEO Andy Jassy曾经说过,“我们的目标是让任何人都能够获得和大型企业一样先进的基础设施和成本来实现自己的创新”。目前,亚马逊云科技提供了完整的端到端的生成式AI技术堆栈,从底层的加速层如加速芯片,存储优化,到中间层模型构建工具和服务,再到最上层的生成式AI相关应用,每一层都在针对客户的不同需求持续创新。亚马逊云科技希望借助相关产品和服务,实现生成式AI技术的普惠化,赋能更多的企业和个人开发者加速创新。
在如何实现生成式AI的普惠化的问题上,陈晓建特别详细的阐述了亚马逊云科技所关注的五个关键因素。
首先,选择合适的应用场景,从典型场景入手创新业务模式。陈晓建认为,增强客户体验,提升员工生产力与创造力,优化业务流程是应用场景带给企业的业务价值的主要三个方面。在演讲时,他援引麦肯锡咨询2023年6月发布的生成式AI生产力前沿技术报告,报告中指出,在生成式AI技术带来的经济效益中,大约3/4来自营销与销售、产品与研发、软件工程和客户运营四大类主要的职能,这也恰恰是生成式AI应用方向的主力。为此,Salesforce将Amazon Bedrock和Amazon Titan集成到其生成式AI产品中,使客户能够在Salesforce Data Cloud上轻松安全地使用其数据,以构建生成式AI应用。
作为案例,海尔创新设计中心利用生成式AI能够实现文生图、图生图、定量图和全场景图四个方面的提效,上线后,自动化设计系统应用让相关业务的操作周期缩短了20%。与此同时,国内游戏领域头部企业沐瞳科技也正借助Amazon Bedrock优化游戏开发相关业务流程。
第二,借助专门构建的生成式AI工具和基础设施,快速构建高性价比的生成式AI应用。在这个方向上,亚马逊云科技推出的Amazon Bedrock服务与Amazon SageMaker Jumpstart结合,助力对基础模型有着不同需求的客户轻松、安全地选择基础模型。目前,Amazon Bedrock提供了广泛的基础模型以供选择,包括Meta、Anthropic、Cohere、AI21 Labs、Stability AI等第三方领先供应商,以及亚马逊云科技自研的Amazon Titan模型家族。其无需编写代码就可以实现的托管代理Amazon Bedrock Agent,可以自动分解和编排任务,通过API连接到相关的数据源,并且可以连接到后端的Amazon Lambda来执行任务。另外,Amazon SageMaker JumpStart可以获得更多的来自工业界和学术界的开源模型,同时其还提供了一个深度的定制环境和评估功能。
在更为关注的性价比方向上,亚马逊云科技提供了广泛、高灵活的高性能、低成本训练方案。比如英传达最新GPU芯片H100 Tensor Core的Amazon EC2 P5实例,与上一代相比速度快6倍,训练成本节省40%;采用亚马逊云科技自研的机器学习推理芯片Amazon Inferentia2的Amazon EC2 Inf2实例相比其他类似EC2实例性价比高40%;同样采用亚马逊云科技自研机器学习训练芯片Amazon Trainium的Amazon EC2 Trn1实例,与同类实例相比训练成本节省高达50%。
第三,夯实数据基座,使用私有化数据,打造差异化竞争优势。亚马逊云科技提供了端到端的数据服务,从存储到查询、分析数据到通过商业智能,机器学习和生成式AI来使数据发挥作用,以及能够轻松集成和治理数据,通过有效的安全策略管理数据的应用和开放的服务。例如,针对生成式AI领域的用户个人信息、会话信息管理、私域知识库等应用场景,亚马逊云科技为Amazon OpenSearch Service、Amazon Aurora PostgreSQL和 Amazon RDS for PostgreSQL加入了向量数据库功能。而数据集成方面,亚马逊云科技提出“Zero-ETL”的愿景,推出的Aurora Zero ETL for Redshift Integration,允许存储在Amazon Aurora中实时产生的业务数据,无需ETL工具,以自动的方式同步到数据仓库Amazon Redshift中,以供近实时的进行海量数据的聚合分析。数据治理方面,亚马逊云科技提供Amazon DataZone这一全新的数据治理服务,以减少企业内部成员访问数据和使用分析工具时繁重的工作量。
会上,西门子大禹团队特别分享了在亚马逊云的技术支持下所量身打造了以人工智能生成的方式进行交互的智能聊天机器人“小禹”。其中最大的亮点在于“RAG 架构+向量数据库”设计:核心主体知识库以向量方式构建,能够存储超大规模的向量数据。另外RAG架构极大地拓展了大模型的可用性,允许对新增部分使用相同的模型处理,无需调整模型。并且,由于亚马逊云科技提供了包括向量数据库、生成式AI在内的一系列核心技术,整个解决方案指南完成度高达80%
第四,借助云原生服务,加速AI应用构建,助力业务敏捷创新。陈晓建认为,通过亚马逊云科技面向百万客户所铸就的经验,在生成式AI的今天,更多的客户更需要的是一个生成式AI的原生架构,并为此拆分成五个细则。首先以微服务化和事件驱动架构为核心的设计框架,松耦合的去处理每个功能模块之间的互相依赖;优先Serverless可以帮助我们从繁重的基础架构的运维、部署中解脱出来,从而有更多的精力关注到更该关注的业务逻辑和创新之中;数据决策优先,像资产一样重视数据,数据能力作为应用的核心竞争壁垒加入到生成式AI应用的设计理念中来;安全围栏,影响面控制,减小爆炸半径,将安全与数据的合规与保护放在前所未有的重要地位;避免重复造轮子,除了技术本身,在DevOps,基础设施即服务,自动化等现代应用治理理念持续投入,促进企业内部的应用资产与实践的分享,构建高效敏捷的构建者文化。
最后,借助开箱即用的生成式AI服务,消除重复性工作并专注创新。对此,亚马逊云科技提供了Amazon CodeWhisperer人工智能的编程伙伴,其可以实时提供编程的代码建议,然后从根本上提升开发人员的生产力。其相比没有使用该工具的开发者,在整个完成任务的速度上快了57%,成功率高了27%。另外,Amazon Whisperer推出了自定义功能,能够生成优于之前的代码建议,它允许客户使用私有代码库安全地定制 CodeWhisperer代码建议,这些私有代码库可涵盖内部API、数据库、最佳实践和架构模式等。同时,亚马逊云科技还将Amazon Quicksight Q功能与Amazon Bedrock提供的大语言模型功能相结合,为Amazon QuickSight提供生成式BI功能。
目前,亚马逊云科技通过开箱即用的生成式AI服务及工具,已帮助超过一千家中小企业和初创公司快速实现生成式AI创新,已赋能超过十万计的中国开发者。
“开发生成式AI应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接”陈晓建最后特别补充道,“如何加速客户最终应用的商业化落地,除了亚马逊本身的资源以外,我们同样需要构建强大的合作伙伴生态,与它们一起助力解决生成式AI应用构建中的各种技术问题,加速应用落地。除了云服务之外,我们还提供解决方案架构师、产品技术专家、人工智能实验、数据实验室、快速原型团队、专业服务团队、培训与认证部门等多个资源共同助力客户成功,同时我们还携手生态合作伙伴与初创圈构建生成式AI的完整体系,进一步助力生成式AI技术的落地。”