re:Invent大会以其规模和多样化的议题引人注目,今年共吸引了5万名现场参会者和超过30万名在线观众,涵盖了2200个不同主题的会议,成为云计算技术领域的一场盛大狂欢。在众多亮点产品中,生成式AI的亮相尤为引人瞩目,展示了亚马逊云科技在构建“底层基础架构+中间基础模型构建工具+上层基础模型应用”的全栈技术覆盖能力。
本次大会的重要环节之一是Keynote演讲。亚马逊云服务首席执行官Adam Selipsky重点围绕重构云基础架构、重构计算、重构存储和重构企业级生成式AI等主题宣布了多项重磅发布。亚马逊云科技高级副总裁Peter DeSantis在其主题演讲中回顾了亚马逊云科技的Serverless构建之路,并发布了数据库和应用领域的三项Serverless创新。数据和人工智能副总裁Swami Sivasubramanian博士则分享了关于亚马逊云科技生成式AI的最新能力、面向生成式AI时代的数据战略以及借助生成式AI应用提高生产效率的方法。Amazon.com副总裁兼首席技术官Werner Vogels博士分享了弹性和成本意识架构设计实践,提出了云架构的节俭之道——企业架构七大黄金法则。
在深入了解本次大会的新技术趋势和重要产品更新之前,让我们先从生成式AI的战略层面思考新时代的技术趋势和应用变化。生成性AI虽然前景广阔,但同时也带来了伦理、偏见和隐私等问题的担忧,这需要更卓越的解决方案和跨平台的数据整合能力来推动商业创新。亚马逊云科技的做法是通过提供专业化的技术方案、负责任的AI以及让客户能够拥有多种模型的方式,确保生成式AI的可用性和可持续性。
重塑,构建无限可能
“不能依赖单一大模型来应对各种任务,正确的做法是客户可以访问多个模型,然后根据自身需求来定制自己的模型。”Adam Selipsky在Keynote中强调,拥有选择的重要性,也是亚马逊云科技赢得客户信任的关键因素之一。在生成式AI时代,亚马逊云科技仍将以保密和安全的方式满足用户需求,使大模型和基础模型的应用构建像API调用一样简单。
亚马逊云科技多模型部署路线的初衷是,用户使用生成式AI,一定会面临模型选择的问题。所以,亚马逊云科技提供了自己的模型,比如:Amazon Titan, 同时也提供Amazon Bedrock,让广大开发者挑选市面上其他优秀成熟的大模型。
Amazon Bedrock,是亚马逊云科技在生成式AI领域的重要布局,基于这项全面托管的基础模型服务,用户不仅可以访问亚马逊云科技自研的Amazon Titan,还可以通过API调用等方式,轻松访问AI21 Labs、Anthropic、Cohere、Meta、Stability AI等众多主流第三方模型,来重构业务、提升用户体验。
当生成式AI应用变得越来越丰富,很多企业更愿意把Amazon Bedrock作为模型应用的“第一选择”,这其中有很多令人兴奋的创新点。比如:Salesforce、西门子、宝马集团等大量知名企业都在多场景中部署了Amazon Bedrock,通过新的模型和功能轻松构建规模化应用。
而第三方合作伙伴之所以选择亚马逊云科技,看重的是其全栈式AI服务能力,可以加快大模型应用的开发进程。比如:Anthropic与Amazon Bedrock已达成深度合作。未来,Anthropic将把亚马逊云科技作为执行关键任务工作负载的主要云服务提供商,训练和部署Claude以及新一代基础模型。与此同时, Anthropic作出长期承诺,允许亚马逊云科技全球客户通过Amazon Bedrock访问其未来几代的大模型。
Amazon Bedrock带来的体验可以说是更直接、门槛更低,企业可以轻松、快速、安全地构建业务,满足业务定制化需求。现在,全球已有超过一万家客户在使用Amazon Bedrock,客户案例已经遍布到金融、能源、医疗健康和生命科技、媒体、游戏以及娱乐等各个行业。
Amazon Bedrock成为构建广泛模型技术栈的选择,绝非偶然。亚马逊云科技基于在人工智能领域25年的发展,深知生成式AI对技术创新带来的影响,深不可测。但如果有人滥用模型,或者突然停止提供服务,那大模型的未来会是灾难性后果。所以,做一个负责任的生成式AI,亚马逊云科技正与更多优秀企业一起努力,让每个应用变得安全、可靠和可持续。
至于,在可用、可信、可管大模型背后,到底有哪些杀手锏级的应用?亚马逊云科技在re:Invent上亮出了生成式AI背后的“硬核”,那就是“三层AI架构体系”的创新!
颠覆,来自“生成式AI三层架构”体系的创新
当生成式AI呈爆发趋势增长,亚马逊云科技以“三层架构”打造全栈式生成式AI基座。顶层,利用基础模型构建应用,包括本次大会重点发布的Amazon Q、以及全新更新的Amazon Quick Sight、Amazon Connect、Amazon CodeWhisperer;中间层,提供调用大模型和基础模型的工具,主要是Amazon Bedrock,亮点功能是Guardrails、Agent、Customization Capabilities;底层,训练和推理的基础设施,比如:专为训练机器学习工作负载而设计的芯片Trainium等。
把生成式AI融入企业关键业务系统,融入每个人的日常工作,亚马逊云科技最新发布的Amazon Q,具有革命性意义。
Amazon Q是一个通用型生成式AI助手,你可以把它想象成是一个工作助理。遇到问题时,可以快速生成内容,获得答案,并通过具体的解决方案付诸行动。这一系列行为都源于对企业系统、数据存储库和操作的理解。
说白了,有了Amazon Q,企业可以为员工提供有效见解、简化工作任务,进而加快整体业务决策能力,提升员工解决问题的能力,进而激发每个人的创新和创造力。Amazon Q专为满足企业客户的严格要求而设计,可以根据组织的现有身份、角色和权限为每个用户提供个性化的交互。此外,Amazon Q从不使用商业客户的内容来训练其底层模型。
针对顶层应用创新,Amazon CodeWhisperer也有重要更新,提供了建议编码和定制化预览功能。Amazon CodeWhisperer的最大特点是,可以近乎实时地生成代码,帮助开发者更快、更安全地构建应用程序。开发者可以通过自然语言构建应用,然后在IDE中收到准确的代码建议。
让编写代码任务变得更快,让更多开发者受益。Amazon CodeWhisperer秉承普惠AI理念,可以免费供开发者使用。同时,在几个月之前,Amazon CodeWhisperer还发布了定制化预览功能,企业用户可以安全地基于内部代码库来学习,快速获得更相关、定制化和更有用的代码建议。
而在“生成式AI三层架构”的中间层,Amazon Bedrock的创新主要围绕用户全生命周期的应用过程展开。
1.微调
使用一个模型,想让这个模型 “足够聪明”,最关键的技术是上下文检索能力。而有了“微调”这样一项技术,开发人员可以将模型指向在Amazon S3中标记的数据示例,以提供上下文检索。例如,会指向一些提案,可以将其中一些提案标记为“强烈”。通过这种方式,模型可以从企业的数据中学习,了解什么是最重要事项。
然后,Amazon Bedrock会复制基础模型,对其进行训练,创建一个私有的精细调整模型,这样企业就可以实现量身定制的目标。微调可以在Amazon Titan Text Lite和Express中使用,现在它也已经普遍适用于CoHERE Command Lite和Meta LLaMA 2,而且微调很快就会应用到Anthropic的Claude上。
2.检索增强生成(RAG)
如果想让企业的业务实现进一步的量身定制目标,还有一个基础模型的重要技术,叫做检索增强生成(Retrieval Augmented Generation,简称RAG)。
RAG允许你的模型在考虑新知识或获取最新信息时得到定制模型的回应。Amazon Bedrock通过调用并带回企业自己的数据,以实现个性化应用。企业的数据通常来自多个来源,包括文档存储库、数据库和其他API等。例如,模型可能使用RAG从Amazon OpenSearch服务检索搜索结果,或从Amazon S3检索文档。在今年九月,亚马逊云科技引入了一种叫做知识库的RAG功能,它将基础模型(FM)连接到企业的专有数据源,以补充企业的提示信息。现在,RAG知识库应用已经普遍可用。
3.持续预训练
无论是上下文检索,还是检索增强,在做这些工作之前,企业一定要先基于各种数据进行模型训练。而基于最新的持续预训练技术,可以帮助企业通过多个数据源来构建更个性化的模型。持续预训练是一种在进行微调之前使用大量未标记数据的技术。比如:企业拥有的内部报告、财务计划或研究结果的原始文本,都可以拿过来用于模型训练。基于这些不同来源的数据,企业可以提高模型的知识和推理能力,打造出属于特定领域内的核心竞争力。
值得一提的是,很多其他通用人工智能产品也能解决这样的问题,但这些企业一般来自大型互联网企业,他们在通用知识能力构建上很强,但不了解企业级的数据以及客户运营规则,所以在企业级场景中,很难真正发挥作用。
进化,底层基础设施的加速变革
为了强化底层基础设施能力,让应用更按需、可靠、经济,并具有高性能,亚马逊云科技一直在加大底层基础设施层面的投入。
1、 让一切皆可算,Graviton4重磅升级
亚马逊云科技在2018年推出Graviton时,就标志着这是一家具有自研通用处理器能力的云服务提供商。之后,Graviton2将工作负载的性能提高了七倍。但亚马逊云科技并没有停止创新,Amazon Graviton4是强大、节能处理器的集大成者,可适用于各种云工作负载。
与前一代Graviton3处理器相比,Graviton4提升高达30%的计算性能、内核数增加50%,内存带宽增加75%,为在Amazon EC2上运行的各种工作负载提供高性价比和高能效。与此同时,最新推出的EC2 UltraClusters of Trainum2旨在为云中提供高性能、超节能的人工智能模型训练基础设施。Trainium 2 是一款专为以高性能训练具有数万亿个参数或变量的基础模型和大语言模型而构建的芯片。与第一代Trainium芯片相比,Trainium 2的训练性能提高了4倍,内存容量提高了3倍,同时能效(性能/功耗)提高了2倍。
为了提供多样化的计算能力,亚马逊云科技和NVIDIA已宣布达成战略合作,为生成式人工智能提供新的超级计算基础设施、软件和服务。英伟达(NVIDIA)首席执行官黄仁勋,也在re:Invent上发表了主题演讲,两家公司将汇集双方技术精华,从NVIDIA最新的多节点系统(下一代GPU、CPU和人工智能软件),到亚马逊云科技Nitro System高级虚拟化和安全性、弹性结构适配器(EFA)互连,以及在UltraCluster可扩展性方面深化合作,以满足当前狂热的生成式AI需求,帮助不同用户去训练基础模型和构建生成式人工智能应用程序。
2、存储再次降低成本,Amazon S3 Express One Zone全面可用
S3是亚马逊云科技在2006年第一个正式对外推出的服务,代表云计算时代的到来。经历近20年的发展,S3再次重磅升级。亚马逊云科技最新发布的Amazon S3 Express One Zone已全面可用。Amazon S3 Express One Zone是一个新的存储类,旨在为客户频繁访问的数据提供高性能和低延迟的对象存储。数据访问速度比Amazon S3标准应用快10倍,请求成本比Amazon S3标准版低50%。
3、Zero-ETL,数据库、数据仓库再创新
说到底,生成式AI时代虽然有各种模型,但最终都会落实到数据。所以,企业需要一套全面的数据管理工具,来有效利用数据,而亚马逊云科技从存储到数据库、数据仓库,可以帮助更多企业低成本利用数据,包括可以通过机器学习来分析结构化和非结构化数据。
为了让数据使用更简单,亚马逊云科技在数据库、数据仓库层面,也进行了诸多更新。比如:Aurora推出了进一步减少IO性能的Grover, 进一步降低成本的Amazon Aurora Serverless, 还有Amazon Aurora Limitless Database, 可以管理任意规模的实例。
亚马逊云科技提供包括Aurora在内的八种关系型数据库,而Amazon Redshift数据仓库服务,可以提供同类产品的6到7倍性价比。Amazon OpenSearch Service拥有数万名活跃客户和数十万个集群,每月处理数万亿个请求。
数据管理是一项复杂工程,很多企业需要从数据库、分析工具以及SaaS应用程序中把数据统一到一个平台,通常的做法都会通过ETL实现数据的提取、转换和加载,其业务的复杂性无法想象。目前,Aurora PostgreSQL、Amazon S3、Amazon RDS for MySQL 和 Amazon DynamoDB、Amazon Redshift已经全部集成,最终支持Zero-ETL理念,进而简化用户的数据处理流程,提升工作效率。
反向思维,不断重塑,是亚马逊云科技持续发展的DNA,是云计算诞生之道,同样也适用于今天的生成式AI时代。而在亚马逊云科技全新的现代化技术栈基础上,开发者面临的所有难题都会迎刃而解,这应该是本次re:Invent诸多发布背后的精髓!