作者:晶颜
“AWS re:Invent 2023”于11月27日至12月1日在拉斯维加斯举行,展示了亚马逊保持其领先云提供商地位的承诺。通过一系列战略公告,该公司展示了其在行业中树立新标准的不懈追求。以下是今年活动的十大亮点:
AWS首席执行官亚当•塞利普斯基(Adam Selipsky)在主题演讲中宣布了一款人工智能聊天机器人Amazon Q,它代表了客户互动的重大飞跃。经过17年的AWS知识培训,Amazon Q超越了传统的问答功能,使用户能够参与对话、生成内容并执行各种操作,改变了开发者和 IT 人员在亚马逊云科技上构建、部署和运维应用程序和工作负载的方式。
客户可以通过亚马逊云科技管理控制台、文档页面、IDE、Slack或其他第三方对话应用程序的聊天界面访问Amazon Q。据悉,Amazon Q可以被企业用于各种功能,包括开发应用程序、转换代码、生成商业智能、充当商业应用程序的生成式人工智能助手,以及通过Amazon Connect产品帮助客户服务代理。
添加到Bedrock的更新模型包括Anthropic的Claude 2.1和Meta Llama 270b,两者都已普遍可用。亚马逊还将其专有的Titan Text Lite和Titan Text Express基础模型添加到Bedrock。
此外,这家云服务提供商还在AI应用程序构建服务中添加了一个预览模型——亚马逊Titan图像生成器(Amazon Titan Image Generator)。Titan利用AI根据文本描述或自定义现有图像生成逼真的工作室质量图像。该服务内置了防止恶意和偏见的护栏,满足了对负责任的人工智能日益增长的需求。
AWS还在Bedrock中发布了一项新功能,允许企业评估、比较和选择最适合其用例和业务需求的基础模型。该功能被称为模型评估(Model Evaluation),目前处于预览阶段,该功能旨在简化几项任务,如确定基准、设置评估工具和运行评估,从而实现时间和成本节约。
SageMaker HyperPod:大型语言模型(LLMs)的优化训练
为了帮助企业有效地培训和部署大型语言模型,AWS在其亚马逊SageMaker人工智能和机器学习服务中引入了两项新产品——SageMaker HyperPod和SageMaker Inference。
该公司表示,与手动模型训练过程(容易出现延迟、不必要的支出和其他并发症)相比,HyperPod消除了为训练模型构建和优化机器学习基础设施的繁重工作,将训练时间减少了40%。
另一方面,SageMaker Inference旨在帮助企业降低模型部署成本并减少模型响应中的延迟。为了做到这一点,Inference允许企业将多个模型部署到同一个云实例中,以便更好地利用底层加速器。
AWS还更新了针对业务分析师的低代码机器学习平台SageMaker Canvas。AWS数据库、分析和机器学习服务主管Swami Sivasubramanian表示,分析师可以使用自然语言在Canvas中准备数据,以生成机器学习模型。该无代码平台支持来自Anthropic、Cohere和AI21 Labs的LLM。
值得一提的是,SageMaker现在还具有模型评估功能,现在称为SageMaker Clarify,可以从SageMaker Studio中访问。
亚马逊云科技始终致力于以负责任的方式开发AI,此次针对生成式AI的安全性,AWS全新发布了Guardrails for Amazon Bedrock预览版,允许公司定义和限制模型使用的语言。该特性支持对模型可以处理的主题进行精确控制,从而防止模型响应不相关的查询。通过确保语言模型与特定的公司指导方针和目标保持一致,Guardrails for Bedrock增强了语言模型的实用性。
AWS Clean Rooms ML是Amazon推出的一个隐私保护服务,允许AWS客户部署专为一次性公司合作训练的“相似”人工智能模型,该服务是AWS现有的Clean Rooms产品的分支。
在现有AWS Clean Rooms服务的基础上,这一新颖的产品消除了AWS客户在人工智能模型的开发、培训和部署阶段与外部合作伙伴共享专有数据的必要性。通过促进安全和保护隐私的协作,Clean Rooms ML加速创新并确保敏感数据的机密性,标志着负责任和协作的人工智能开发迈出了重要一步。
亚马逊科技公布量子计算芯片进展(Logical Qubit),宣布推出一项名为Amazo Braket Direct的新计划,为研究人员提供直接地、私人地访问量子计算机的机会。
该项目是AWS管理的量子计算服务的一部分,该服务于2020年推出,名为Amazon rack。
AWS表示,Amazon Bracket Direct允许企业的研究人员在没有任何等待时间的情况下私人访问各种量子处理单元(QPU)的全部容量,并且还提供了从AWS量子计算专家团队那里获得工作负载专家指导的选项。
目前,Direct计划支持IonQ Aria、QuEra Aquila和Rigetti Aspen-M-3量子计算机的预订。
IonQ的售价为每小时7000美元,QuEra Aquila的售价为每小时2500美元,Rigetti Aspen-M-3的价格略高,为每小时3000美元。
re:Invent宣布的更新包括一个新的AWS计费和成本管理功能,称为AWS成本优化中心(Cost Optimization Hub),它使企业可以轻松地识别、过滤、汇总和量化AWS成本优化建议的节省。
根据AWS的说法,新的成本优化中心将跨AWS云财务管理(CFM)服务(包括AWS成本管理器和AWS计算优化器)的所有成本优化建议操作集中在一个地方。此外,它还将客户特定的定价和折扣纳入这些建议中,从而提供企业成本优化机会的综合视图。
该功能可能有助于FinOps或基础设施管理团队了解成本优化机会。
在本次大会中,AWS还正式发布了高性能、低延迟的对象存储服务Amazon S3 Express One Zone,对其S3对象存储服务进行了重大更新。该服务旨在为延迟敏感的应用提供个位数毫秒级延迟的高性能,以支持每分钟数百万请求、每秒数十万次的数据访问。Amazon S3 Express One Zone的数据访问速度比Amazon S3标准版快10倍,请求成本降低50%,计算成本降低60%。
这种S3的高性能和低延迟层保证了性能的大幅提高,特别有利于数据密集型应用程序,如AI/ML训练、财务建模和高性能计算(HPC)。S3 Express One Zone为希望在存储解决方案中提高速度和效率的用户提供了一个绝佳的选择。
进入生成式AI时代,为释放数据更大价值,Amazon宣布了4项新的Zero-ETL集成功能:Amazon Aurora PostgreSQL、Amazon DynamoDB、Amazon RDS for MySQL 与Amazon Redshift,使客户能够快速、轻松地连接和分析数据,而无需构建和管理复杂的提取、转换和加载(ETL) 数据管道。
根据该公司的说法,新的Zero-ETL集成消除了在Aurora PostgreSQL、DynamoDB、RDS for MySQL和RedShift之间执行ETL的需要,因为这些数据库中的事务数据几乎可以立即复制到RedShift中,并准备好进行运行分析。如此一来,用户将能获得跨多个应用的整体洞察力,在提高运营效率的同时降低成本,并生成更好的数据驱动决策。
自去年以来,这家云服务提供商一直在强化其基础设施功能和芯片,以支持具有更高能效的高性能计算。此次大会上,AWS宣布了用于人工智能模型训练和推理的芯片技术的最新进展。专为模型训练而设计的AWS Trainium2,承诺比其前身提高4倍的性能和2倍的能源效率。
在推理方面,AWS发布了全新一代Graviton处理器——Amazon Graviton4。相比Graviton3,它的核心多出50%,内存带宽提升75%,Graviton4芯片速度较Graviton3提升30%,对于数据库和Java应用等关键工作负载方面实现了更显著的性能提升,分别提升40%和45%。
此外,在re:Invent大会上,AWS还扩展了与英伟达的合作伙伴关系,包括对DGX Cloud的支持、名为Ceiba的新GPU项目,以及支持生成式AI工作负载的新实例。
英伟达也分享了将NeMo retriver微服务集成到AWS的计划,以帮助用户开发聊天机器人等生成式AI工具。NeMo retriver是一种生成式AI微服务,使企业能够将自定义大型语言模型(LLM)连接到企业数据,以便公司可以根据自己的数据生成适当的AI响应。
AWS还表示,它将成为首家将英伟达GH200 Grace Hopper超级芯片带入云端的云提供商。
AWS re:Invent 2023展示了亚马逊与关键行业趋势的战略一致性,特别是人工智能在塑造云计算未来方面的关键作用。最新的服务和功能反映了AWS为满足不断变化的业务需求而做出的一致努力,强调无缝交互、增强的性能和创造性的人工智能应用程序。
亚马逊对创新的不懈追求,以及对人工智能驱动解决方案的关注,突显了其保持市场领导地位的承诺。通过解决云计算的各个方面——从先进的芯片技术到交互式聊天机器人和隐私保护服务——AWS正在巩固其作为一个多功能和前瞻性的云提供商的声誉,并准备好驾驭行业的动态格局。
原文标题:AWS re:Invent 2023: 7 takeaways from the big annual event,作者:Anirban Ghoshal
原文标题:7 Big Takeaways From AWS re:Invent 2023
欧倍尔实训基地建设 2024-11-15
物流技术与应用 2024-11-15