当前位置:首页|资讯|亚马逊|生成式AI

亚马逊云科技re:Invent Adam主题演讲,构建全栈生成式AI

作者:一点生活汇发布时间:2023-11-30

原标题:亚马逊云科技re:Invent Adam主题演讲,构建全栈生成式AI

2023亚马逊云科技re:Invent第二天,亚马逊云科技首席执行官Adam Selipsky在两个半小时的演讲中,重点围绕重构云基础架构、重构计算、重构存储、重构企业级生成式AI等主题,宣布了多项重磅发布,助力云上客户快速实现数字化转型,提高企业生成式AI创新速度。

四大重构突破想象

全栈生成式AI能力

重构基础设施

亚马逊云科技目前在全球拥有32个区域,每个区域都有3个或者更多的可用区(AZ),每个可用区在物理层面上来讲都是单独隔离,同时与冗余光纤网络互联,拥有冗余的供电、用水。当电力关停或者是有高峰使用的流量,其他可用区都完全可以不受影响,可以继续独立地运营。

重构存储

  • 重磅发布:高性能、低延迟的对象存储服务Amazon S3 Express One Zone

亚马逊云科技始终坚持革新,持续推出一系列创新存储服务,如用于归档数据的Amazon S3 Glacier存储和自动优化成本的Intelligent Tiering。Intelligent Tiering通过在存储层之间根据访问模式自动切换存储类型,帮助亚马逊云科技全球客户节省了超过20亿美元,体现了亚马逊云科技通过持续释放技术红利帮助客户更好的在云上创新的理念。

在本次大会中,Adam还正式发布了高性能、低延迟的对象存储服务Amazon S3 Express One Zone,可用于访问性能要求最高的数据存储。该服务旨在为延迟敏感的应用提供个位数毫秒级延迟的高性能,以支持每分钟数百万请求、每秒数十万次的数据访问。Amazon S3 Express One Zone的数据访问速度比Amazon S3标准版快10倍,请求成本降低50%,计算成本降低60%。

重构计算

亚马逊云科技还洞察到,客户对提升云上算力,提升性价比的需求不断攀升。而云需要从芯片级开始对算力进行全面创新。2018年,亚马逊云科技发布第一代Graviton芯片,成为全球首家开发处理器的云厂商。今年,亚马逊云科技已拥有超过150种基于Graviton的实例,全球超过5万客户在使用Graviton处理器,包含TOP100名的客户也在使用Graviton这样的实例来获取性价比优势。例如SAP,他们在使用Graviton服务之后,成本降低了35%,而且分析速度更快,同时减少了45%的碳排放量。

  • 重磅发布:全新一代Graviton处理器——Amazon Graviton4

Adam还宣布发布全新一代Graviton处理器——Amazon Graviton4。相比Graviton3,它的核心多出50%,内存带宽提升75%,Graviton4芯片速度较Graviton3提升30%,对于数据库和Java应用等关键工作负载方面实现了更显著的性能提升,分别提升了40%和45%。

  • 重磅发布:首个基于Graviton4的实例R8g Instances for EC2

R8g是第一个基于Graviton4的实例,现在就可提供预览。R8g作为内存优化型实例,能够更好地支持大规模数据库、实时大数据分析等应用,可提供最佳的价格性能,且减少能源消耗。未来,亚马逊云科技将有更多的Graviton4的实例陆续发布。

重构生成式AI

亚马逊云科技总是在不断重构,为客户提供基础架构,帮助客户释放创新能力。在过去的几十年里,亚马逊云科技一直在AI领域进行创新,从将AI广泛应用于亚马逊庞大的零售和业务运营中积累了大量宝贵经验,为帮助客户利用生成式AI的力量重塑业务提供了策略指导。在重构生成式AI的过程中,亚马逊云科技拥有更广泛和深入的功能,具备更好性价比,同时具有必要的安全性和隐私性。

谈到全栈生成式AI,它包括同样重要的三个层级。亚马逊云科技在不断重构三个层级:最底层是训练和推理的基础设施层,中间层是我们所有的微调模型需求的工具服务,上层是构建生成式AI应用层。

在生成式AI基础设施层,亚马逊云科技正努力优化解决方案,如EC2 GPU实例,以提供高效训练和运行基础模型所需的高性能计算能力,同时降低成本。在这个领域亚马逊云科技与NVIDIA拥有超过十年的合作经验,使亚马逊云科技成为首家提供NVIDIA全新GH100 Grace Hopper数据中心GPU访问的云服务提供商。这款新的超级芯片专为加速大型语言模型的训练和推理而设计,这些模型是生成式AI应用的基本组成部分。

  • 重磅发布:亚马逊云科技成为首家推出NVIDIA GH200 NVL32实例的云厂商

NVIDIA创始人、CEO Jensen Huang宣布,亚马逊云科技成为首家推出NVIDIA GH200 NVL32实例的云厂商。这款实例带有32个GH200超级芯片,它们之间通过高达900GB/s NVLink网络进行互联,形成一个具有高达20TB共享内存的实例,可用于加速训练具有1万亿参数的AI大模型。

  • 重磅发布:全新一代Amazon Trainium2芯片

基于训练芯片Trainium的成功经验,Adam正式发布了全新一代Trainium2芯片。它拥有数千亿甚至数万亿个参数的基础模型训练做了优化,性能比上一代芯片提高到4倍,拥有65 EFlops可以按需提供性能支持。明星生成式AI企业Anthropic计划用Trainium2芯片构建模型。

在进行创新的时候,亚马逊云科技会在各种不同的FM还有API之间交互,Amazon Bedrock能够提供各式各样模型,例如AI21 labs、Anthropic、Cohere、Meta,还有Amazon Titan模型。此外亚马逊云科技也是首个集成Meta Llama 2模型的云厂商。

  • 重磅发布:亚马逊云科技与Anthropic深化合作关系

Adam强调了在快速发展的人工智能领域中,客户灵活选择权的重要性。为了实现这一目标,亚马逊云科技持续拓展与业界领先的创新公司,比如开创性的AI初创公司Anthropic的合作。通过与Anthropic建立新的合作关系,后者将利用亚马逊云科技的专用机器学习芯片Trainium来训练他们的下一代复杂Claude模型。Amazon Bedrock的客户还将享有独家早期使用权,体验其他地方无法使用的先进Claude定制和微调模型功能。

  • 重磅发布:Amazon Bedrock全新功能,包括模型的微调、检索增强生成(RAG)以及基于Amazon Titan大模型的预训练

在生成式AI的顶层,另一个关键层面是通过Amazon Bedrock为客户提供简单快速和安全地访问各种基础模型的API的途径。Amazon Bedrock在两个月前推出,已经吸引了超过10,000名来自各个行业的活跃客户使用它来快速构建和扩展生成式AI应用。Adam也发布了Amazon Bedrock的全新功能,包括模型的微调、检索增强生成(RAG)以及基于Amazon Titan大模型的预训练。

  • 重磅发布:正式推出Agents for Amazon Bedrock

借助全新GA的 Agents for Amazon Bedrock,用户可以通过简单的几个步骤创建和部署完全托管式的Agent,通过动态调用API来执行复杂的业务任务。Amazon Bedrock可以根据用户提供的自然语言指令完成任务所需的API架构。

负责任的AI

  • 重磅发布:Guardrails for Amazon Bedrock

在亚马逊云科技致力于以负责任的方式开发AI,Adam本次针对生成式AI的安全,全新发布Guardrails for Amazon Bedrock预览版,根据应用程序需求和AI政策定制保障措施。Guardrails可以跨基础模型,为所有应用程序提供一致的AI安全级别,阻止生成式AI应用程序中不需要的话题,根据AI策略过滤有害内容等。生成式AI一定要是安全的,是负责任的,这是亚马逊云科技的Job Zero。

  • 重磅发布:企业生成式AI助手Amazon Q

Adam发布了企业应用助手Amazon Q,它由亚马逊云科技17年来积累的知识和经验训练而成,改变了开发者和IT人员在亚马逊云科技上构建、部署和运维应用程序和工作负载的方式。客户可以通过亚马逊云科技管理控制台、文档页面、IDE、Slack或其他第三方对话应用程序的聊天界面访问Amazon Q。Amazon Q为Amazon QuickSight、Amazon Connect提供全新基于生成式AI的助理。这些应用是Amazon Q广泛应用的一个开始。

通过以上发布,亚马逊云科技已经构建面向全栈生成式AI应用的服务。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1