当前位置:首页|资讯|生成式AI|人工智能|亚马逊

全面发力生成式AI,亚马逊云科技重塑云计算

作者:甲子光年发布时间:2024-01-02

原标题:全面发力生成式AI,亚马逊云科技重塑云计算

生成式AI已经成为云服务商的兵家必争之地,全球云计算市场的领头羊亚马逊云科技,也在全面发力生成式AI。

亚马逊云科技在2023 re:Invent全球大会上围绕底层基础设施、生成式人工智能(AI)、数据战略等推出了一系列新服务及功能,包括重塑未来工作方式的新型生成式AI助手Amazon Q、Amazon Bedrock更多的模型选择和全新强大功能、Amazon SageMaker助力规模化开发应用模型的五大新功能等,帮助企业更轻松、安全地构建和应用生成式AI。

亚马逊云科技大中华区产品部总经理陈晓建表示:“亚马逊云科技在每年的re:Invent全球大会上都会发布众多新服务、新功能和新应用,在基础设施、计算、存储、数据等领域持续重塑云计算,并围绕当今最具变革性的技术生成式AI推出重磅新服务及功能。我们希望通过这些技术创新,帮助更多企业加快创新速度,利用生成式AI全面重塑未来。”

亚马逊云科技2023 re:Invent中国行城市巡展活动于今天正式开启,将覆盖北京、上海、广州、深圳、成都、青岛、南京、西安、杭州、长沙 10 座城市,为中国构建者全面展示2023 re:Invent全球大会上的最新服务及技术、前沿趋势以及最佳实践。

1、全面发力生成式AI

亚马逊云科技为生成式AI提供三层架构,包括利用基础模型构建的应用程序、使用基础模型进行构建的工具和用于基础模型训练和推理的基础设施。

在底层,亚马逊云科技通过自研芯片提供用于基础模型训练和推理的基础设施。

Amazon Trainium2处理器是用于生成式 AI 和机器学习训练的专用芯片,针对训练具有数千亿至数万亿参数的基础模型进行优化,相较 Amazon Trainium 4 倍性能提升,65 exaflops的按需超级计算性能;Amazon SageMaker HyperPod 服务,可大规模加速基础模型训练,能够缩短高达40%的训练时间,并可以确保持续数周或数月的训练过程不中断。

亚马逊云科技还与英伟达共同宣布了几项最新合作:

  • 亚马逊云科技将提供首款搭载NVIDIA Grace Hopper超级芯片和亚马逊云科技UltraClusters技术的云AI超级计算机;首款使用NVIDIA最新芯片GH200 NVL32 的NVIDIA DGX云即将登录亚马逊云科技;两家公司共同开展“Project Ceiba”合作项目, 将全球最快的GPU驱动AI超级计算机和NVIDIA DGX云超级计算机用于NVIDIA AI的训练、研发、定制化模型的开发,它将拥有1.6万个最新的GH200超级芯片,提供高达65 ExaFLOPS的惊人算力。

在中间层工具层,亚马逊云科技提供使用基础模型进行构建的工具。

Amazon Bedrock是利用大模型构建和扩展生成式人工智能应用的最简单方法。Amazon Bedrock支持Anthropic Claude 2.1和Meta LLama 2 70B,以及亚马逊独家的Amazon Titan 模型。

企业创造真正价值的生成式人工智能应用程序的关键就是能够用企业自己的书据进行定制,用数据进行定制才能构建企业的差异化壁垒。Amazon Bedrock具备持续预训练、微调、具有知识库的检索增强生成三大功能,并提供预览

有了模型和定制能力,还需要和应用集成才能服务于业务。因此,Amazon Bedrock 提供代理功能,它可以使生成式AI应用跨公司系统和数据源执行多步骤任务。

Guardrails for Amazon Bedrock 预览版,通过负责任的人工智能策略来保护生成式人工智能应用程序。同时,Amazon Bedrock确保数据安全和隐私:客户的任何数据都不会用于训练底层模型;所有数据在传输和静态时均经过加密;用于自定义模型的数据保留在您的 VPC 内;支持GDPR和HIPAA等标准。

在顶层应用层,亚马逊云科技提供利用基础模型构建的应用程序——Amazon Q预览版。

Amazon Q是一种新型生成式AI支持的助手,可以根据客户业务进行定制,专门用于满足办公场景需要。客户可以快速获得复杂问题的相关答案、生成内容并采取行动,所有这些都基于客户自身的信息存储库、代码和企业系统的见解。此外,客户的内容绝不会用于训练Amazon Q的底层模型。Amazon Q可以在亚马逊云科技上进行构建,也可以使用内部数据和系统,使用亚马逊云科技应用程序实现商业智能(BI)、联络中心和供应链管理。Amazon Q已向客户提供预览版,Amazon Connect中的Amazon Q已正式推出,Amazon Supply Chain中的Amazon Q即将推出。

强大的数据支持对生成式AI至关重要,在2023 re:Invent全球大会上,亚马逊云科技围绕数据基础设施、集成以及治理等推出多项服务及功能。

首先,进一步丰富向量数据库选择,亚马逊云科技推出了Amazon OpenSearch Serverless向量引擎、Amazon DocumentDB和Amazon DynamoDB的新向量搜索功能、Amazon Memory DB for Redis向量搜索预览版,提升生成式AI应用在响应和延迟方面的性能表现。

推出四项Zero-ETL集成特性,让跨数据存储的数据访问与分析更快速、更便捷。

在数据治理方面,亚马逊云科技为Amazon DataZone推出了AI描述建议功能预览版,它能够为企业的数据集自动生成更易理解的业务描述,并提供该数据集的使用建议。

2、重塑云计算——自研芯片、存储、无服务器

在2023 re:Invent全球大会上,亚马逊云科技推出Amazon Graviton4和Amazon Trainium2自研芯片。

Graviton4与当前一代Graviton3处理器相比,性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上,为在Amazon Elastic Compute Cloud (Amazon EC2)上运行的工作负载提供最佳性能和能效;基于Graviton4的Amazon EC2 R8g实例目前已提供预览。通过与光环新网和西云数据的合作,基于Graviton3处理器的Amazon EC2 C7g、M7g、R7g实例目前均已在亚马逊云科技中国(北京)区域和中国(宁夏)区域正式可用。

Trainium2芯片专为以高性能训练具有数万亿个参数或变量的基础模型和大语言模型而构建。Trainium2与第一代Trainium芯片相比,性能提升多达4倍,内存提升3倍,能源效率(每瓦性能)提升多达2倍。Amazon EC2 Trn2实例采用最新的Trainium2,一个单独实例包含16个Trainium加速芯片。Trainium2实例致力于为客户在新一代EC2 UltraClusters中扩展多达100,000个Trainium2加速芯片,并与Amazon Elastic Fabric Adapter(EFA)PB级网络互联,提供的算力高达65 exaflops,客户可按需获得超级计算级别的性能。

亚马逊云科技推出的第二款新品是存储。

Amazon Simple Storage Service(Amazon S3)自17年前推出以来,已成为最受欢迎的云存储服务之一,在全球拥有数百万各行各业的客户。在本次大会上,亚马逊云科技宣布Amazon S3 Express One Zone正式可用,与Amazon S3 Standard相比,数据访问速度提高至多10倍,数据请求成本降低50%,为机器学习训练和推理、交互式分析以及媒体内容创建等请求密集型工作负载提供最高性能存储。

最后一款新品是无服务器Serverless

亚马逊云科技在17年前就开创性地推出了无服务器技术,为客户提供极致的弹性和自动扩展能力。在2023 re:Invent全球大会上,亚马逊云科技推出了三款无服务器服务创新,帮助客户以任意规模分析和管理数据并显著简化运营,客户无需花费时间和精力去配置、管理和扩展其数据基础设施。

其中,Amazon Aurora Limitless数据库可跨多个Amazon Aurora Serverless实例自动分发和查询数据,并能够扩展到每秒百万次的事务级写入并管理PB级数据。Amazon ElastiCache Serverless可以帮助客户在一分钟内创建高可用的缓存,并实时进行垂直和水平扩展以支持客户复杂的应用程序,且无需管理基础架构。Amazon Redshift Serverless利用人工智能(AI)预测工作负载并自动扩展和优化资源,帮助客户实现高性价比的目标。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1