大模型之家讯 今日,亚马逊云科技在2023 re:Invent全球大会上围绕底层基础设施、生成式人工智能(AI)、数据战略等推出了一系列新服务及功能,以创新性的技术重塑帮助客户加速创新。亚马逊云科技全面发力生成式AI,推出面向企业级生成式AI的一系列新服务及功能,包括重塑未来工作方式的新型生成式AI助手Amazon Q、Amazon Bedrock更多的模型选择和全新强大功能、Amazon SageMaker助力规模化开发应用模型的五大新功能等,帮助企业更轻松、安全地构建和应用生成式AI。为了给生成式AI提供强大的数据支持,亚马逊云科技进一步丰富向量数据库选择,推出让跨数据存储的数据访问与分析更快速、更便捷的Zero-ETL集成特性等。此外,亚马逊云科技推出新一代自研芯片Amazon Graviton4和Amazon Trainium2,为机器学习(ML)训练和生成式AI应用等广泛的工作负载提供更高性价比和能效。亚马逊云科技2023 re:Invent中国行城市巡展活动于今天正式开启,将覆盖北京、上海、广州、深圳、成都、青岛、南京、西安、杭州、长沙 10 座城市,为中国构建者全面展示2023 re:Invent全球大会上的最新服务及技术、前沿趋势以及最佳实践。
亚马逊云科技大中华区产品部总经理陈晓建表示:“作为全球云计算的开创者和引领者,亚马逊云科技在每年的re:Invent全球大会上都会发布众多新服务、新功能和新应用。我们在基础设施、计算、存储、数据等领域持续重塑云计算,并围绕当今最具变革性的技术生成式AI推出重磅新服务及功能。我们希望通过这些技术创新,帮助更多企业加快创新速度,利用生成式AI全面重塑未来。”
全面发力生成式AI——帮助企业更轻松、安全地构建和应用生成式AI
生成式AI在技术变革、重塑人们的行为方式方面拥有巨大潜力。亚马逊云科技为生成式AI提供三层架构,包括利用基础模型构建的应用程序、使用基础模型进行构建的工具和用于基础模型训练和推理的基础设施,并在每一层都持续创新,帮助客户更轻松、安全地构建和应用生成式AI,进一步降低利用生成式AI的门槛。
推出Amazon Q,重塑未来工作方式。这是一种新型生成式AI支持的助手,可以根据客户业务进行定制,专门用于满足办公场景需要。客户可以快速获得复杂问题的相关答案、生成内容并采取行动 – 所有这些都基于客户自身的信息存储库、代码和企业系统的见解。此外,客户的内容绝不会用于训练Amazon Q的底层模型。无论是在亚马逊云科技上进行构建、使用内部数据和系统,还是使用亚马逊云科技应用程序实现商业智能(BI)、联络中心和供应链管理的客户,Amazon Q都是良好的基于生成式AI的助手,能够帮助各个行业、各种规模的企业安全地使用生成式AI。Amazon Q已向客户提供预览版,Amazon Connect中的Amazon Q已正式推出,Amazon Supply Chain中的Amazon Q即将推出。
Amazon Bedrock发布更多模型选择和全新强大功能,助力安全构建和规模化生成式AI应用。来自Anthropic、Cohere、Meta、Stability AI和亚马逊最新的高性能模型为客户提供更丰富的行业领先模型选择,以支持各种用例。此次发布进一步降低了生成式AI应用的门槛——为客户提供了更多行业领先的模型选择和评估模型新功能,以简化客户使用相关和专有数据定制模型的方式;提供自动执行复杂任务的工具;并为客户配备了提供负责任地构建和部署应用程序的保障。
推出五项Amazon SageMaker新功能,助力规模化开发应用模型。Amazon SageMaker的五项新功能让企业更轻松快速地构建、训练和部署支持各种生成式AI使用场景的机器学习模型。新功能包括:Amazon SageMaker HyperPod可大规模加速基础模型训练,能够缩短高达40%的训练时间,并可以确保持续数周或数月的训练过程不中断;Amazon SageMaker Inference 推理功能可平均降低50%的部署成本和20%的推理延迟;Amazon SageMaker Clarify可以帮助客户评估、比较和选择最佳模型;Amazon SageMaker Canvas的两项增强功能——用自然语言指令准备数据、利用模型进行大规模业务分析,将使客户能够更轻松、更快速地将生成式AI集成到他们的工作流程中。
强大的数据支持对生成式AI至关重要,在2023 re:Invent全球大会上,亚马逊云科技围绕数据基础设施、集成以及治理等推出多项服务及功能。
进一步丰富向量数据库选择,确保业务数据和向量数据同步支持生成式AI。亚马逊云科技推出了Amazon OpenSearch Serverless向量引擎、Amazon DocumentDB和Amazon DynamoDB的新向量搜索功能、Amazon Memory DB for Redis向量搜索预览版,提升生成式AI应用在响应和延迟方面的性能表现。亚马逊云科技还正式推出图数据库分析引擎Amazon Neptune Analytics,帮助Snapchat这样的应用在几秒钟内对数十亿个连接进行图形分析。
推出四项Zero-ETL集成特性,让跨数据存储的数据访问与分析更快速、更便捷。通过全新的Amazon Aurora PostgreSQL、Amazon DynamoDB、Amazon Relational Database Service(Amazon RDS)for MySQL与Amazon Redshift的Zero-ETL集成特性,使得在Amazon Redshift中连接和分析多个关系型和非关系型数据库的数据变得更加容易。此外,客户现在还可以使用Amazon OpenSearch Service对Amazon DynamoDB数据进行近乎实时的全文和向量搜索。无论数据存储在哪里,这些Zero-ETL集成特性都能简化数据连接和操作流程,使客户灵活地利用亚马逊云科广泛而领先的数据库和分析服务,深入挖掘新洞见的同时,更迅速地实现创新并做出更明智的数据驱动决策。
在数据治理方面,亚马逊云科技为Amazon DataZone推出了AI描述建议功能预览版,它能够为企业的数据集自动生成更易理解的业务描述,并提供该数据集的使用建议。亚马逊云科技还推出了Amazon Clean Rooms ML预览版,可帮助企业及其合作伙伴在集合数据上应用机器学习模型,而无需相互复制或共享原始数据,并为其推出了第一个专门帮助公司为营销用例创建相似细分市场的模型。
重塑云计算——自研芯片、存储
芯片是企业所有工作负载的基础。亚马逊云科技十多年来持续针对自研芯片进行创新,每一代自研芯片都提升性价比和能效;同时为客户提供了基于AMD、Intel以及英伟达等的最新芯片和实例组合。在2023 re:Invent全球大会上,亚马逊云科技推出Amazon Graviton4和Amazon Trainium2自研芯片,为机器学习训练和生成式AI应用等广泛的工作负载提供更高性价比和能效。
Graviton4与当前一代Graviton3处理器相比,性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上,为在Amazon Elastic Compute Cloud (Amazon EC2)上运行的工作负载提供最佳性能和能效;基于Graviton4的Amazon EC2 R8g实例目前已提供预览。值得一提的是,通过与光环新网和西云数据的紧密合作,基于Graviton3处理器的Amazon EC2 C7g、M7g、R7g实例目前均已在亚马逊云科技中国(北京)区域和中国(宁夏)区域正式可用,为中国客户广泛的云上工作负载带来更高性价比和能效。
Trainium2芯片专为以高性能训练具有数万亿个参数或变量的基础模型和大语言模型而构建。Trainium2与第一代Trainium芯片相比,性能提升多达4倍,内存提升3倍,能源效率(每瓦性能)提升多达2倍。Amazon EC2 Trn2实例采用最新的Trainium2,一个单独实例包含16个Trainium加速芯片。Trainium2实例致力于为客户在新一代EC2 UltraClusters中扩展多达100,000个Trainium2加速芯片,并与Amazon Elastic Fabric Adapter(EFA)PB级网络互联,提供的算力高达65 exaflops,客户可按需获得超级计算级别的性能。
Amazon Simple Storage Service(Amazon S3)自17年前推出以来,已成为最受欢迎的云存储服务之一,在全球拥有数百万各行各业的客户。在本次大会上,亚马逊云科技宣布Amazon S3 Express One Zone正式可用,与Amazon S3 Standard相比,数据访问速度提高至多10倍,数据请求成本降低50%,为机器学习训练和推理、交互式分析以及媒体内容创建等请求密集型工作负载提供最高性能存储。
亚马逊云科技在17年前就开创性地推出了无服务器技术,为客户提供极致的弹性和自动扩展能力。在2023 re:Invent全球大会上,亚马逊云科技推出了三款无服务器服务创新,帮助客户以任意规模分析和管理数据并显著简化运营,客户无需花费时间和精力去配置、管理和扩展其数据基础设施。其中,Amazon Aurora Limitless数据库可跨多个Amazon Aurora Serverless实例自动分发和查询数据,并能够扩展到每秒百万次的事务级写入并管理PB级数据。Amazon ElastiCache Serverless可以帮助客户在一分钟内创建高可用的缓存,并实时进行垂直和水平扩展以支持客户复杂的应用程序,且无需管理基础架构。Amazon Redshift Serverless利用人工智能(AI)预测工作负载并自动扩展和优化资源,帮助客户实现高性价比的目标。