近两年,人工智能技术已经取得突破性进展,AI大模型领域的“百模大战”更是愈演愈烈;与此同时,人工智能在千行百业中的应用也正在走深向实,越来越多的企业开始寻求在业务场景中落地AI大模型。
来自Gartner的预测显示,到2027年,企业使用的AI模型中将有一半以上具有特定行业或业务功能,而在2023年这一比例仅为不到1%。麦肯锡的研究报告也显示,应用生成式AI大模型每年为企业端带来的经济价值为2.6万亿至4.4万亿美元。
面对这一趋势,在过去很长一段时间里,亚马逊云科技主要是通过携手Anthropic等第三方合作伙伴,共同推进AI大模型在企业中的落地。截至目前,亚马逊云科技对Anthropic的总投资额已经达到80亿美元;同时,亚马逊云科技也在不断提升自身在AI大模型领域的产品和技术能力。不过,这些并不代表亚马逊云科技不会亲自下场。
在刚刚召开的2024亚马逊云科技re:Invent全球大会上,亚马逊云科技宣布推出新一代基础模型Amazon Nova,不仅全面涵盖文本对话、图片生成、视频生成等诸多领域,还在多种任务处理上展现出强大的性能,并具备行业领先的性价比。因此,Amazon Nova这一“颠覆式”创新产品,称得上是基础模型领域的最强“全家桶”。
作为新一代基础模型,Amazon Nova全在何处?
在生成式AI全面崛起的2023年,文本对话、图片生成是最主流的应用场景,进入2024年,文生视频开始成为生成式AI新的杀手级应用。随着越来越多的科技巨头投身到AI大模型领域,生成式AI的应用场景持续扩展,而Amazon Nova的横空出世,无疑是基础模型的集大成者。
亚马逊云科技全新推出的Amazon Nova,既包括超快速文本生成模型Amazon Nova Micro,也包括能够处理文本、图像和视频并生成文本的多模态模型Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier。此外,亚马逊云科技还推出了用于生成高质量图像的Amazon Nova Canvas和用于生成高质量视频的Amazon Nova Reel。
其中,Amazon Nova Micro是一款仅处理文本的模型,具有低延迟、低成本等特点,每秒210个输出token的行业领先速度,非常适合需要快速响应的应用场景。同时,Amazon Nova Micro在十多项适用基准测试中的表现,都与Meta的LLaMa 3.1 8B、Google Gemini 1.5 Flash-8B相当或更优。
Amazon Nova Lite是一款极具成本效益的多模态模型,能够以低成本快速处理图像、视频和文本输入。不仅如此,Amazon Nova Lite在十多项基准测试中,与OpenAI的GPT-4o mini、Google的Gemini 1.5 Flash-8B、Anthropic的Claude Haiku 3.5相比表现相当或更优。
Amazon Nova Pro是一款功能强大的多模态模型,并在准确性、速度和成本之间实现了更好的平衡,适合多种任务。在与OpenAI的GPT-4o、Google的Gemini 1.5 Pro和Anthropic的Claude Sonnet 3.5v2测试对比中,Amazon Nova Pro同样表现优异。
相比较以上三种常用模型,Amazon Nova Premier是该系列中最强大的多模态模型,专为复杂推理任务而生,是模型蒸馏的最佳“教师模型”。
除此之外,Amazon Nova Canvas是一款先进的图像生成模型,能够根据输入的文本或图像生成专业级的视觉内容,并让客户可以通过文本轻松调整图像,控制颜色方案和布局。而Amazon Nova Reel则是一款先进的视频生成模型,能够帮助客户轻松从文本和图像创建高质量视频,适用于广告、营销和培训等内容创作。这两款产品都内置安全控制措施,包括水印、内容审核等功能。
都是AI大模型,Amazon Nova有什么不一样?
尽管企业应用AI大模型已经成为大势所趋,但对于大多数企业用户来说,他们在落地AI大模型过程中,依然面临成本高、速度慢、准确度低等问题。针对这些问题,主流AI大模型厂商都在不断对模型进行优化,而Amazon Nova所追求的同样不只是“更全”那么简单,还要“更快、更强、更经济”。
相比较而言,Amazon Nova模型快速,更具有成本效益,且设计上易于与客户的系统和数据无缝集成。Amazon Nova之所以能够做到这一点,首先是能够与Amazon Bedrock的无缝集成。亚马逊云科技推出的Amazon Bedrock模型库,可以让企业无需担心底层基础设施,轻松实现大模型构建和扩展生成式 AI应用。
借助Amazon Bedrock,企业可以轻松试用和评估Amazon Nova模型及其他模型。而Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro在各自智能类别中,成本比Amazon Bedrock中表现最佳的模型至少便宜75%,同时也是 Amazon Bedrock中对应类别速度最快的模型。
Amazon Nova模型同时支持自定义微调,允许客户根据自身专有数据中的已标记示例来提升准确性。具体来说,Amazon Nova模型能够从客户的数据(包括文本、图像和视频)中学习最重要的信息,随后Amazon Bedrock会训练一个私有的微调模型,以提供定制化响应。
此外,Amazon Nova模型还支持蒸馏,可以将规模更大、实力更强的“教师模型”中的特定知识转移到更小的模型上,从而实现更高的精确度、更快的响应速度以及更低的运营成本。不仅如此,Amazon Nova模型通过Amazon Bedrock知识库紧密集成,能够让客户利用自身的数据确保生成内容的高度准确性和相关性;Amazon Nova模型还可以针对智能体应用进行优化,便于智能体应用在执行多步骤任务时通过多个API与企业的专有系统和数据进行交互。
事实上,Amazon Nova之所以能够后来者居上,在性能、成本等方面表现突出,与亚马逊云科技此前在AI大模型领域的持续布局密不可分。作为全球云计算的开创者和引领者,亚马逊云科技一直致力于为企业大模型应用提供强大的技术和服务支撑,在此过程中所积累的经验无疑可以让Amazon Nova脱颖而出。
开辟AI大模型新局面,为企业创造更多可能
伴随着AI大模型在理解能力、生成能力和决策能力等方面的持续进化,各行各业在AI大模型的应用上正在从业务类场景迈向决策管理场景,从“一对N”(如文生文、文生图、文生视频等)向“N对N”(文字、图片、视频、音频相互生成)迈进。
为此,亚马逊云科技也计划在2025年推出Amazon Nova语音到语音模型(Speech-to-Speech),以及“任意到任意”模型(Any-to-Any)。其中,语音到语音模型旨在通过理解自然语言的流式语音输入,解释语言和非语言信号(如语调和节奏),提供流畅的类人交互,彻底改变对话式AI应用,确保低延迟的双向交流。
而“任意到任意”模型则能够接受文本、图像、音频和视频作为输入,并以任意模态生成输出。该模型将简化应用开发,使同一模型能够执行多种任务,如内容模态转换、内容编辑,以及驱动能够理解和生成所有模态的AI代理。
从亚马逊云科技推出Amazon Bedrock模型库,持续降低企业应用AI大模型门槛,到新一代基础模型Amazon Nova的震撼亮相,亚马逊云科技之所以全面投身到基础模型领域,与亚马逊云科技以客户为中心的理念密不可分。
一直以来,亚马逊云科技始终秉承从客户角度出发,以逆向工作法开展产品、技术和服务创新,在AI大模型领域也是如此。毕竟,没有一种AI解决方案和基础模型能解决所有问题,Amazon Nova的发布,不仅有望重塑AI大模型市场格局,也将给企业的AI大模型应用带来新选择,帮助企业创造更多可能。
免责声明:
前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。