在过去的一年多里,生成式AI一直都是全球高度关注的科技领域。然而,要想让生成式AI与大模型真正在千行百业的应用场景落地,却并不是一件容易的事情。
2024年3月4日,Anthropic正式发布了Claude 3大模型,很快便凭借在推理、数学、编码、多语言理解和视觉等多方面的卓越表现,被众多业界人士誉为“全球最强大模型”。而在这一系列亮眼成绩的背后,则是另一家科技巨头亚马逊的鼎力支持——迄今为止,亚马逊对Anthropic的总投资已经达到了40亿美元。
正是对生成式AI创新共同的期许和愿景,让Anthropic与亚马逊这两家科技企业走到了一起。
没有一个模型能适用所有场景
亚马逊云科技大中华区产品部总经理陈晓建指出,亚马逊云科技在生成式AI领域提供了三层技术栈,从最底层提供的高性能基础设施,到中间层提供的最广泛基础模型选择,再到最顶层提供的应用生成式AI技术的开箱即用的云服务,亚马逊云科技让不同客户都可以根据自己的实际需求,选择不同层级的产品或是定制大模型来支持自身业务,同时有效保障企业的数据安全。
“生成式AI从产品发布到现在,已经过去了一年多的时间,亚马逊云科技与众多客户也开展了许多方面的合作。在合作中我们有一个非常深刻的体会,那就是各行各业的场景千变万化,即使大模型的技术能力再强,也不会有一个基础模型能够适用所有业务场景。”陈晓建表示,正是基于对“没有一个模型可以适用于所有业务场景”的认识,亚马逊云科技在Amazon Bedrock中为客户提供了各种领先的基础模型,其中既有Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B等知名的开源模型,也有Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非开源模型。
“尽管大模型非常重要,但是仅仅靠大模型对企业生产仍然是远远不够的。企业需要一系列周边的能力来正确、合理、安全、高效地使用大模型,这就是亚马逊云科技一系列产品所提供的价值所在。”陈晓建透露,除了亚马逊对Anthropic的40亿美元投资以外,双方还在生成式AI领域开展了广泛合作,包括Anthropic将亚马逊云科技作为首选云服务提供商,利用亚马逊云科技的Amazon Trainium及Amazon Inferentia芯片构建模型,承诺为全球亚马逊云科技客户提供在Amazon Bedrock上对其未来基础模型的长期访问权限等等。
Claude 3大模型的卓越表现
陈晓建介绍说,作为全球最领先的大模型之一,Anthropic在Amazon Bedrock上提供的Claude 3系列模型一共包含了三个模型,分别是具有几乎即时响应能力且最紧凑的Claude 3 Haiku、在技能与速度之间达到理想平衡的Claude 3 Sonnet、以及为处理高度复杂任务设计的最智能模型Claude 3 Opus。“这三个模型分别适用于不同场景,客户可以根据自己的商业需求,从中选择最合适的智能、速度和价格组合。”
在数学问题、编程练习和科学推理等标准评估中,Claude 3超越了之前的所有模型,创造了大模型智能水平的新纪录。与此同时,Claude 3还具备了多模态能力,可以接收基于图片、图表、图形、技术图解及光学字符识别 (OCR)的输入,并且延迟低于其他多模态模型。在处理挑战性开放问题(100Q Hard)上,Claude 3的回答准确性有着明显提升,并且减少了错误答案。除此以外,Claude 3系列模型还可提供200K超长上下文准确召回,针对某些特殊场景还会开放支持1M token的上下文窗口,大海捞针(Needle In A Haystack, NIAH)召回率表现优异,甚至还能识别出测试本身的局限。
陈晓建表示,Claude 3 Opus是Claude3模型中中智能水平最高的模型,适合处理复杂的开放式场景;Claude 3 Sonnet兼具智能和速度,可适用于绝大部分场景;而Claude 3 Haiku则是最快且最具成本效益的模型,特别适合大容量用例和大量的批处理任务。
Claude 3大模型的应用场景
在谈到目前Claude 3大模型的应用场景时,陈晓建重点展示了以下几个方面的应用:
1、内容续写:Claude 3能够模仿小说家的风格来续写小说,不但写作风格较其他大模型更加接近原作者,而且在故事性上也有明显提升。
2、代码辅助:与其他大模型相比,Claude 3给出的解答更贴近程序员的习惯,不仅可以提供建议代码,而且还能给出详细步骤,帮助程序员在服务管理平台Nacos中正确修改配置。
3、电商商品描述撰写:在电商行业,通过图像或者效果图进行图片解析或者打标签是非常普遍和基础的操作。Claude 3能够根据商品的模特展示图精准捕捉产品细节,生成更加精准的产品描述。
4、长文本知识召回总结:根据提供的相关服务文档,Claude 3能够准确回答该服务在不同区域的价格,而且较其他大模型能够提供更加完整的信息提取。
打通生成式AI的“最后三公里”
Amazon Bedrock是如何把Claude 3大模型的能力,通过Amazon Bedrock提供给用户的呢?陈晓建表示主要是通过以下几个方面:
1、知识库功能Knowledge Bases for Amazon Bedrock:它可以建立一个企业内部知识库所做的所有工作,并提供全方位的托管支持,显著降低用户的工作负荷。借助该知识库功能,用户可以在托管式服务中将FM连接到数据来源,实现检索增强生成(RAG),进一步提升FM的功能,更加了解自己的具体领域和组织。从知识库检索到的所有信息均附有引文,可提高透明度并最大限度地减少幻觉。
2、代理功能Agents for Amazon Bedrock:如果将大模型比作大脑,那么代理功能就像是手脚,将大脑需求进行推理分解并逐步执行,给出解决问题的逻辑步骤,让大脑可以通过手脚与整个物质世界进行交互,也就是使生成式AI应用能够使用自然语言来执行多步骤的业务任务。
3、加速实现负责任AI的Guardrails for Amazon Bedrock:亚马逊云科技承诺,在提供所有生成式AI服务的背后一定会做负责任的AI。一是通过定制安全和隐私控制来改善生成式AI应用的用户体验;二是生成适合应用程序用例的受控的响应;三是通过负责任的AI政策增强人工智能,确保其应用业务的安全性;四是通过在大模型的回复结果中屏蔽敏感的个人隐私信息,来实现对用户隐私的保护。
4、合规:在Amazon Bedrock的实践中,亚马逊云科技充分考虑到了符合行业或不同国家的安全合规。所有数据在传输或存储过程中都经过了加密,客户还可以使用亚马逊云科技的密钥管理系统对密钥进行管理和使用。整个网络也是完全根据不同的私有网络,将客户的业务、数据和其他用户的环境进行严格隔离。亚马逊云科技不会将任何用户数据用于Amazon Bedrock或大模型的开发改进,Amazon Bedrock还提供了全面的监控和日志记录功能,符合包括ISO、SOC、CSA STAR 2级在内的常见合规标准,符合HIPAA资格,客户可以在符合GDPR的情况下使用 Amazon Bedrock,全方面保证了客户的业务和数据安全。
“Amazon Bedrock提供对全球领先基础模型的接入,并提供拥有知识库、代理、Guardrails等各种便捷工具,同时确保数据隐私和安全,是企业构建和应用生成式AI的首选。”陈晓建说道,“针对客户打通生成式AI的‘最后三公里’工程化挑战,亚马逊云科技拥有丰富的专业技术支持资源,包括架构师、产品专家、人工智能实验室、数据实验室、快速原型团队、专业服务团队,因而是客户开展生成式AI创新的不二之选。”