OpenAI最强竞对发布Claude 3，超过GPT-4，具有接近人类的理解能力

作者：学术头条发布时间：2024-05-11

刚刚，被称为“OpenAI最强竞对”的大模型公司 Anthropic 重磅发布了其第三代人工智能（AI）模型 ——Claude 3 系列模型，包括 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。

其中，Claude 3 Opu 为 Claude 3 系列模型的最强版本，具有接近人类的理解能力，可以灵巧地处理开放式提示和复杂的任务，根据官方给到的资料，其性能全面超过了 GPT-4。

值得一提的是，Claude 3 系列模型具有与其他领先模型同等的复杂视觉功能，可以处理各种视觉格式，包括照片、图表、图形和技术图表。

Anthropic 在其官方 X 上表示，Claude 3 系列模型“在推理、数学、编码、多语言理解和视觉方面树立了新的行业基准”。

据介绍，Claude 3 Opus 和 Claude 3 Sonnet 现已可以通过 API 直接访问。目前，API 也已全面开放，开发人员可立即开始使用这些模型。

另外，Claude 3 Sonnet 还可以供部分地区的用户在网站上免费体验，而 Claude 3 Opus 的使用权限，则只开放给了 Claude Pro 用户。

此外，Anthropic 团队还表示，Claude 3 系列模型解决了之前模型经常出现“不必要的拒绝”的问题。

智能新标准

评测结果显示，Claude 3 Opus 在 AI 系统的大多数常用评估基准上都优于同类产品，包括本科生水平的专家知识（MMLU）、研究生水平的专家推理（GPQA）、基础数学（GSM8K）等。它在复杂任务上表现出了接近人类水平的理解力和流畅性，“引领着通用智能的前沿”。

所有 Claude 3 模型在分析和预测、细微内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面的能力都得到了提高。

近乎即时的结果

Claude 3 系列模型支持实时客户聊天、自动完成和数据提取任务，在这些任务中，响应是即时和实时的。

其中，Claude 3 Haiku 是市场上同智能类别中速度最快、性价比最高的模型。它可以在三秒内读取 arXiv 上一篇信息和数据密集的研究论文（约 10k token），并附带图表和图形。

在绝大多数工作负载中，Claude 3 Sonnet 的智能水平比 Claude 2 和 Claude 2.1 高出了 2 倍。它在知识检索或销售自动化等要求快速响应的任务中表现出色。Claude 3 Opus 的速度要慢一些，与 Claude 2 和 Claude 2.1 类似，但智能水平更高。

准确性提高

与 Claude 2.1 相比，Claude 3 Opus 在具有挑战性的开放式问题上的准确率（或正确答案）提高了两倍，同时也减少了错误答案。

除了做出更可信的回答外，Claude 3 系列模型为来将启用引用功能，这样就可以通过指出参考资料中的精确句子来验证答案。

200K 上下文窗口和近乎完美的记忆

现在，Claude 3 系列模型可提供 200K 上下文窗口。不过，所有三种型号都能接受超过 100 万个 token 的输入，未来也可能会向需要增强处理能力的特定客户提供这种服务。另外，Claude 3 Opus 实现了接近完美的召回率，准确率超过 99%。

Anthropic 团队表示，为提高模型的安全性和透明度，他们将继续开发诸如宪法人工智能（Constitutional AI）等方法，并对模型进行微调，以减轻新模式可能带来的隐私问题。

虽然与之前的模型相比，Claude 3 系列模型在生物知识、网络相关知识和自主性等关键指标上取得了进步，但根据“负责任扩展政策”（ Responsible Scaling Policy），仍处于 AI 安全等级 2（ASL-2）。红队评估结果显示，Claude 3 系列模型目前造成灾难性风险的可能性微乎其微。

更易于使用

Claude 3 系列模型更善于遵循复杂的多步骤指令。它们尤其擅长遵循品牌声音和响应准则，并开发出用户可以信赖的面向客户的体验。此外，Claude 3 系列模型更善于以 JSON 等格式生成流行的结构化输出，从而更易于指导自然语言分类和情感分析等用例。

在官方博客的最后，Anthropic 团队写道：

“在推动 AI 能力发展的同时，我们也同样致力于确保我们的安全防护措施能够跟上性能飞跃的步伐。我们的假设是，站在 AI 发展的前沿是引导其走向积极社会成果的最有效方式。”

OpenAI最强竞对发布Claude 3，超过GPT-4，具有接近人类的理解能力

推荐体验

相关资讯

刚刚，OpenAI最强竞对发布Claude 3，超过GPT-4，具有接近人类的理解能力

Claude 3重磅发布：超过GPT-4，具有接近人类的理解能力

Anthropic 发布 Claude 3 系列大模型：理解能力接近人类，性能超 GPT-4

GPT-4时代终结！Claude 3问世，理解力接近人类！

超越GPT-4 接近人类水平！Claude 3系列大模型惊艳问世

近期资讯

美菱420升冰箱BCD-420WP9CZX：补贴580元，性价比之选

软通天枢2024：以工业仿真为核心，加速推进新型工业化

统帅410升风冷变频冰箱：大容量、静音、高品质，家庭冰箱新标杆

小米智能摄像机超级新品即将上市！

三星电子未能供应高通3nm骁龙8旗舰芯片高通仍要求开发2nm制程芯片

OPPO Find N5折叠屏配置已曝光：超薄大折叠，5纳米工艺

江苏德宜取得一种玻璃纤维布切边装置专利，适配不同宽度的玻璃纤维布切边需求

江西省顺丰纸业取得烘缸热量传导分散装置专利，能够对烘缸表面污垢进行清理避免影响传热效率

中缝利华取得布料自动裁切设备专利，提高工作效率降低人工成本

山东骏程取得钢丝绳插编辅助装置专利，提高钢丝绳插编效率

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响