“OpenAI叛军”突起，GPT-4一夜之间被拉下神坛！

作者：i黑马发布时间：2024-03-05

OpenAI GPT-4

昨天，Anthropic发布最新Claude 3系列模型，让全球用户再次沸腾！

据了解，Claude 3在多模态和语言能力指标上，已全面碾压GPT-4。

甚至在推理、数学、编码、多语言理解和视觉方面，都树立了新的行业基准。

网友直呼，大模型又变天了！

Anthropic是谁？

据说，Anthropic就是原OpenAI员工组建的公司，因为一些发展理念不合才直接“反叛”，并成为了OpenAI的最强劲敌。

本次Anthropic共发布三个模型，性能依次从低到高分别是：Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus，并发布了一份长达42页的技术报告。

其中，Claude 3 Opus在本系列中性能最强大。该模型已在多项AI系统常用评估标准中领先业界LLM，如本科级别专业知识（MMLU）、研究生级别专家推理（GPQA）、基础数学（GSM8K）等。

值得一提的是，Claude 3 Opus在处理复杂任务时，其理解和表达能力几乎接近于人类。这意味，人类朝AGI又近了一步。

如果讲得更具体一些，Claude 3系列模型的超强性能主要体现在五个方面：

一是3秒即可读完10k token论文。

Haiku可在3秒内，阅读一个包含图表和图形的信息和数据密集型的研究论文（大约10k token）。

二是超强多模态视觉能力。

该系列模型可处理各类视觉格式，如照片、图表、图形和技术绘图等，甚至在部分视觉能力上，性能刷新SOTA。

三是完善因理解不到位，而拒绝回答的问题。

尤其是可能触及系统安全边界的提问时，大幅度减少了拒绝回应的情况。

四是跟此前版本相比，Claude 3模型准确度大幅提升。

且，未来可能还会增加“引用功能”，即直接指向参考材料中的具体句子，从而验证答案。

五是支持200K超长上下文。

Claude 3系列模型，都将支持至少20万token的上下文窗口和超100万token的输入。且，官方或将向特定用户开放处理更大上下文窗口的功能。

报告数据显示，Claude 3 Opus在200Ktoken的“大海捞针”（NIAH）测试中，准确率高达99%+。

目前，Claude 3 Sonnet、Claude 3 Opus，可在claude.ai及其覆盖159个国家的Claude API上使用。目前开通Claude Pro的用户，则可直接使用性能最强大的Claude 3 Opus。

相关资讯

一夜之间，OpenAI改变历史，GPT-4o将要干翻所有语音助手

OpenAI 苹果谷歌

小陈言社会 2024-05-21

一夜之间，全世界都在讨论Ta→

ChatGPT是由美国人工智能实验室OpenAI开发的一个对话AI模型，于2022年11月正式推出，因其极其出色的文本生成和对话交互能力在世界范围内迅速走红，五天内用户破百万，两个月用户破亿，ChatGPT一…

ChatGPT 人工智能 OpenAI

重庆日报 2023-02-08

雷科技 2023-02-02

近期资讯

从特斯拉、X到DOGE，马斯克的疯狂效率实验

管理政府和经营公司会一样吗？

镜相工作室 2024-12-25

十大热门阅读 App，到底谁更强？

科技狐 2024-12-25

消息称某子品牌新机正测试7500mAh电池+90W快充，或为REDMI机型

IT之家 2024-12-25

工会硬控70小时，强如大众也妥协了

关厂计划取消，裁员3.5万人

超电实验室 2024-12-25

东莞杀出131亿超级独角兽：年入11.71亿，中国第一

新能源时代，碳化硅越来越重要。

铅笔道 2024-12-25

大模型成为政府智慧办公的“超级大脑”

IT时报 2024-12-25

英国拟试用AI工具评估糖尿病风险

36氪 2024-12-25

加速洗牌，餐饮业撑不起近900万家门店

餐饮业已经严重供给过剩。

红餐网 2024-12-25

生鲜前置仓赛道，朴朴、叮咚、小象谁能笑到最后？

“狭路”相逢，只有“有勇有谋者”才能胜出。

联商网 2024-12-25

董明珠称企业家带货没有对和错：我喜欢直播两小时卖几千万又怎样

快科技 2024-12-25

“OpenAI叛军”突起，GPT-4一夜之间被拉下神坛！

推荐体验

相关资讯

一夜之间，OpenAI改变历史，GPT-4o将要干翻所有语音助手

一夜之间，全世界都在讨论Ta→

一夜之间，谷歌版GPT-4o和AI手机全上市了

一夜之间，它让我成了打工皇帝

一夜之间，AIGC成了所有打工人的“天敌”

近期资讯

从特斯拉、X到DOGE，马斯克的疯狂效率实验

十大热门阅读 App，到底谁更强？

消息称某子品牌新机正测试7500mAh电池+90W快充，或为REDMI机型

工会硬控70小时，强如大众也妥协了

东莞杀出131亿超级独角兽：年入11.71亿，中国第一

大模型成为政府智慧办公的“超级大脑”

英国拟试用AI工具评估糖尿病风险

加速洗牌，餐饮业撑不起近900万家门店

生鲜前置仓赛道，朴朴、叮咚、小象谁能笑到最后？

董明珠称企业家带货没有对和错：我喜欢直播两小时卖几千万又怎样

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响