Claude 3 VS GPT-4! 全球最强大模型易主？一起来看网友的脑洞实测！

作者：AI-GitHub发布时间：2024-03-06

昨晚，OpenAI最强竞争选手，Anthropic公司突然惊喜上线，时隔八个月推出了 Claude 3，世界目光再次聚焦到这一被视为 ChatGPT 强大竞争对手之一的多模态模型。

体验链接：https://claude.ai/ （文章后方有详细功能测评）

本次新发布的Claude 3系列包括三款型号：Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。

中杯 Haiku，轻量级的选择
大杯 Sonnet，平衡性能与速度
超大杯 Opus，AI 模型的巅峰之作

无论哪一款模型，在推理、数学、编码、多语言理解和视觉处理等方面的表现都相当亮眼。

其中作为旗舰级别的超大杯 Opus 模型，更是对复杂任务表现出接近人类的理解力和流利度，能够游刃有余地应对开放式问题，并巧妙解决各种复杂挑战。

有看客甚至惊呼：Claude 3终结了GPT-4时代。

那么，坐上了全球最强大模型新王座Claude 3是否名副其实呢？

Claude 3发布后，网友对它的各种测试（刁难）就接踵而来。

有网友把OpenAI前科学家Karpathy不久前刚出的《构建分词器》教程（2个小时13分钟），扔给Claude 3总结。Claude 3不负众望，只靠一轮提示词，就成功制作出了一篇内容丰富、图文并茂的 HTML 格式博客文章。

有网友让它为零基础小白创建一个聊天机器人的前端webUI——结果Claude 3毫无犹豫地就完成任务拆解，从核心代码到样式美化以及API本地配置，三大部分一气呵成，并可以直接部署到GitHub。

还有网友让Claude 3解谜题，被漂亮的答出。

甚至有网友在线挖坑，不过Claude 3好像不上当。

更有些网友看热闹不嫌事大，把Claude 3和 GPT-4放在一起进行了比拼：

有网友神仙发问，扔出修罗场问题让Claude 3回答。

有网友扔出了理综题目,并表示Claude 3更胜一筹。

有网友甩下复杂的英文文本，测评出Opus 的翻译不仅条理分明，而且分段和排版得当，使得阅读体验大幅提升。但若论翻译的流畅度与准确性，GPT-4 依旧略占上风。

有网友用一张风格复杂的设计稿截图考验 Opus 的细节还原能力。在网友明确指出需要还原样式后，Opus 精准把握设计元素，整体表现要比 GPT-4 要好。

有网友分别用 Opus 和 GPT-4 玩起了井字游戏，遗憾的是 Opus 并不能顺利地画出网格，而 GPT-4 则宣告成功。

形形色色，不一而足……总得来说是各有千秋。最强竞对的称号，绝非浪得虚名。

有趣的是，Claude 3 发布后，网友们讨论最多的却是它的老对手 ChatGPT。

圈内人也看热闹不嫌事大，英伟达高级科学家 Jim Fan 已经在期待 GPT-5 的亮相了：

至于是GPT-4.5，Sora开放测试，还是直接GPT-5？

OpenAI下一个产品又能否盖过Claude3的风头？

让我们拭目以待。

官方网址：https://www.anthropic.com/news/claude-3-family

体验链接：https://claude.ai/

报告链接：https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf

相关资讯

最热科技 2024-03-05

超越GPT-4！新神器Claude 3来了，全球最强大模型一夜易主

"在无尽的技术海洋中，每一个浪潮都可能预示着新的巨兽的觉醒。今天，我们见证了一个新巨兽的崛起——Claude 3。"Anthropic刚刚官宣：Claude 3来了！作为OpenAI最强竞争选手，此次它发布的新模型家族，以最强版Claude 3 Opus为代表，“已经实现了接近人类的理解能力”——在推理、数学、编码、多语言理解和视觉方面，全面超越GPT-4在内的所有大模型，直接重新树立行业基准的那种。浅看一下这份成绩单，就十分扎眼~几项数学类评测都是用0-shot超越GPT-4的4-8 shot

GPT-4 Claude OpenAI

格物时间 2024-03-05

全球最强大模型易主GPT-4被超越

GPT-4

环球网科技 2024-03-05

近期资讯

从自律到焦虑，智能手表如何精准拿捏中产的心理？

智能手表成中产阶级的“数字镣铐”？

互联网风云榜 2024-12-25

谁是11月最有影响力的老板IP？雷军蝉联冠军，于东来跻身前三

企业家IP该如何做？

新榜 2024-12-25

从不搞促销的1600平折扣超市，凭什么日销超50万？

连续14年蝉联超市业“顾客满意度”冠军。

联商网 2024-12-25

日赚超1400万，谁是中国最赚钱的高速公路？

以沪宁高速为代表，长三角和珠三角的高速公路堪称日进斗金，但全行业的亏损正日益扩大

出行一客 2024-12-25

工会硬控70小时，强如大众也妥协了

关厂计划取消，裁员3.5万人

超电实验室 2024-12-25

胖东来，靠电商冲出河南？

东来优选，全国发货。

字母榜 2024-12-25

东莞杀出131亿超级独角兽：年入11.71亿，中国第一

新能源时代，碳化硅越来越重要。

铅笔道 2024-12-25

从特斯拉、X到DOGE，马斯克的疯狂效率实验

管理政府和经营公司会一样吗？

镜相工作室 2024-12-25

生鲜前置仓赛道，朴朴、叮咚、小象谁能笑到最后？

“狭路”相逢，只有“有勇有谋者”才能胜出。

联商网 2024-12-25

加速洗牌，餐饮业撑不起近900万家门店

餐饮业已经严重供给过剩。

红餐网 2024-12-25

Claude 3 VS GPT-4! 全球最强大模型易主？一起来看网友的脑洞实测！

推荐体验

相关资讯

全球最强大模型易主 GPT-4被超越，Claude 3优势在哪里？

全球最强大模型易主 GPT-4被超越 Anthropic发布Claude 3系列模型

全球最强大模型易主！Anthropic发布Claude 3系列模型，能力全面超越GPT-4？

超越GPT-4！新神器Claude 3来了，全球最强大模型一夜易主

全球最强大模型易主GPT-4被超越

近期资讯

从自律到焦虑，智能手表如何精准拿捏中产的心理？

谁是11月最有影响力的老板IP？雷军蝉联冠军，于东来跻身前三

从不搞促销的1600平折扣超市，凭什么日销超50万？

日赚超1400万，谁是中国最赚钱的高速公路？

工会硬控70小时，强如大众也妥协了

胖东来，靠电商冲出河南？

东莞杀出131亿超级独角兽：年入11.71亿，中国第一

从特斯拉、X到DOGE，马斯克的疯狂效率实验

生鲜前置仓赛道，朴朴、叮咚、小象谁能笑到最后？

加速洗牌，餐饮业撑不起近900万家门店

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响