9.11和9.9哪个大？AI大模型集体失智几乎全翻车了

发布时间：2024-07-16

AI大模型谷歌

没眼看……“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了？？强如GPT-4o，都坚定地认为9.11更大。谷歌Gemini Advanced付费版，同样的口径。新...【查看原文】

相关资讯

9.11和9.9哪个大？AI翻车！好多网友竟也争论不休……

没想到，一道小学生难度的数学题，竟然难倒了一众海内外AI大模型。元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。

AI大模型 ChatGPT 商汤

光明网 2024-07-17

博士生水准无语！9.11和9.9哪个大最新、强AI模型又翻车

快科技9月14日消息，OpenAI推出了OpenAI o1预览模型，官方宣称推理能力更强，可达理科博士生水准。按照官方技术博客说法，o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI

OpenAI 人工智能

雪花 2024-09-14

9.11和9.9哪个大，看AI大模型算错，我就放心了！#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希

AI大模型人工智能

新闻夜航 2024-07-19

9.11和9.9哪个大? 大模型的复杂推理能力待提升

大部分大模型在问答中都错误地比较了小数点后的数字，认为9.11大于9.9，考虑到数字涉及的语境问题，记者将其限定为在数学语境下，如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…

ChatGPT

第一财经 2024-07-19

9.11和9.9哪个大？OpenAI刚官宣的GPT-4o mini竟然也翻车了|新榜

根据GPT-4omini在多个关键基准测试中的得分，可以看出，其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色，优于市场上其他小型模型。据ArtificialAnalysis统计，GPT-4omin…

OpenAI 编程

新榜 2024-08-11

近期资讯

鸿蒙开发：文本合成语音

在鸿蒙当中，如何实现根据指定的文本进行合成语音合成播放呢，其实也是非常的简单，因为鸿蒙当中也有textToSpeech。

程序员一鸣 2024-12-30

Android U WMS: 近期任务动画(2)

为了不把“战线”拉得太长，上一篇文章省略了 fixed rotation 的分析，本文就重点分析这个。 fixed rotation 由于是从一个横屏的 app 返回竖屏的桌面，这里利用 launch

大胃粥 2024-12-30

【OpenHarmony】鸿蒙 UI动画开发之lottieArkTS

lottie是一个适用于OpenHarmony的动画库，它可以解析Adobe After Effects软件通过Bodymovin插件导出的json格式的动画，并在移动设备上进行本地渲染。

塞尔维亚大汉 2024-12-30

揭秘华为南方工厂打造高端存储的奥秘：可靠性7个9！

快科技12月30日消息，今日，华为数据存储公众号发文，揭秘了华为南方工厂打造高端存储的奥秘——可靠性7个9如何达成。据介绍，7个9代表着年意外停机时间不超过3秒，作为存放企业关键

2024-12-30

2024-12-30

摇粒绒内胆：贵人鸟三合一冲锋衣109元新低（单夹克99元）

天猫贵人鸟户外旗舰店，贵人鸟三合一冲锋衣日常售价409元，下单可领300 元限时券，实付109元到手。连帽可拆卸三合一、石墨烯涂层三合一款此价，另有单夹克款99元可选。共有18款可选。防泼水

2024-12-30

解锁AI潜力：AI在销售领域的应用案例(非Chatbot)

作者 | Shaw Talebi 编译 | 岳扬客户向我提出的最常见需求是“为我打造一个专属的聊天机器人。”虽然这种需求是解决某些问题的好办法，但远不是万能的。在本篇文章中，我将分享企业可以利用

Baihai_IDP 2024-12-30

消费降级磨刀霍霍向电影，行业风光难再？

2024对于电影人来说应当是个需要转变的年份

文娱价值官 2024-12-30

9.11和9.9哪个大？AI大模型集体失智几乎全翻车了

推荐体验

相关资讯

9.11和9.9哪个大？AI翻车！好多网友竟也争论不休……

博士生水准无语！9.11和9.9哪个大最新、强AI模型又翻车

9.11和9.9哪个大，看AI大模型算错，我就放心了！#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希

9.11和9.9哪个大? 大模型的复杂推理能力待提升

9.11和9.9哪个大？OpenAI刚官宣的GPT-4o mini竟然也翻车了|新榜

近期资讯

鸿蒙开发：文本合成语音

Android U WMS: 近期任务动画(2)

【OpenHarmony】鸿蒙 UI动画开发之lottieArkTS

揭秘华为南方工厂打造高端存储的奥秘：可靠性7个9！

C#/.NET/.NET Core技术前沿周刊 | 第 19 期（2024年12.23-12.29）

鸿蒙开发：自定义一个车牌字母键盘

老外评选年度10大游戏：《黑神话》《宇宙机器人》前三

摇粒绒内胆：贵人鸟三合一冲锋衣109元新低（单夹克99元）

解锁AI潜力：AI在销售领域的应用案例(非Chatbot)

消费降级磨刀霍霍向电影，行业风光难再？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

9.11和9.9哪个大？AI大模型集体失智 几乎全翻车了

9.11和9.9哪个大？AI大模型集体失智几乎全翻车了