9.11和9.9哪个大，看AI大模型算错，我就放心了！#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希

作者：新闻夜航发布时间：2024-07-19

AI大模型人工智能

9.11和9.9哪个大，看AI大模型算错，我就放心了！#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希【查看原文】

相关资讯

9.11和9.9哪个大？AI大模型集体失智几乎全翻车了

没眼看……“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了？？强如GPT-4o，都坚定地认为9.11更大。谷歌Gemini Advanced付费版，同样的口径。新

AI大模型谷歌

2024-07-16

9.11和9.9哪个大? 大模型的复杂推理能力待提升

大部分大模型在问答中都错误地比较了小数点后的数字，认为9.11大于9.9，考虑到数字涉及的语境问题，记者将其限定为在数学语境下，如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…

ChatGPT

第一财经 2024-07-19

9.11和9.9哪个大？简单数学题8家AI大模型平台都翻了车

元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。目前全球公认第一梯队的大模型ChatGPT，在被问到“9.11和9.9哪个大”时回复称，小数点后面的数字“11大于9”，因此9.11大。

AI大模型 ChatGPT 商汤

红星新闻 2024-07-17

博士生水准无语！9.11和9.9哪个大最新、强AI模型又翻车

快科技9月14日消息，OpenAI推出了OpenAI o1预览模型，官方宣称推理能力更强，可达理科博士生水准。按照官方技术博客说法，o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI

OpenAI 人工智能

雪花 2024-09-14

9.11和9.9哪个大？AI翻车！好多网友竟也争论不休……

没想到，一道小学生难度的数学题，竟然难倒了一众海内外AI大模型。元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。

AI大模型 ChatGPT 商汤

光明网 2024-07-17

近期资讯

售价499元！理想车用饮水机发布：支持一秒速热

快科技12月31日消息，理想汽车推出了一款专为旗下车型设计的车内悠享即热饮水机，定价为499元。这款饮水机适用于理想MEGA、理想L9、理想L8和理想L7车型。该饮水机采用220V供电，圆柱形设

王略 2024-12-31

CPU之王！高通最激进的Soc现身：4.47GHz频率史无前例

快科技12月31日消息，三星Galaxy S25 Ultra国行版现身Geekbench 6跑分网站，型号是SM-S9380，单核成绩是3049，多核成绩是9793，这是三星最强悍的高端旗舰。据悉，该机搭载高通骁龙8 Elite处理

2024-12-31

抖音电商：2024全年销售154亿单 830个产业带销售额过亿

快科技12月31日消息，据媒体报道，今天，抖音电商发布《直播间里的中国制造——2024抖音电商产业带发展报告》，全面盘点2024年全国产业带地区实体经济和中小商家在该平台的发展情况。

2024-12-31

北京集中治理大数据杀熟等问题对美团、百度调研座谈

快科技12月31日消息，据“网信北京”公众号，近期，按照中央网信办等四部门联合发布的“清朗·网络平台算法典型问题治理”专项行动有关工作部署，北京市委网信办牵头

拾柒 2024-12-31

SU7璀璨洋红亮相：与小米15定制版胭脂红绝配

快科技12月31日消息，今天上午，小米SU7正式公布了SU7的小米15周年限定色——璀璨洋红。官方图公布之后，新配色受到不少女性用户的喜爱，不仅新车主可以享受，锁单且未交付用户也可

2024-12-31

怪不得有的车厘子会红到发黑：背后原因揭开

12月31日消息，据媒体报道，车厘子虽然吃起来甜，但总含糖量不算高，约为12.8克/100克，由于其中约5.3克为果糖，口感才会偏甜，车厘子的升糖指数只有22，比苹果（36）、梨（36）和葡萄（43）等绝

振亭 2024-12-31

交警查车发现一车四人都喝了酒：谁喝得少谁开车

快科技12月31日消息，公安部交通管理局披露了一起酒后驾车的案例，引起网友热议。据介绍，2024年12月24日，抚吉高速吉水南收费站，交警开展违法整治时，查获饮酒后驾车的男子谢某，其呼气检测

2024-12-31

京东方副总裁：干技术就要有干技术的尊严不能只卷价格

快科技12月1日消息，据媒体报道，在12月27日举行的BOE（京东方）“向新2025”交流活动中，京东方回顾了2024年在多个关键领域取得的成绩，并剖析了京东方在战略、技术、应用、生态、模

2024-12-31

极越07高速上被奔驰追尾网友：还有配件吗

快科技12月31日消息，距离极越汽车闪崩已经过去了一段时间，热度渐渐消退，而当前最关心这件事的莫过于车主群体了。屋漏偏逢连夜雨，近日，有极越07车主就遭遇了追尾事故，而这也再次引发网友

2024-12-31

《射雕英雄传》电影六大人物海报：武林绝技出神入化

今日(12月31日)电影《射雕英雄传：侠之大者》六大人物海报发布。各路英豪齐聚一堂，武林绝技，出神入化。除了由肖战饰演的郭靖与庄达菲扮演的黄蓉，还包括欧阳锋、华筝、大汗以及托雷等角色

2024-12-31

9.11和9.9哪个大，看AI大模型算错，我就放心了！#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希

推荐体验

相关资讯

9.11和9.9哪个大？AI大模型集体失智几乎全翻车了

9.11和9.9哪个大? 大模型的复杂推理能力待提升

9.11和9.9哪个大？简单数学题8家AI大模型平台都翻了车

博士生水准无语！9.11和9.9哪个大最新、强AI模型又翻车

9.11和9.9哪个大？AI翻车！好多网友竟也争论不休……

近期资讯

售价499元！理想车用饮水机发布：支持一秒速热

CPU之王！高通最激进的Soc现身：4.47GHz频率史无前例

抖音电商：2024全年销售154亿单 830个产业带销售额过亿

北京集中治理大数据杀熟等问题对美团、百度调研座谈

SU7璀璨洋红亮相：与小米15定制版胭脂红绝配

怪不得有的车厘子会红到发黑：背后原因揭开

交警查车发现一车四人都喝了酒：谁喝得少谁开车

京东方副总裁：干技术就要有干技术的尊严不能只卷价格

极越07高速上被奔驰追尾网友：还有配件吗

《射雕英雄传》电影六大人物海报：武林绝技出神入化

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响