9.11和9.9哪个大，看AI大模型算错，我就放心了！#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希

作者：新闻夜航发布时间：2024-07-19

AI大模型人工智能

9.11和9.9哪个大，看AI大模型算错，我就放心了！#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希【查看原文】

相关资讯

9.11和9.9哪个大？AI大模型集体失智几乎全翻车了

没眼看……“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了？？强如GPT-4o，都坚定地认为9.11更大。谷歌Gemini Advanced付费版，同样的口径。新

AI大模型谷歌

2024-07-16

9.11和9.9哪个大? 大模型的复杂推理能力待提升

大部分大模型在问答中都错误地比较了小数点后的数字，认为9.11大于9.9，考虑到数字涉及的语境问题，记者将其限定为在数学语境下，如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…

ChatGPT

第一财经 2024-07-19

9.11和9.9哪个大？简单数学题8家AI大模型平台都翻了车

元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。目前全球公认第一梯队的大模型ChatGPT，在被问到“9.11和9.9哪个大”时回复称，小数点后面的数字“11大于9”，因此9.11大。

AI大模型 ChatGPT 商汤

红星新闻 2024-07-17

博士生水准无语！9.11和9.9哪个大最新、强AI模型又翻车

快科技9月14日消息，OpenAI推出了OpenAI o1预览模型，官方宣称推理能力更强，可达理科博士生水准。按照官方技术博客说法，o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI

OpenAI 人工智能

雪花 2024-09-14

9.11和9.9哪个大？AI翻车！好多网友竟也争论不休……

没想到，一道小学生难度的数学题，竟然难倒了一众海内外AI大模型。元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。

AI大模型 ChatGPT 商汤

光明网 2024-07-17

近期资讯

韩国将全面检查现有101架波音737-800型客机

韩国国土交通部30日宣布，将对韩国国内现有的101架波音737-800型客机进行全面特别检查。

北京日报 2024-12-30

补贴480元！方太01-THK21B大火力天然气燃气灶，厨房智慧选择

#年货节好物集市#在现代家庭中，一款高效、安全且易于维护的燃气灶不仅是烹饪美食的关键工具，更是提升生活质量的重要因素。为了确保稳定的火力输出，01-THK21B特别设计了一体化全铝炉头，这种材料具有良好的导热性和耐腐蚀性，不仅提高了燃烧效率，延长了使用寿命，而且外观上也更加美观大方。

小米地瓜 2024-12-30

印度发现“卡脖子”矿产，想偷师中方经验，摆脱对华依赖

近年来，国际舞台上演了一场不同寻常的博弈，这就是由美国主导的对中国科技领域的围堵，而中国则在关键矿产资源领域发起了反制。印度作为一个新兴经济体，在这场“科技战”中被迫重新审视自身的短板。但问题随之而来，如同一位刚刚找到宝藏却没有钥匙的探险者一样，印度面临着采矿技术和能力不足的重大挑战。

宏兵灼见 2024-12-30

世界最大盾构机每小时挖3.6米，挖穿地球需要多久？能否成功

而要说到世界上最大的盾构机，那就不得不说到美国的Bertha盾构机，这台盾构机号称是世界上最大的巨型盾构机，其直径长达17.5米，总重量更是有着7000吨。又能不能成功被挖穿地球呢？

科学知识点秀 2024-12-30

反射镜架种类知多少？

圆形两轴光学调整架,属于结构更加精密的反射镜架,它可通过两个0.25mm细牙螺距调节器实现±4°或±3°的俯仰和偏摆调节,调节分辨率高,调整架上设置的M4的沉头安装孔可实现左手或者右手结构的配置。精密三轴光学调整架,相比起圆形两轴光学调整架而言,这个反射镜架采用了更厚的背板和三个带锁紧的调节器,增强了调整架的稳定性。

极目新闻 2024-12-30

游戏、后期快人一步的奥秘：三星990 PRO让固态硬盘再进一步

一款PC性能的好坏，不仅仅是处理器和显卡，硬盘的重要性也是不言而喻，尤其是目前的大型游戏，动辄几十上百GB，不仅需要更大的硬盘空间，对硬盘的读写速度同样有着更高的需求，比如解压缩游戏、游戏的载入时间等，肯定是越快越好。

IT168 2024-12-30

新一周国内手机销量TOP15出炉：华为nova 13进前三

iPhone16Pro系列两款机型依旧强势，霸占榜单前两名，但国产机型的表现也不俗，比如华为nova13进入了前三。

手机中国 2024-12-30

轻松掌握WPS文档页边距设置，提升文档美观与专业性

在使用WPS时，很多人可能会觉得页面的设置有些繁琐，尤其是页边距的调整。其实，设置页边距并没有想象中的复杂，只要掌握了步骤，就能轻松搞定。今天就来聊聊，如何在WPS中设置页边距，让你的文档看起来更加美观、规范。

新报观察 2024-12-30

OpenCloudOS应用实践，助力中南民族大学构建信息化数字基座

12月21日，在2024OpenCloudOS年会上，中南民族大学信息化建设管理处信息技术部主任高杰欣，介绍了学校基于OpenCloudOS操作系统构建信息化数字基座的实践经验，为高校数字化转型升级提供了参考。目前，中南民族大学新部署虚拟机超100台，均使用了OpenCloudOS，并计划在下一步国产化迁移时全面采用。

砍柴网 2024-12-30

机械革命无界14N笔记本首发5999元：酷睿Ultra 5 228V、18.5小时续航

快科技12月30日消息，机械革命无界14N笔记本目前已经上市，首发5999元。机械革命无界14N采用冲压＋CNC精雕工艺成型，具备如CNC一体成型般的质感，CD两面衔接过渡自然，无明显缝隙。

驱动之家 2024-12-30

9.11和9.9哪个大，看AI大模型算错，我就放心了！#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希

推荐体验

相关资讯

9.11和9.9哪个大？AI大模型集体失智几乎全翻车了

9.11和9.9哪个大? 大模型的复杂推理能力待提升

9.11和9.9哪个大？简单数学题8家AI大模型平台都翻了车

博士生水准无语！9.11和9.9哪个大最新、强AI模型又翻车

9.11和9.9哪个大？AI翻车！好多网友竟也争论不休……

近期资讯

韩国将全面检查现有101架波音737-800型客机

补贴480元！方太01-THK21B大火力天然气燃气灶，厨房智慧选择

印度发现“卡脖子”矿产，想偷师中方经验，摆脱对华依赖

世界最大盾构机每小时挖3.6米，挖穿地球需要多久？能否成功

反射镜架种类知多少？

游戏、后期快人一步的奥秘：三星990 PRO让固态硬盘再进一步

新一周国内手机销量TOP15出炉：华为nova 13进前三

轻松掌握WPS文档页边距设置，提升文档美观与专业性

OpenCloudOS应用实践，助力中南民族大学构建信息化数字基座

机械革命无界14N笔记本首发5999元：酷睿Ultra 5 228V、18.5小时续航

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响