9.11和9.9哪个大,看AI大模型算错,我就放心了!#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希【查看原文】
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新
AI大模型谷歌
2024-07-16
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。目前全球公认第一梯队的大模型ChatGPT,在被问到“9.11和9.9哪个大”时回复称,小数点后面的数字“11大于9”,因此9.11大。
AI大模型ChatGPT商汤
红星新闻 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
光明网 2024-07-17
这篇文章,我们一起来看下在智慧仓储和智慧园区系统协同下,如何打造“仓、运、场”一体化协同的运营解决方案。
物流小兵说 2024-12-31
2024年,汽车行业以一种前所未有的速度和力度进行着重塑。
果壳 2024-12-31
至顶科技 2024-12-31
在零售行业的变革浪潮中,传统商超面临着前所未有的挑战。本文深入探讨了沃尔玛等零售巨头的转型之路,并提出了对传统商超未来发展的独到见解。
即时刘说 2024-12-31
二次上市。
投资界 2024-12-31
今天我们来拆解一款为用户提供优质低价商品的产品——砂之船夜奥莱,从市场、用户和产品角度,看看这个产品的表现怎么样。
纪未名 2024-12-31
我身上有一个不可战胜的夏天
中国企业家杂志 2024-12-31
走红是种契机,却不是立身之本
新榜 2024-12-31
从VC到产业。
丰田通用也干了
智能车参考 2024-12-31
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1