9.11和9.9哪个大,看AI大模型算错,我就放心了!#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希【查看原文】
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新
AI大模型谷歌
2024-07-16
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。目前全球公认第一梯队的大模型ChatGPT,在被问到“9.11和9.9哪个大”时回复称,小数点后面的数字“11大于9”,因此9.11大。
AI大模型ChatGPT商汤
红星新闻 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
光明网 2024-07-17
快科技12月27日消息,近日,一位博主展示了理想汽车最新的智能驾驶轨迹展示界面,揭示了其车机系统实现端到端驾驶状态的能力。视频该系统通过端到端模型生成轨迹,并基于多种概率选择最可能
王略 2024-12-27
快科技12月27日消息,最近,中国自主DDR5 DRAM内存芯片投产并商用落地的消息,在业内引发震动。慧荣科技总经理苟嘉章坦言,中国产DRAM的市场份额有望快速升至15%,对全球DRAM市场是一个极大的变
上方文Q 2024-12-27
手游世界中,曾经“腾网哈”三足鼎立的格局正悄然改变。在近日Sensor Tower平台发布的11月中国手游发行商收入排名榜单中,米哈游跌出了前三阵营,前三分别为腾讯、网易、世纪华通旗
2024-12-27
快科技12月27日消息,乐道品牌公布首款车型乐道L60最新数据,其已达成上市100天累计交付超20000台的阶段目标。作为全新的品牌,乐道在产品正式上市后第三个完整交付月即完成产能爬坡,交付速
落木 2024-12-27
快科技12月27日消息,鸿蒙智行首款售价超百万的豪华轿车尊界S800已经亮相并开启预售,今日,官方发布了该车的最新动态,当前正在气温接近-30摄氏度的牙克石进行冬测。据悉,尊界S800顺利通过极
不知不觉2024年马上就要结束了,不少人想趁年底换个新手机,但可能会纠结要选哪款,建议有需求的朋友可以考虑一下华为nova 13系列。这款手机在10月25日正式首销,目前仅在京东就已收获5万
黑白 2024-12-27
世界首富埃隆·马斯克周三在社交媒体平台X上透露,他正在使用礼来公司的Mounjaro来减肥。马斯克在X上发布了一张他打扮成圣诞老人的照片,照片中他站在一棵圣诞树旁,并配文“Ozemp
快科技12月27日消息,山姆·阿尔特曼(Sam Altman)的核能公司Oklo宣布了一项重大合作进展,Oklo在12月18日与美国数据中心巨头Switch签署了初步的非约束性协议,标志着清洁能源领域的一次
鹿角 2024-12-27
快科技12月27日消息,苹果官网显示,安徽第一家苹果零售店——Apple Store合肥万象城将于1月18日上午10点盛大开幕。截至目前,苹果零售店分布在上海、天津、河南郑州、浙江宁波、浙
振亭 2024-12-27
快科技12月27日消息,360集团董事长周鸿祎昨日发布视频,谈到了自己为何特别反感只会“管理”的管理层,其表示:“我特别反感只打嘴炮或者不干活的管理层,管理层只会动嘴,扮
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1