没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新...【查看原文】
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
AI大模型ChatGPT商汤
光明网 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
AI大模型人工智能
新闻夜航 2024-07-19
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
根据GPT-4omini在多个关键基准测试中的得分,可以看出,其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色,优于市场上其他小型模型。据ArtificialAnalysis统计,GPT-4omin…
OpenAI编程
新榜 2024-08-11
快科技12月27日消息,近日,据媒体报道,今年冬天,我国优质的冰雪“冷资源”成功带动了入境旅游热。据了解,这是继去年备受欢迎的“南方小土豆”之后,今年来自海外的&ldq
秋白 2024-12-27
快科技12月27日消息,壹号本游侠X1 Pro游戏主机今日正式上市,首发8699元。据悉,新款游戏主机搭载锐龙AI9 HX 370芯片,12核心24线程,内置Radeon 890M核显,加上XDNA 2架构NPU,AI总算力达80
鹿角 2024-12-27
快科技12月27日消息,根外媒报道,到2025年,中国电动汽车市场将实现显著增长,销量预计将同比增长约20%,突破1200万辆,是2022年590万辆销量的两倍多。与此同时,传统燃油车销量预计将下滑超
王略 2024-12-27
快科技12月27日消息,问界旗舰SUV车型M9当前大定超20万台,这绝对是今年最为现象级的车型,甚至没有之一,坐稳了50万价位的销冠,也成为了该价位有史以来最为畅销的国产车。今日下午,华为车B
落木 2024-12-27
快科技12月27日消息,根据小米公告,澎湃OS内的AI百宝箱开始内测“3A游戏虚拟机”功能。官方介绍,这是专门为小米平板量身定制的游戏工具,帮助大家在平板端体验电脑游戏。目前可
建嘉 2024-12-27
快科技12月27日消息,日前,国产GPU独角兽企业象帝先在官方公众号发布了《融资启新,“韧”者终迎芯片曙光》的公告。公告称在基于新老股东们的坚定支持和信任、全体员工的艰苦拼搏,
黑白 2024-12-27
快科技12月27日消息,比亚迪汽车官方今日发文称,即日起至2025年1月26日,对秦PLUS EV荣耀版限时优惠1万元,对第二代宋Pro DM-i也进行限时优惠活动,这两款车型置换补贴最高分别为2.5万元和2.4万
若风 2024-12-27
快科技12月27日消息,据“晚点LatePost”报道,特斯拉已与亿纬锂能达成储能电池供货协议,亿纬锂能的马来西亚工厂计划在2026年开始向特斯拉美国供应储能电池。报道称,今年之前,宁
快科技12月27日消息,据“中核集团”官微发文,我国首个商用堆在线辐照生产同位素装置在中核集团秦山核电基地正式投运。该套辐照装置为国际首创设计,具有可靠性高、全程屏蔽、生产
作为华为专为年轻人打造的时尚手机,每代nova新机上市,都会成为机圈的潮流风向标。最新发布的华为nova 13系列也不例外,最引人注目的莫过于其创新的AI体验。首发AI最佳表情功能,带来AI扩
鹏飞 2024-12-27
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1