没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新...【查看原文】
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
AI大模型ChatGPT商汤
光明网 2024-07-17
AI大模型人工智能
新闻夜航 2024-07-19
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
根据GPT-4omini在多个关键基准测试中的得分,可以看出,其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色,优于市场上其他小型模型。据ArtificialAnalysis统计,GPT-4omin…
OpenAI编程
新榜 2024-08-11
元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。目前全球公认第一梯队的大模型ChatGPT,在被问到“9.11和9.9哪个大”时回复称,小数点后面的数字“11大于9”,因此9.11大。
红星新闻 2024-07-17
OpenAI旗下首款具有推理能力的AI大语言模型加速袭来。两天前,尚有消息称代号为“草莓”的推理功能模型预计在两周内发布,9月12日周四,这款模型已经以“OpenAIo1”(英文字母O+阿拉伯数字1)的正式名称发布了。100万个token即模型解析文字块的规模大小,相当于大约75万个单词。
华尔街见闻 2024-09-13
9月12日消息,据媒体报道,有网友拍到天津上空出现了一个巨大的不明黑圈。目击者表示,当时我正走在路上,突然看到天空中有一个巨大的黑圈,它就像气流一样蠕动着,很大很明显,特别怪异。
振亭 2024-09-12
IT之家9月13日消息,小米米家桌面学习灯Pro定于今天上午10:00开启预售(现已支持加入购物车付款),该款学习灯配备触屏旋钮,接入米家App,支持智能调光等功能,售价499元。据介绍,小米米家桌面学习灯Pro采用定制全光谱LED灯珠,双峰蓝光,大幅削弱蓝光峰值,光照可接近上午自然光。
IT之家 2024-09-13
联发科即将推出旗舰级手机芯片——天玑9400,这款芯片无疑将再次刷新行业标杆。作为联发科迄今为止最为强大的手机处理器,天玑9400不仅继承了前代的全大核架构精髓,更在性能与能效
2024-09-12
OpenAI首席执行官SamAltman和英伟达CEO黄仁勋等周四在白宫会见了拜登政府的高级官员及其他行业领袖,讨论如何满足人工智能项目庞大的基础设施需求。据知情人士透露,科技界与会者还包括Anthropic的首席执行官DarioAmodei、谷歌总裁RuthPorat和微软总裁BradSmith。
金融界 2024-09-13
在即将“卖身”给光伏龙头通威股份(600438.SH)的关键时刻,江苏润阳新能源科技股份有限公司(下称“润阳股份”)国内主要的电池生产基地陷入停摆。从7月开始,以PERC产
快科技9月12日消息,星纪魅族AI生态发布会将于9月25日14:30举办,届时,将发布星纪魅族Lucky 08手机等新品。今日,星纪魅族发布预热视频,魅族Lucky 08真机外观正式揭晓。视频出现的为纯白配
拾柒 2024-09-12
支付宝小荷包推出了剧本攒功能,以AI爽文剧本,开启花式攒钱,自上线起人气不断走高,我也被安利了。搜出来一看,支付宝亲密付几经迭代,终于上了AI的车。目前已上线30多个剧本,有追IP专区
北京时间2024年9月10日,苹果正式发布了iPhone 16系列新机,与该系列其他各项“小修小补”的升级点相比,Apple Intelligence其实是本次发布会大家普遍关注的焦点。在发布会上,
快科技9月12日消息,今日晚间,沈义人发微博谈iPhone 16系列。他说,iPhone 16标准版升级明显,Pro系列产品线又重回去了,这代最重要的AI无法使用有些尴尬,窄边框的视觉感受提升明显。据
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1