没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新...【查看原文】
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
AI大模型ChatGPT商汤
光明网 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
AI大模型人工智能
新闻夜航 2024-07-19
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
根据GPT-4omini在多个关键基准测试中的得分,可以看出,其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色,优于市场上其他小型模型。据ArtificialAnalysis统计,GPT-4omin…
OpenAI编程
新榜 2024-08-11
快科技12月26日消息,ROG上线了一款专注于电竞网游的显示器:ROG绝梦25 Pro,型号为XG259QNG,该款显示器具备380Hz的超高刷新率,以及24.5英寸的最佳电竞尺寸。正面为一块24.5英寸的Fast IPS面
2024-12-26
快科技12月26日消息,爱之深,责之切,只有真正为企业着想的用户,才会发自内心的去发现剖析问题,并提出自己的解决方案。近日,蔚来APP社区里一篇文章火了,火到蔚来汽车创始人、董事长李斌以
落木 2024-12-26
快科技12月26日消息,今天下午,一加Ace 5 Pro正式发布。售价方面,12GB+256GB售价3399元;16GB+256GB售价3699元;12GB+512GB售价3999元;16GB+512GB售价4199元;16GB+1TB售价4699元。陶瓷版
12月26日9时45分,随着G9508次智能复兴号动车组列车驶出湖州东站,奔向上海虹桥站,沪苏湖高铁正式开通运营!作为中国高铁最密集的地区,“轨道上的长三角”再添一条新动脉,在上海
12月25日,小米汽车宣布将携手蔚来、小鹏、理想,正式开始充电补能网络合作。14000+蔚来充电桩、9000+小鹏充电桩、6000+理想充电桩入驻小米充电地图。分析认为,汽车销量的快速提升催生了对补
快科技12月26日消息,根据SteamDB的统计数据,2024年Steam平台共发行了18825款新游戏,打破了去年14311款的记录,创下新高。2024年发布的游戏中,《小丑牌》以96.73%的好评率位列Steam评分最高
快科技12月26日消息,2024年即将迎来尾声,日前,“国资小新”发起了2024年度央企十大国之重器投票评选活动。“国资小新”综合媒体报道和网友推荐从2024年中央企业建设的
拾柒 2024-12-26
快科技12月26日消息,在易车2024年冬季实测中,小米SU7 Max表现卓越,勇夺全场第一。在三个关键测试项目中——高速续航、城市续航和冷车充电,小米SU7 Max均位列榜首。本次测试的车
快科技12月26日消息,刚刚看过RTX 5090非公版的PCB裸板谍照,GPU核心照又第一次出现在我们面前,就是大名鼎鼎的GB202。从照片可以证实,完整的核心编号为GB202-300-A1,与传闻相符。RTX 508
12月26日消息,经常去或者将要去韩国首尔旅游的朋友请注意,明年3月起,一定要牢记不能在该市投喂鸽子等动物,否则将被重罚。据“环球时报”援引韩国SBS电视台最新报道,首尔市政府
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1