没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新...【查看原文】
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
AI大模型ChatGPT商汤
光明网 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
AI大模型人工智能
新闻夜航 2024-07-19
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
根据GPT-4omini在多个关键基准测试中的得分,可以看出,其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色,优于市场上其他小型模型。据ArtificialAnalysis统计,GPT-4omin…
OpenAI编程
新榜 2024-08-11
快科技12月30日消息,华为公开悬赏300万元,向全球求解AI时代存储技术等难题,今年奥林帕斯奖将着眼每bit极致性价比的存储技术、面向AI时代的新型数据底座两大难题,设置2个奥林帕斯奖(奖金1
雪花 2024-12-30
AI 一天,人间一年。近两年来,AI 技术发展迅猛,对我们生活渗透的速度,可以用一日千里形容。从智能家居到自动驾驶,从智能客服到 AI 助手,从写作画图到情感陪伴,高效、便捷的 AI 技术,一点
2024-12-30
快科技12月30日消息,据央广网报道,《广州市电动自行车管理规定》将于12月30日起施行。《规定》共8章55条,对广州电动自行车生产、销售、维修、登记、通行、停放、充电、回收等方面加强全链条
若风 2024-12-30
快科技12月30日消息,在12月27日的海南海口,一起因未拔充电器而引发的家庭火灾事件引起了广泛关注。一位女子因为出门前忘记拔掉充电器,导致家中发生了严重的火灾事故,几乎将整个家烧毁,家
随心 2024-12-30
快科技12月30日消息,REDMI Turbo 4此前已经官宣2025年1月发布,是2025开年首款新机。有博主曝光了新机的宣传海报页面,展示了REDMI Turbo 4的背部外观,其采用了直边设计,背部为竖置双摄,与
建嘉 2024-12-30
快科技12月30日消息,虽然今年多家安卓厂商都开始进军小屏机市场,但小米15依然凭借独一无二的手感,以及十分全面水桶的配置,成为目前小屏机的冠军机型。甚至连以往续航的痛点,都通过金沙江
快科技12月30日消息,中国电建官方发文称,近日,全国首个抽水蓄能重卡换电站,在中国电建所属水电八局承建的南宁抽蓄上水库项目投运。该换电站设置1个车道,5个电池仓位,配置4台300千瓦充电
快科技12月30日消息,根据洛图科技(RUNTO)发布的《全球电视面板市场出货月度追踪》报告,2024年11月,全球大尺寸液晶电视面板的出货量达到了20.3百万片,同比增长27.0%,环比增长6.7%。在各
快科技12月30日消息,据报道,经过52个月的艰苦建设,我国加快建设交通强国的重大标志性工程之一、联通新疆南北的乌鲁木齐至尉犁高速公路控制性工程天山胜利隧道今天将贯通,这也将刷新世界最长
据灯塔专业版,截至12月29日21时09分,2024年贺岁档上映新片总票房(含点映及预售)突破25亿。其中,《好东西》位居第一,累计票房7.11亿元,不过该片已经上映38天。《小小的我》位居第二,
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1