没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新...【查看原文】
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
AI大模型ChatGPT商汤
光明网 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
AI大模型人工智能
新闻夜航 2024-07-19
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
根据GPT-4omini在多个关键基准测试中的得分,可以看出,其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色,优于市场上其他小型模型。据ArtificialAnalysis统计,GPT-4omin…
OpenAI编程
新榜 2024-08-11
短剧,还能继续火吗?
融资中国 2024-12-28
动脉网出品
动脉网 2024-12-28
库迪疯狂开卷店中店,都把门店开到对手店里了?
江瀚视野 2024-12-28
他如何圈粉见多识广的上海白领?
咖门 2024-12-28
在营收体量上,伊利相当于1.75个蒙牛。
零售商业财经 2024-12-28
拥抱流量,坚持日更。
王晗玉 2024-12-28
当新势力坚定走向海外市场,必然也有更多的胜利和失败故事将产生,写入驾驶和汽车行业的进化历史。阅读本期出海周刊,获取更多关于卡塔尔、沙特、智能硬件等行业与市场的观察。
36氪出海 2024-12-28
最有潜力的他们正在创造下一个时代的新公司
太平洋科技 2024-12-28
要做茶饮界“迪士尼”。
电商在线 2024-12-28
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1