9.11和9.9哪个大,看AI大模型算错,我就放心了!#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希【查看原文】
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新
AI大模型谷歌
2024-07-16
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。目前全球公认第一梯队的大模型ChatGPT,在被问到“9.11和9.9哪个大”时回复称,小数点后面的数字“11大于9”,因此9.11大。
AI大模型ChatGPT商汤
红星新闻 2024-07-17
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
光明网 2024-07-17
根据GPT-4omini在多个关键基准测试中的得分,可以看出,其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色,优于市场上其他小型模型。据ArtificialAnalysis统计,GPT-4omin…
OpenAI编程
新榜 2024-08-11
金融界2024年10月30日消息,国家知识产权局信息显示,镭诺光电科技(深圳)有限公司取得一项名为“一种扫描振镜”的专利,授权公告号CN221884016U,申请日期为2024年1月。
金融界 2024-10-30
随着双十一购物节的战线不断拉长和促销活动的日益复杂化,消费者对于这个曾经年度最大的购物狂欢节的热情似乎正在逐渐降温。这篇文章深入探讨了双十一为何越来越难以激发消费者的购物热情,分析了电商平台的促销策略、商家的参与态度以及消费者购物行为的变化。
价值星球Planet 2024-10-30
活力集团,向香港主板发起IPO冲刺。早在2016年,它就曾完成9.6亿元C轮融资。
铅笔道 2024-10-30
国有六大行前三季度业绩PK。
WEMONEY研究室 2024-10-31
即时零售竞争的分野已然浮现。
晓曦 2024-10-30
探索播客世界的深度与广度,揭秘那些将播客视为“电子榨菜”的超级听众们的生活。文章带你走进一群花费上万小时聆听播客的资深用户,感受他们对播客的热爱和依赖,以及播客如何成为他们生活中不可或缺的一部分。
新榜 2024-10-30
哪吒汽车CEO张勇曾发文打预防针,2023年日子那么难,也没有想过降薪、裁员,可能公司少部分员工不习惯过苦日子吧,看来有必要把寒气传递到每一个人了。
新熵 2024-10-30
金融界2024年10月30日消息,国家知识产权局信息显示,广东邦普循环科技有限公司申请一项名为“一种磷酸铁的制备方法及其应用”的专利,公开号CN118833788A,申请日期为2024年6月。专利摘要显示,本发明公开了一种磷酸铁的制备方法及其应用,属于新能源电池材料技术领域。
到2050年,电脑的生产力可能还会至少翻好几倍
星海情报局 2024-10-30
陈根谈科技 2024-10-30
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1