当前位置：首页|资讯

博士生水准无语！9.11和9.9哪个大最新、强AI模型又翻车

作者：雪花发布时间：2024-09-14

快科技9月14日消息，OpenAI推出了OpenAI o1预览模型，官方宣称推理能力更强，可达理科博士生水准。按照官方技术博客说法，o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI...【查看原文】

推荐体验

相关资讯

9.11和9.9哪个大？AI大模型集体失智几乎全翻车了

没眼看……“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了？？强如GPT-4o，都坚定地认为9.11更大。谷歌Gemini Advanced付费版，同样的口径。新

AI大模型谷歌

2024-07-16

9.11和9.9哪个大？AI翻车！好多网友竟也争论不休……

没想到，一道小学生难度的数学题，竟然难倒了一众海内外AI大模型。元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。

AI大模型 ChatGPT 商汤

光明网 2024-07-17

9.11和9.9哪个大? 大模型的复杂推理能力待提升

大部分大模型在问答中都错误地比较了小数点后的数字，认为9.11大于9.9，考虑到数字涉及的语境问题，记者将其限定为在数学语境下，如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…

第一财经 2024-07-19

9.11和9.9哪个大，看AI大模型算错，我就放心了！#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希

AI大模型人工智能

新闻夜航 2024-07-19

9.11和9.9哪个大？OpenAI刚官宣的GPT-4o mini竟然也翻车了|新榜

根据GPT-4omini在多个关键基准测试中的得分，可以看出，其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色，优于市场上其他小型模型。据ArtificialAnalysis统计，GPT-4omin…

新榜 2024-08-11

近期资讯

50多家机构投出超20亿元，这一赛道正在狂奔

眼科创新药发展迅速，资本市场关注度高。

动脉网昨天

港股年内最大IPO，盘中涨超9%，全球家电一哥登陆港交所

净筹资超306亿港元的美的，说上港股并不是为了钱。

智东西昨天

手机焦段的糊涂账，你可能一直在用数码裁切

你在浪费手机传感器的面积吗？让我们算算这笔糊涂账

科技狐昨天

县城品牌走红一二线，为啥县城品牌反向火遍全国？

县城品牌逆袭走红一二线城市，展现独特市场优势。

江瀚视野昨天

中国火了千年的网红城市，有点神

泉州的“松弛”和“灵性”。

新周刊昨天

史上最没存在感的一届TI，静静收官

V社大刀阔斧改革后，DOTA2职业电竞圈陷入短暂的混乱。

体育大生意昨天

淘天、京东扎堆出海服饰业务，商机还是险棋？

电商们又盯上了服饰出海这块蛋糕。

正见TrueView 昨天

腾讯这次来真的了，一次性“三箭齐发”

准备“暴扣”出一个爆款？

手游那点事昨天

中秋档过于平庸

还在延续暑期档的低迷

犀牛娱乐昨天

“黄金二代”不坑爹？吊打同行逆市翻倍，父子联手开出5129家门店

流行父子搭班创业是有原因的。

金融八卦女昨天

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1