没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新...【查看原文】
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
AI大模型ChatGPT商汤
光明网 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
AI大模型人工智能
新闻夜航 2024-07-19
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
根据GPT-4omini在多个关键基准测试中的得分,可以看出,其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色,优于市场上其他小型模型。据ArtificialAnalysis统计,GPT-4omin…
OpenAI编程
新榜 2024-08-11
天猫【金号官方旗舰店】金号 纯棉毛巾 3 条装日常售价 29.9 元,下单可领 15 元券,实付 14.9 元,约合每条仅需 4.9 元。购买链接:天猫(券后14.9元)素色版 / 蜂巢版此价,兔兔、提花、猫
2024-12-26
快科技12月26日消息,微星推出了新款31.5寸显示器——MPG 322URX QD-OLED流光,首发7999元。作为该显示器的核心亮点之一,DP2.1技术的应用无疑提升了其市场竞争力。DP2.1技术是
鹿角 2024-12-26
快科技12月26日消息,近日,格力电器董事长董明珠做客了新浪《珍知酌见栏目》,与新浪财经CEO邓庆旭对话谈及了对年轻人“躺平”这个话题的理解。她表示,这不怪年轻人,而是教育、
秋白 2024-12-26
美国司法部在针对谷歌的反垄断诉讼中提出了一系列要求,其中包括出售Chrome浏览器,切割安卓,禁止与苹果等公司达成搜索引擎独占协议等。谷歌提出的解决方案是:公司同意在三年内不谋求成为苹
Zhengogo 2024-12-26
快科技12月26日消息,据央视新闻报道,今日,我国自主研发设计并建造的深远海多功能科学考察及文物考古船“探索三号”在广州南沙正式交付启航。据介绍,“探索三号”于20
拾柒 2024-12-26
快科技12月26日消息,美国新兴电动汽车制造商Canoo被指控虚假宣传其在俄克拉荷马州的电动汽车生产情况。该公司此前宣布已向州政府交付首批“俄克拉荷马州制造”的电动汽车,但前员
快科技12月26日消息,昨日,阿塞拜疆航空公司一架从首都巴库飞往俄车臣共和国首府格罗兹尼的J2-8243客机在哈萨克斯坦阿克套机场坠毁,哈萨克斯坦官方透露,目前已知至少有32人幸存。公开资料显
落木 2024-12-26
快科技12月26日消息,RTX 50系列显卡即将发布,一大卖点就是升级GDDR7显存,而在桌面上将全部由三星提供,笔记本上三星依然是主力。三星等厂商在GDDR7显存上首次使用了PAM3信号技术,即三级脉
上方文Q 2024-12-26
京东京造专研洗发水500ml原价46.9元,领券立减,实付26.9元。购买链接:京东(26.9元)硬核去屑,实力洗走油屑痒,1次净澈头屑,从根源横扫头油,缓解头痒不适。0.8%高浓度,高效抑制马拉色
波本 2024-12-26
快科技12月26日消息,“消失”在公众视野九个月后,理想汽车CEO李想重新出现在公众视野。在2024理想AI Talk第一集访谈中,李想将人工智能视为“未来的全部”,认为大模型的
朝晖 2024-12-26
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1