9.11和9.9哪个大,看AI大模型算错,我就放心了!#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希【查看原文】
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新
AI大模型谷歌
2024-07-16
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。目前全球公认第一梯队的大模型ChatGPT,在被问到“9.11和9.9哪个大”时回复称,小数点后面的数字“11大于9”,因此9.11大。
AI大模型ChatGPT商汤
红星新闻 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
光明网 2024-07-17
快科技12月26日消息,创维汽车近日在香港市场推出了SKYWORTH K RHD右舵车型,标志着其全球化进程的进一步加速。此次新车发布共推出三款配置:800V超充版、620舒适版以及的士版。特别值得
王略 2024-12-26
快科技12月26日消息,中蓝电子官方今天发布一份《严正声明》,其中提到,台湾《经济日报》发布了标题为《镜头红链爆雷台厂迎转单》的新闻报道,其中包含大量关于辽宁中蓝电子科技有限公司运营情
建嘉 2024-12-26
12月26日消息,据海外发布官方信息,昨日,12月25日,厦门机场海关关员在监管入境航班时,发现一名选择无申报通道通关的旅客行李机检图像存在异常。经开箱查验,关员从中查获冷冻牛鞭16.1公斤
落木 2024-12-26
要说当前世界上最伟大的科技公司,那苹果一定算一个,自1976年成立以来,一直以其创新精神、卓越品质和对细节的极致追求,不断书写着科技史上的传奇。苹果之所以伟大,不仅是因为它的市值以及
2024-12-26
快科技12月26日消息,据报道,多款用于消防、救援等领域使用的无人机集体亮相,标志着北京市低空安全应急产业园正式落户房山区。据介绍,消防救援云梯的高度以及高压水枪的射程通常不足50米,
鹿角 2024-12-26
顽皮狗新作《星际:异端先知》的女主角乔丹备受争议,很多玩家表示她的形象非常辣眼,甚至看不出性别。此前有网友通过P图,将乔丹爆改了一番,粗犷的光头女同摇身一变,成为甜美白嫩的网红美女
快科技12月26日消息,高速公路上突然出现动物,那么是该躲还是撞?据“山西高速交警四支队”最新通报,12月15日16时许,在青兰高速(青兰方向)乡宁服务区附近,一辆小轿车因避让不
快科技12月26日消息,今日,小米智能生态官微发文称,在中国最北、最低温度-30℃以下的漠河,2024米家空调冬测正全面展开。据悉,此次冬测将主要考察:制热性能、除霜性能、升温性能、温度稳
朝晖 2024-12-26
BioWare的最新作品《龙腾世纪4:影障守护者》原本是备受期待的游戏,但上市后其热度却迅速下滑。游戏融入了大量的多元化、平等性和包容性(DEI)元素,但这并未受到大多数玩家的欢迎,反而成为了
快科技12月26日消息,近日,网红王境泽参加了腾讯新闻跨年秀《因你而异》。在节目中,他自爆:2018年的时候,我抖了个机灵,配上了我“真香”那个表情包,在社交平台传播后,被大
秋白 2024-12-26
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1