据站长之家 11 月 21 日报道,美国圣塔菲研究所的研究显示,GPT-4 在图形推理任务上的准确率仅为 33%,而多模态版本 GPT-4v 的表现更差,只有 25%。通过使用 ConceptARC 数据集,作者对 451 名人类受试者进行了图形推理任务测试,结果显示人类的平均正确率为 91%,远高于 GPT-4。
但是研究者招募受试者的方式和 GPT-4 的输入方式引发了质疑,包括入门测试不足以筛选高质量受试者,样本的随机性受到争议,以及图像转换为数字矩阵可能改变概念等。
GPT-4的图形推理能力,竟然连人类的一半都不到?美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。这项实验结果发表后,迅速在YC上引发了广泛热议。赞同这项结果的网友表示,GPT确实不擅长抽象图形处理,“位置”“旋转”等概念理解起来更加困难。
GPT-4
量子位 2023-11-20
AI新智界 2024-01-06
谷歌联合多所高校的一项最新研究,让大模型开始拥有了人类的“心智”。具体来说,研究人员发现,现在的大模型,已经具备了在对话中推测人类“在想啥”的能力。那么,有了FaR的大模型,究竟拥有什么样的“心智”呢?
谷歌GPT-4
量子位 2023-10-14
GPT-4准确率飙升64%,还当起了“老板” 【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华
GPT-4斯坦福OpenAI
新智元 2024-01-29
ChatGPT
IT之家 2024-01-04
快科技12月27日消息,据央广网报道,近日,多地警方披露,网约车司机通过使用一种能够“甩位”的外挂软件,可以实现筛选订单、将小单变成大单、提前进场排队占位等功能。上海警方对
2024-12-28
快科技12月27日消息,机械革命翼龙15 Pro游戏本主打轻薄电竞,原价7299元,正在京东参加百亿补贴与国家补贴活动,双重补贴后到后价格只要5599.2元。新一代翼龙15 Pro游戏本采用了15.3英寸16比
近年来,酒店偷拍事件频发,引发了公众对个人隐私安全的担忧。许多人希望通过购买检测偷拍摄像头的仪器来保护自己免受侵害。然而,一些不法分子却利用这种恐慌心理,自导自演制造虚假的偷拍现
《电锯人》中有两位女主角帕瓦和玛奇玛对主角有着不同的吸引力。而近日,来自俄罗斯的两位小姐姐Shirogane-sama和Vinne就带来了帕瓦和玛奇玛兔女郎COS,红丝黑丝与绝对领域的交织,修长身材完
即便冒着背刺自己最大客户——AWS、谷歌云、微软云的风险,英伟达做云(DGX Cloud)的野心依旧有增无减。英伟达正在招聘与AWS等云服务商常见职位相似的——39位针对特定行
2024-12-27
快科技12月27日消息,2024年转眼即逝,今年的电影市场也诞生了不少热片,包括《热辣滚烫》和《飞驰人生2》等。整体来看,榜单上几乎都是国产片,以往非常受欢迎的好莱坞大片预冷,观众越来越不
《街头霸王》中的嘉米金发碧眼,身材火辣,一个伸懒腰的动作更是让她粉丝大涨。近日,来自俄罗斯的小姐姐Hologana也带来了她的嘉米COS,超越原版的腰臀比和精致颜值完美还原。嘉米是英国特种
快科技12月27日消息,据报道,近日,宇树科技Unitree H1人形机器人,在南京展会上发生翻车事件。网友拍摄的视频显示,这个机器人在展示过程中突然站立不稳,虽然一旁工作人员赶紧过去搀扶,但
快科技12月27日消息,卢伟冰在今晚的直播中透露,小米15 Ultra将在春节后发布,并且会全球上市。他还强调,小米15 Ultra绝对没有延期,一切尽在掌握,都在按计划推进中。综合目前已知爆料
快科技12月27日消息,根据Fami通最新发布的日本市场实体游戏销量数据,《集合啦!动物森友会》的卡带销量已突破800万份大关,成为日本历史上首款实体版销量达到这一里程碑的游戏。此前,这一纪
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1