据站长之家 11 月 21 日报道,美国圣塔菲研究所的研究显示,GPT-4 在图形推理任务上的准确率仅为 33%,而多模态版本 GPT-4v 的表现更差,只有 25%。通过使用 ConceptARC 数据集,作者对 451 名人类受试者进行了图形推理任务测试,结果显示人类的平均正确率为 91%,远高于 GPT-4。
但是研究者招募受试者的方式和 GPT-4 的输入方式引发了质疑,包括入门测试不足以筛选高质量受试者,样本的随机性受到争议,以及图像转换为数字矩阵可能改变概念等。
GPT-4的图形推理能力,竟然连人类的一半都不到?美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。这项实验结果发表后,迅速在YC上引发了广泛热议。赞同这项结果的网友表示,GPT确实不擅长抽象图形处理,“位置”“旋转”等概念理解起来更加困难。
GPT-4
量子位 2023-11-20
AI新智界 2024-01-06
谷歌联合多所高校的一项最新研究,让大模型开始拥有了人类的“心智”。具体来说,研究人员发现,现在的大模型,已经具备了在对话中推测人类“在想啥”的能力。那么,有了FaR的大模型,究竟拥有什么样的“心智”呢?
谷歌GPT-4
量子位 2023-10-14
GPT-4准确率飙升64%,还当起了“老板” 【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华
GPT-4斯坦福OpenAI
新智元 2024-01-29
ChatGPT
IT之家 2024-01-04
金融界2024年12月31日消息,国家知识产权局信息显示,江苏久动传动轴有限公司取得一项名为“一种具有良好减震效果的传动轴吊架”的专利,授权公告号CN222223905U,申请日期为2024年3月。
金融界 2024-12-31
金融界2024年12月31日消息,国家知识产权局信息显示,山东鲁沃农业装备有限公司取得一项名为“一种拖拉机底盘传动总成”的专利,授权公告号CN222223903U,申请日期为2024年6月。
拼图是一项古老而又充满乐趣的活动,很多人都曾在闲暇时光里坐下来,享受拼图带来的乐趣。今天就来聊聊拼图怎么玩,分享一些小技巧和个人心得。
新报观察 2024-12-31
在当今这个数字化的时代,微信已经成为了一个不可或缺的社交工具。无论是日常聊天、分享生活,还是进行商业活动,微信都扮演着重要的角色。对于商家来说,如何利用微信进行有效的营销,已经成为了一个热门话题。接下来,我们就来聊聊微信营销的一些实用技巧和策略。在微信上,品牌形象的建立是非常重要的。你可以通过创建一个专业的公众号来展示你的品牌。
金融界2024年12月31日消息,国家知识产权局信息显示,湖北华恒散热器制造有限公司取得一项名为“一种具有减震效果的散热器”的专利,授权公告号CN222223896U,申请日期为2024年5月。
金融界2024年12月31日消息,国家知识产权局信息显示,深圳市普菲特精密制品有限公司取得一项名为“防疲劳断裂连接机构的驱动轴”的专利,授权公告号CN222223904U,申请日期为2024年5月。专利摘要显示,本实用新型公开了防疲劳断裂连接机构的驱动轴,涉及车辆传动装置的布置或安装技术领域。
在这个信息爆炸的时代,网速快慢直接影响着我们的生活和工作效率。无论是追剧、打游戏,还是远程办公,网速都扮演着一个举足轻重的角色。尤其是一些自动更新的软件,它们可能在你最需要网络的时候悄悄占用带宽。
在这个信息爆炸的时代,电脑已经成为我们生活中不可或缺的工具。无论是学习、工作,还是娱乐,电脑都能帮助我们快速获取所需的信息。而搜索功能,正是我们与海量信息之间的桥梁。那么,电脑怎么搜索才能更高效、更准确呢?今天就来聊聊这个话题。首先,打开电脑上的浏览器,这是我们搜索的第一步。常见的浏览器有谷歌、火狐、边缘等,选择一个你习惯的就好。
PDF(便携式文档格式)是我们日常工作和学习中非常常见的一种文件格式。无论是电子书、报告、手册,还是各种文档,PDF都发挥着重要的作用。今天,我们就来聊聊关于PDF的一些使用技巧和小窍门,让你在处理这些文件时更加得心应手。首先,PDF的一个最大优点就是它的格式稳定性。
金融界2024年12月31日消息,国家知识产权局信息显示,东风康明斯排放处理系统有限公司取得一项名为“一种国六后处理器冲铆结构安装支架”的专利,授权公告号CN222223899U,申请日期为2024年4月。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1