据站长之家 11 月 21 日报道,美国圣塔菲研究所的研究显示,GPT-4 在图形推理任务上的准确率仅为 33%,而多模态版本 GPT-4v 的表现更差,只有 25%。通过使用 ConceptARC 数据集,作者对 451 名人类受试者进行了图形推理任务测试,结果显示人类的平均正确率为 91%,远高于 GPT-4。
但是研究者招募受试者的方式和 GPT-4 的输入方式引发了质疑,包括入门测试不足以筛选高质量受试者,样本的随机性受到争议,以及图像转换为数字矩阵可能改变概念等。
GPT-4的图形推理能力,竟然连人类的一半都不到?美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。这项实验结果发表后,迅速在YC上引发了广泛热议。赞同这项结果的网友表示,GPT确实不擅长抽象图形处理,“位置”“旋转”等概念理解起来更加困难。
GPT-4
量子位 2023-11-20
AI新智界 2024-01-06
谷歌联合多所高校的一项最新研究,让大模型开始拥有了人类的“心智”。具体来说,研究人员发现,现在的大模型,已经具备了在对话中推测人类“在想啥”的能力。那么,有了FaR的大模型,究竟拥有什么样的“心智”呢?
谷歌GPT-4
量子位 2023-10-14
GPT-4准确率飙升64%,还当起了“老板” 【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华
GPT-4斯坦福OpenAI
新智元 2024-01-29
ChatGPT
IT之家 2024-01-04
金融界2024年12月28日消息,国家知识产权局信息显示,江苏国科智能工程技术有限公司取得一项名为“一种侧进风储能电池架”的专利,授权公告号CN222214353U,申请日期为2024年1月。
金融界 2024-12-28
在我们的日常生活中,电脑已经成为了不可或缺的一部分。而如果你想进一步调整字体大小,比如说只想调节某些特定应用的字体,这就需要在“显示”设置下的“高级缩放设置”中进行更详细的调整。
新报观察 2024-12-28
不过,随着时代的进步,很多人逐渐发现自己对QQ的需求降低,或是因为想要尝试新的社交方式,或是因为想要减少对手机的依赖,最终决定要取消QQ账号。那么,怎么取消QQ呢?不过,值得注意的是,注销QQ账号并不是立刻完成的,系统可能会需要一些时间来处理你的请求。说到这里,可能有些人会问,为什么要取消QQ呢?
金融界2024年12月28日消息,国家知识产权局信息显示,浙江西力新能源有限公司取得一项名为“一种新型锂离子电池组”的专利,授权公告号CN222214358U,申请日期为2024年3月。专利摘要显示,本实用新型涉及锂离子电池技术领域,尤其涉及一种新型锂离子电池组。
金融界2024年12月28日消息,国家知识产权局信息显示,蜂巢能源科技股份有限公司取得一项名为“电池单体的侧板和具有其的电池单体”的专利,授权公告号CN222214355U,申请日期为2024年1月。
电脑卡住是很多人都会遇到的问题,尤其是在最需要它的时候,突然就不动了,真让人头疼。别着急,今天咱们就来聊聊遇到电脑卡住该怎么办,给大家一些实用的建议和小技巧。常见的有几个方面:一是系统资源不足,二是软件冲突,三是硬件故障,四是病毒恶意软件的干扰。
在现代生活中,笔记本电脑已经成为我们工作和娱乐中不可或缺的一部分。如果在设置的过程中遇到问题,可以查看你的电脑说明书,或者在网上搜索一下具体型号的操作指南。
VT是“VirtualTechnology”的缩写,它是Intel和AMD等处理器厂商推出的一种硬件虚拟化技术。当你的电脑支持VT技术时,可以让虚拟机的运行更加流畅,资源利用率更高。
金融界2024年12月28日消息,国家知识产权局信息显示,延锋伟世通电子科技(南京)有限公司取得一项名为“一种具有电芯采样板热插拔防护的动力电池装配结构”的专利,授权公告号CN222214357U,申请日期为2024年3月。
金融界2024年12月28日消息,国家知识产权局信息显示,蜂巢能源科技股份有限公司取得一项名为“电池包的箱体和具有其的电池簇及电池簇总成”的专利,授权公告号CN222214352U,申请日期为2023年12月。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1