据站长之家 11 月 21 日报道,美国圣塔菲研究所的研究显示,GPT-4 在图形推理任务上的准确率仅为 33%,而多模态版本 GPT-4v 的表现更差,只有 25%。通过使用 ConceptARC 数据集,作者对 451 名人类受试者进行了图形推理任务测试,结果显示人类的平均正确率为 91%,远高于 GPT-4。
但是研究者招募受试者的方式和 GPT-4 的输入方式引发了质疑,包括入门测试不足以筛选高质量受试者,样本的随机性受到争议,以及图像转换为数字矩阵可能改变概念等。
GPT-4的图形推理能力,竟然连人类的一半都不到?美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。这项实验结果发表后,迅速在YC上引发了广泛热议。赞同这项结果的网友表示,GPT确实不擅长抽象图形处理,“位置”“旋转”等概念理解起来更加困难。
GPT-4
量子位 2023-11-20
AI新智界 2024-01-06
谷歌联合多所高校的一项最新研究,让大模型开始拥有了人类的“心智”。具体来说,研究人员发现,现在的大模型,已经具备了在对话中推测人类“在想啥”的能力。那么,有了FaR的大模型,究竟拥有什么样的“心智”呢?
谷歌GPT-4
量子位 2023-10-14
GPT-4准确率飙升64%,还当起了“老板” 【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华
GPT-4斯坦福OpenAI
新智元 2024-01-29
ChatGPT
IT之家 2024-01-04
【环球网科技综合报道】9月14日,据engadget.消息,自动驾驶技术企业Waymo与出行服务巨头Uber近日联合宣布,他们将在2025年初携手将自动驾驶出租车服务拓展至美国奥斯汀和亚特兰大两大城市。
环球网科技 2024-09-14
快科技9月14日消息,OpenAI推出了OpenAIo1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。这个游戏的目标是控制一只考拉躲避不断增加的草莓,并在3秒后找到出现的松鼠。
快科技 2024-09-14
9月12日,由金蝶与沈阳新松机器人自动化股份有限公司(以下简称“新松”)携手举办的「走进新松机器人暨装备制造行业数字化转型论坛」在辽宁沈阳圆满落幕。
砍柴网 2024-09-14
由此推断,星纪魅族Lucky08AI手机或许拥有较高的屏占比和较为舒适的握持手感。星纪魅族官方将于9月25日下午14点30分到16点举办2024星纪魅族AI生态发布会,星纪魅族Lucky08AI手机、星纪魅族StarVViewAR智能眼镜、领克Z10电竞定制版预计将在此次活动上正式发布。
手机中国 2024-09-14
当前大模型在各行业都有得到广泛的使用,但针对医疗这种专业性非常强的领域,还是需要垂直的模型才行。而眼下,随着AI在医疗领域的深入应用,普通人只要拍照上传,就能瞬间明白一些异常指标背后藏着的“风险”,并积极配合医生进行治疗或早做预防,不再满脑疑惑,将信将疑。
人人都是产品经理 2024-09-14
根据华尔街投资机构EvercoreISI的分析,AristaNetworks(ANET.US)很可能成为MetaPlatforms(META.US)即将建立的大规模模型训练集群的网络合作伙伴。这个训练集群预计将由超过10万个GPU提供支持,其中大部分可能是英伟达的NvidiaH100型号。这一消息推动了Arista的股价在周四收涨近4%。
金融界 2024-09-14
快科技9月14日消息,技嘉日前推出白金雕1000PG5电源,采用创新静音设计,符合ATX3.0&PCle5.0标准。白金雕1000PG5可以承受高达GPU功率3倍和总功率2倍的功率偏移。
驱动之家 2024-09-14
iPhone16Pro和iPhone16ProMax配备更大的显示屏,可快速访问先进摄像头系统的全新相机控制,Pro级摄像头系统带来各种创新性的创意功能,营造沉浸式游戏体验的精美图像等,全部由A18Pro芯片驱动。
中国财富网 2024-09-14
中国国际服务贸易交易会(以下简称“服贸会”)是展现新产品、新技术的重要舞台。北京国电高科科技有限公司项目经理赵文轩接受证券时报记者采访时介绍,公司正在建设及运营我国首个低轨卫星互联网星座——“天启星座”,该星座设计由38颗低轨卫星组成,计划于今年年底完成部署。
央广网 2024-09-14
在传统电视市场的激烈竞争格局中,技术的每一次飞跃都预示着行业版图的重新洗牌。步入2024年第二季度,一场由MiniLED技术引领的技术革命真正爆发。
中关村在线 2024-09-14
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1