GPT-4的图形推理能力,竟然连人类的一半都不到?美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。△虚线...【查看原文】
GPT-4的图形推理能力,竟然连人类的一半都不到?美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。这项实验结果发表后,迅速在YC上引发了广泛热议。赞同这项结果的网友表示,GPT确实不擅长抽象图形处理,“位置”“旋转”等概念理解起来更加困难。
GPT-4
量子位 2023-11-20
研究表明:GPT-4 在图形推理任务上表现不佳,准确率仅 33% 据站长之家 11 月 21 日报道,美国圣塔菲研究所的研究显示,GPT-4 在图形推理任务上的准确率仅为 33%,而多模态版本
AI新智界 2023-11-21
GPT-4准确率飙升64%,还当起了“老板” 【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华
GPT-4斯坦福OpenAI
新智元 2024-01-29
出品 OSC开源社区(ID:oschina2013)斯坦福大学和加州大学伯克利分校合作进行的一项 “How Is ChatGPT's Behavior Changing Over Time?”
GPT-4ChatGPT斯坦福
OSC开源社区 2023-07-20
AI新智界 2024-01-06
在美国策划的“人类重返月球”项目中,一项革命性的太空技术即将进入关键测试阶段。根据美国航空航天局(NASA,NationalAeronauticsandSpaceAdministration)官员最新披露,美国太空探索技术公司SpaceX计划最早于2025年3月进行首次轨道燃料转移测试,试图用新技术为人类时隔半个多世纪后重返月球铺平道路。
DeepTech深科技 2024-11-02
在科技迅速发展的背景下,Emoji已成为我们日常生活中至关重要的一部分。随着社交媒体的普及和数字化交流的发展,Emoji表情包(如😊、🌅、🏖️等)已经成为我们日常沟通中不可或缺的一部分。
人人都是产品经理 2024-11-02
编队集合、协同齐飞、协同转弯……11月2日,中国航空产业大会暨南昌飞行大会开幕式,一架C919和一架ARJ21飞机先后起飞,开展飞行表演项目。
光明网 2024-11-02
快科技11月2日消息,在昨晚视频直播中,雷军公开表示,小米SU7研发费用达130亿。雷军透露,关于小米SU7Ultra的定价问题,公司内部进行了数月的讨论,“最终大家还是听从了我的意见。他进一步表示,截至9月底,小米SU7的研发费用已经达到了130亿元,这是一个庞大的数字。
驱动之家 2024-11-02
截至10月31日23:59:59,小米双11全渠道累计支付金额突破180亿,成为小米启动双十一大促狂欢季有史以来,在开门红阶段获得累计支付金额最高的一次。首销当日,小米15系列就登上京东竞速榜4000-5999元价位段累计榜冠军。
扬子晚报 2024-11-02
产品比例:1/8产品尺寸:约210mm高(含底座)官方售价:269元。网站:|微博:|微信公众号:拆盒|官方QQ群:658490394。
拆盒网 2024-11-02
金融界2024年11月2日消息,国家知识产权局信息显示,怀化市万华极板制造有限公司取得一项名为“一种电解极板防腐材料喷涂装置”的专利,授权公告号CN221934349U,申请日期为2023年12月。专利摘要显示,本实用新型提供一种电解极板防腐材料喷涂装置。
金融界 2024-11-02
11月2日消息,科技媒体AndroidAuthority昨日(11月1日)发布博文,报道称谷歌公司正在考虑为苹果的iOS和macOS设备开发QuickShare。IT之家注:QuickShare此前称为NearbyShare,最早可以追溯到2020年,是谷歌推出的一项文件传输服务,旨在简化安卓设备之间的文件共享。
砍柴网 2024-11-02
2024年11月2日,在2024中国航空产业大会暨南昌飞行大会开幕式上,一架ARJ21和一架C919飞机先后起飞,开展编队集合、协同齐飞、协同转弯、低空通场等飞行表演项目。随后,ARJ21飞机先行着陆,C919飞机继续进行低空通场、大俯仰角爬升等单机飞行表演。
正观新闻 2024-11-02
喜欢这个栏目,点这个支持!
IT之家 2024-11-02
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1