当前位置：首页|资讯|GPT-4|ChatGPT|斯坦福

不会数学了！ GPT-4“智力”大幅下降

作者：参考消息发布时间：2023-07-22

GPT-4 ChatGPT 斯坦福

参考消息网7月22日报道 据美国《财富》杂志网站7月20日报道，斯坦福大学的一项研究发现，广受关注的聊天机器人ChatGPT在6月份执行某些任务的表现比3月份的时候变得更糟了。

该研究对由开放人工智能研究中心(OpenAI)创造的这款聊天机器人数月时间内在执行4项“差异化”任务——解数学题、回答敏感问题、编写软件代码、视觉推理——的表现进行了比较。

研究人员发现这项技术执行某些任务的能力存在巨大波动——即“漂移”。该研究考察了OpenAI技术在这一时间段的两个版本：GPT-3.5和GPT-4。最值得注意的结果来自对GPT-4解答数学题能力的研究。在研究过程中，研究人员发现，在3月份时GPT-4能够在97.6%的答题时间里正确识别出数字17077为质数。但是仅仅3个月后，其答题的正确率却骤降至极低的2.4%。与此同时，GPT-3.5的表现轨迹则几乎相反，其在3月时回答同一问题的正确率仅为7.4%，而在6月时的回答大多是正确的，答题正确率达86.8%。

当研究人员要求这两个版本编写代码和接受视觉推理测试——即要求该技术预测某个图案中的下一个形象——时，出现了类似的差异化结果。

研究报告的作者之一、斯坦福大学计算机科学教授詹姆斯·邹(音)说，“如此巨大的差异程度”对于“尖端的ChatGPT”而言是意想不到的。

詹姆斯·邹说：“当我们在对大型语言模式进行调整，以改善其在某些任务中的表现时，这样做实际上可能会有许多意想不到的后果，它们或许会影响这个模型在处理其他任务时的表现。在人工智能模型如何回答问题方面，存在各式各样耐人寻味的相互依赖，它们可能在一定程度上导致我们所观察到的这些每况愈下的表现。”

推荐体验

相关资讯

GPT-4智力下降明显 6月错误率下降

2023-07-20 17:32:16 作者：姚立伟斯坦福大学和加州大学伯克利分校的研究团队近期对GPT-4进行了深度研究。他们对比了今年3月和6月在处理数学问题、生成执行代码和完成视觉推理任务上

GPT-4 斯坦福编程

中关村在线 2023-07-20

“智力”下降！研究报告称GPT-4能力明显下降

作为开发市面上热度最高的AI聊天机器人的公司——OpenAI可以说在最近倍受关注。在此前Open-AI公布了其大型语言模型的最新版本——GPT-4，用来替代之前在使用的GPT-3.5。据官方

GPT-4 AI聊天机器人 OpenAI 大语言模型

科技美学 2023-07-20

研究报告称 GPT-4 “智力”明显下降

IT之家 7 月 20 日消息，来自斯坦福大学和加州大学伯克利分校的研究团队近日对 GPT-4 进行了深入研究，对比了今年 3 月和 6 月在处理数学问题、生成执行代码和完成视觉推理任务上的差异，发现

GPT-4 斯坦福编程

IT之家 2023-07-20

有老师用GPT-4进行历史教学了！

一位作者利用GPT-4在历史课上做了一个有趣的模拟实验，让我们感受一下公元前2254年乌尔城邦的庙宇抄写员是怎么过一天的。这个模拟教学利用GPT生成了一个真实而合理的历史场景和角色，而且还加入了DALL-E 3生成的图像，让学习更加身临其境。 [图片] 具体流程： 1、选择历史背景和角色：作者挑选了公元前2254年乌尔城邦的庙宇抄写员作为模拟的对象。想要玩转这个模拟的话，首先得对那个时代和地点有所了解哦。 2、与ChatGPT互动：作者使用了强大的语言模型GPT-4作为交互式的文本生成工具。学生们可以通

GPT-4 DALL·E ChatGPT

AI_Fox 2023-11-02

GPT-4的成绩大幅提升

火爆全球的通用对话机器人ChatGPT，在上线仅三个半月后，迎来了新的“进化”。3月15日，美国人工智能公司OpenAI推出了大型多模态模型GPT-4。相比于ChatGPT使用的GPT-3.5架构，G

GPT-4 ChatGPT 人工智能 OpenAI

无贼天下 2023-03-18

近期资讯

平定县兴鑫新材料科技有限公司取得直拉单晶炉用石墨坩埚专利，达到对石墨坩埚进行稳定安装的效果

金融界2024年12月31日消息，国家知识产权局信息显示，平定县兴鑫新材料科技有限公司取得一项名为“一种直拉单晶炉用石墨坩埚”的专利，授权公告号CN222226643U，申请日期为2024年1月。

金融界 2024-12-31

晶科能源取得一种隔热屏悬挂组件及单晶炉专利，提高晶棒生产效率

金融界2024年12月31日消息，国家知识产权局信息显示，晶科能源股份有限公司取得一项名为“一种隔热屏悬挂组件及单晶炉”的专利，授权公告号CN222226637U，申请日期为2024年3月。

金融界 2024-12-31

天津市津荣天晟取得一种带材线局部连续电镀溶液液面高度调节装置专利，实现对电镀溶液的高度自动调节

金融界2024年12月31日消息，国家知识产权局信息显示，天津市津荣天晟金属表面处理有限公司取得一项名为“一种带材线局部连续电镀溶液液面高度调节装置”的专利，授权公告号CN222226633U，申请日期为2024年5月。

金融界 2024-12-31

江苏福旭科技取得晶体直拉生长设备用免维护真空系统专利，实现对单晶炉的抽真空以及滤网自动维护

金融界2024年12月31日消息，国家知识产权局信息显示，江苏福旭科技有限公司取得一项名为“一种晶体直拉生长设备用免维护真空系统”的专利，授权公告号CN222226640U，申请日期为2024年5月。

金融界 2024-12-31

宁夏和光取得一种炉体变径连接结构专利，方便快捷且节约成本

金融界2024年12月31日消息，国家知识产权局信息显示，宁夏和光新材料有限公司取得一项名为“一种炉体变径连接结构”的专利，授权公告号CN222226639U，申请日期为2024年5月。

金融界 2024-12-31

扬州方通取得一种硅单晶棒的拼棒装置专利，能够起到便于对两个硅单晶棒进行精准快速对接的作用

金融界2024年12月31日消息，国家知识产权局信息显示，扬州方通电子材料科技有限公司取得一项名为“一种硅单晶棒的拼棒装置”的专利，授权公告号CN222226652U，申请日期为2024年5月。

金融界 2024-12-31

上海集成电路研发中心取得外延工艺装置专利，解决现有装置对硅片边缘区域薄膜生长厚度难以精准调控的问题

金融界2024年12月31日消息，国家知识产权局信息显示，上海集成电路研发中心有限公司取得一项名为“外延工艺装置”的专利，授权公告号CN222226647U，申请日期为2023年12月。

金融界 2024-12-31

晶科能源取得内底锥加料器专利，保证颗粒硅料散落范围最小

金融界2024年12月31日消息，国家知识产权局信息显示，晶科能源股份有限公司取得一项名为“内底锥加料器”的专利，授权公告号CN222226642U，申请日期为2024年3月。

金融界 2024-12-31

山西烁科晶体取得用于碳化硅生长的气体混合加热系统专利，可排除环境温度变化对管道内部混合气体的影响

金融界2024年12月31日消息，国家知识产权局信息显示，山西烁科晶体有限公司取得一项名为“一种用于碳化硅生长的气体混合加热系统”的专利，授权公告号CN222226649U，申请日期为2024年1月。

金融界 2024-12-31

宁夏和光新材料取得一种副室变径连接结构专利，能够在非同步拆解加长副室筒的作用下进行更换变径处理

金融界2024年12月31日消息，国家知识产权局信息显示，宁夏和光新材料有限公司取得一项名为“一种副室变径连接结构”的专利，授权公告号CN222226638U，申请日期为2024年5月。专利摘要显示，本实用新型实施例提供的一种副室变径连接结构，涉及单晶炉技术领域。

金融界 2024-12-31

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1