GPT-4变笨,实锤了???来自斯坦福大学和UC伯克利大学的一篇最新论文显示:6月的GPT-4在一些任务上的表现客观上就是比3月的更差。比如他们用同样500道「判断给定整数是否为质数」的问题来...【查看原文】
GPT-4变笨,实锤了?为什么看起来变笨了呢?为了进一步证明自己的看法,教授们用500个合数测试了模型,结果是3月版本的GPT-4几乎总是猜测这些数字是质数,而6月版本则几乎认为是合数。
GPT-4斯坦福OpenAI
量子位 2023-07-20
DoNews7月21日消息,这段时间有不少用户发现GPT-4变笨了,并晒出了不少证据。据悉,评估的对象包括GPT-3.5和GPT-4两个大模型,并在四个任务上进行测试:数学问题、回答敏感/危险问题、代码生成以及视觉推理。
斯坦福GPT-4OpenAI编程
DoNews 2023-07-21
当前大热的MBTI人格测试可以看做是“荣格八维”系统的简化版,其本质概念皆起源于荣格的著作《心理类型》。北京时间7月24日,推特正式变为“X”——除了其原名Twitte和某些应用商店的图标之外,平台内部首页的标志、UI配色,以及各路口径里,都已不见“小蓝鸟”的踪影。对此,许多推特用户怒斥马斯克亲手毁掉了推特的品牌价值。
斯坦福GPT-4马斯克
南方都市报 2023-07-26
GPT-4「变笨」被斯坦福实锤:短短仨月数学问题错误率暴涨40倍! 丰色 克雷西 发自 凹非寺 量子位 公众号 QbitAI GPT-4变笨,实锤了??? 来自斯坦福大学和UC伯克利大
GPT-4斯坦福
OpenAI承认了科学实验下的证据。
斯坦福GPT-4OpenAI
大数据文摘 2023-07-21
“饼王”马斯克从不让人失望。
电车通 昨天
MONA交付困难,但小鹏比之前有钱。
韩永昌 昨天
一些现象不容忽视
犀牛娱乐 昨天
5款预构建Agent、数百万AI协作前景。
智东西 昨天
破山中贼易,破心中贼难。
银杏科技 昨天
无惊无喜,平稳落地。
海豚投研 昨天
全球极少数实现全无人驾驶,真正引领全球Robotaxi向大规模量产和商业化进程的公司。
IPO早知道 昨天
LoLCATs实现Transformer模型的有效线性化,大幅提升效率和精度。
新智元 昨天
这次,终于能笑着离开理发店。
电商在线 昨天
高管阵容颇多变动。
子弹财经 昨天
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1