当前位置：首页|资讯|生成式AI

研究：反复使用AI生成的内容来训练AI可造成“模型崩溃”

作者：IT之家发布时间：2024-09-05

IT之家 9 月 5 日消息，当地时间 9 月 4 日，据《福布斯》报道，牛津大学的伊利亚・舒梅洛夫博士和他的团队发现，当生成式 AI 软件仅依赖于由 AI 生成的内容时，回答的质量开始恶化。这项研究已经发表在《自然》杂志上。

在最初的两次查询后，答案逐渐偏离准确性，到第五次时，质量显著下降，到了第九次连续查询时，回答已完全退化为无意义的胡言乱语。研究人员将这种生成式 AI 内容的循环过度使用称为“模型崩溃”，即 AI 在不断污染自己的训练集后，输出的内容逐渐偏离现实，最终变得毫无价值。

舒梅洛夫表示：“令人惊讶的是，模型崩溃发生得如此迅速且难以察觉。最初，它会影响到少数数据—— 那些代表性不足的数据。接着，它会影响输出的多样性，导致差异性减少。有时，你会观察到对多数数据的微小改进，但这种改进掩盖了少数数据表现的恶化。模型崩溃可能带来严重后果。”

研究人员通过一种方法确定了“模型崩溃”现象的存在：使用一个预训练的 AI 驱动的维基百科，然后让 AI 模型基于自己生成的内容进行更新。受污染数据的影响逐渐导致原本的训练集被侵蚀，输出的信息也随之变得难以理解。例如，在第九次查询循环后，研究中的维基百科条目从关于 14 世纪英国教堂尖顶的内容滑稽地变成了一篇关于各种颜色的短尾兔子的论文。

报道称，根据亚马逊网络服务（Amazon Web Services）团队在 6 月发布的另一项研究，大约 57% 的网络文本都经过了 AI 算法的翻译。如果互联网上的人类生成数据迅速被 AI 过滤内容覆盖，且舒梅洛夫的研究发现属实，那么 AI 可能正在“自我毁灭”—— 并同时“毁灭”互联网。

研究得出结论，要实现 AI 的长期可持续发展，唯一方法是确保其能够访问现有的非 AI 生成内容，并持续引入新的人工生成内容。

IT之家附研究链接：

推荐体验

相关资讯

研究：反复使用AI生成的内容来训练AI可造成“模型崩溃”

IT之家9月5日消息，当地时间9月4日，据《福布斯》报道，牛津大学的伊利亚・舒梅洛夫博士和他的团队发现，当生成式AI软件仅依赖于由AI生成的内容时，回答的质量开始恶化。在最初的两次查询后，答案逐渐偏离准确性，到第五次时，质量显著下降，到了第九次连续查询时，回答已完全退化为无意义的胡言乱语。

IT之家 2024-09-05

用AI生成数据训练AI，最终只会“模型崩溃”

2023年2月，美国华裔科幻文学家特德·姜发表文章称：ChatGPT等大语言模型，实质是对互联网语料库的有损模糊压缩，如同JPEG格式之于原始高清图片。按特德·姜的观点，用大语言模型生成的文本来训练新的模型，如同反复以JPEG格式存储同一图像，每次都会丢失更多的信息，最终成品质量只会越来越差。

ChatGPT 大语言模型

DoNews 2023-06-20

Meta承认使用用户发布内容训练生成式AI

三言科技9月13日消息，据报道，当地时间11日，Meta公司承认在平台上收集了所有澳大利亚成年人的公共数据，用于训练生成式AI，且并未向用户提供“退出”选项。Meta公司的隐私中心、博客文章均承认，该公司从F…

三言财经 2024-09-14

牛津大学研究团队发现生成式 AI 可能遭遇“模型崩溃”

【环球网科技综合报道】9月5日消息，据《福布斯》报道，牛津大学的伊利亚·舒梅洛夫博士及其团队在《自然》杂志上发表了一项研究，指出当生成式AI软件仅依赖AI生成的内容时，其输出答案的质量会迅速下降。研究显示，在…

环球Tech 2024-09-05

谷歌和 OpenAI 大量使用新闻内容作为 AI 训练的免费内容

这一发现可以帮助公众了解聊天机器人从哪里获取信息，并为ZiffDavis、芝加哥论坛报、新闻集团和纽约时报等媒体公司在寻求版权保护或支付被人工智能吞噬的材料时提供更多筹码。它检查了AI公司承认使用的数据集的开…

谷歌 OpenAI 人工智能

鞭牛士 2024-11-10

近期资讯

如何轻松调整华为手环的时间设置与同步方法解析

在现代生活中，智能手环已经成为了很多人日常生活中不可或缺的一部分。一般来说，华为手环是通过蓝牙与手机进行连接的。

新报观察 2024-12-29

如何轻松将手机文件打印出来的实用指南

在现代社会，手机已经成为我们生活中不可或缺的一部分。我们用手机拍照、记录生活、浏览信息，还能随时随地存储各种文件。然而，有时候我们需要将手机里的文件打印出来，比如工作报告、旅行计划或者学习资料。这时候，很多人可能会感到困惑，不知道该如何操作。接下来，我就来聊聊如何把手机里的文件打印出来，步骤简单易懂。

新报观察 2024-12-29

深圳市泰为电力科技股份有限公司取得环网柜熔丝开关柜电动操作装置专利，方便对装置进行维护保养

金融界2024年12月28日消息，国家知识产权局信息显示，深圳市泰为电力科技股份有限公司取得一项名为“环网柜熔丝开关柜电动操作装置”的专利，授权公告号CN222214900U，申请日期为2024年4月。

金融界 2024-12-28

如何在Windows和Mac系统中安全有效地更改电脑锁屏密码

在日常生活中，电脑锁屏密码是保护我们个人信息和隐私的重要一道防线。随着网络安全问题的日益严重，及时更换密码、强化安全防范显得尤为重要。那么，怎么修改电脑的锁屏密码呢？

新报观察 2024-12-29

山东奥中取得便于检修的配电柜专利，能最大化提高工作效率，节约维修时间

金融界2024年12月28日消息，国家知识产权局信息显示，山东奥中电气有限公司取得一项名为“一种便于检修的配电柜”的专利，授权公告号CN222214901U，申请日期为2024年5月。

金融界 2024-12-28

如何调整显示器设置以提升视觉体验和舒适度的实用技巧

在我们的日常生活中，显示器是一个必不可少的设备。无论是工作、学习，还是娱乐，显示器的表现都直接影响到我们的使用体验。然而，很多人对显示器的调节并不是很了解，今天就来聊聊怎么调整显示器，让你的视觉体验更加舒适。首先，调整显示器的亮度和对比度是非常重要的。亮度过高会让眼睛感到疲劳，而过低则会让画面显得暗淡无光。

新报观察 2024-12-29

中电华骋取得具有防线缆缠绕功能的低压开关柜专利，解决开关柜内部开关安装架拆卸周期长问题

金融界2024年12月28日消息，国家知识产权局信息显示，中电华骋科技有限公司取得一项名为“一种具有防线缆缠绕功能的低压开关柜”的专利，授权公告号CN222214891U，申请日期为2024年5月。

金融界 2024-12-28

安徽博衡取得一种配电柜的主体框架结构专利，提高安装便捷性

金融界2024年12月28日消息，国家知识产权局信息显示，安徽博衡电力科技有限公司取得一项名为“一种配电柜的主体框架结构”的专利，授权公告号CN222214898U，申请日期为2024年4月。

金融界 2024-12-28

如何在抖音平台上简单录制与分享精彩短视频的全面指南

在当今这个数字化的时代，短视频已经成为了人们生活中不可或缺的一部分，而抖音作为一个热门的短视频平台，吸引了无数用户。在这个平台上，录制视频并分享自己的生活、才艺和创意变得异常简单。

新报观察 2024-12-29

扬州耐思电气取得组合式高低压配电柜专利，方便调节电气元件间距

金融界2024年12月28日消息，国家知识产权局信息显示，扬州耐思电气有限公司取得一项名为“一种组合式高低压配电柜”的专利，授权公告号CN222214893U，申请日期为2023年12月。

金融界 2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1