当前位置：首页|资讯

研究：反复利用 AI 生成内容来训练 AI 可造成“模型崩溃”

作者：动点科技发布时间：2024-09-05

据《福布斯》报道，牛津大学的伊利亚·舒梅洛夫博士与其团队发现，当生成式 AI 软件仅依赖于由 AI 生成的内容时，回答的质量开始恶化。这项研究已经发表在《自然》杂志上。

在最初的两次查询后，答案逐渐偏离准确性，到第五次时，质量显著下降，到了第九次连续查询时，回答已完全退化为无意义的胡言乱语。研究人员将这种生成式 AI 内容的循环过度使用称为“模型崩溃”，即 AI 在不断污染自己的训练集后，输出的内容逐渐偏离现实，最终变得毫无价值。

舒梅洛夫表示：“令人惊讶的是，模型崩溃发生得如此迅速且难以察觉。最初，它会影响到少数数据——那些代表性不足的数据。接着，它会影响输出的多样性，导致差异性减少。有时，你会观察到对多数数据的微小改进，但这种改进掩盖了少数数据表现的恶化。模型崩溃可能带来严重后果。”

研究人员通过一种方法确定了“模型崩溃”现象的存在：使用一个预训练的 AI 驱动的维基百科，然后让 AI 模型基于自己生成的内容进行更新。受污染数据的影响逐渐导致原本的训练集被侵蚀，输出的信息也随之变得难以理解。例如，在第九次查询循环后，研究中的维基百科条目从关于 14 世纪英国教堂尖顶的内容滑稽地变成了一篇关于各种颜色的短尾兔子的论文。

报道称，根据亚马逊网络服务（Amazon Web Services）团队在 6 月发布的另一项研究，大约 57% 的网络文本都经过了 AI 算法的翻译。如果互联网上的人类生成数据迅速被 AI 过滤内容覆盖，且舒梅洛夫的研究发现属实，那么 AI 可能正在“自我毁灭”——并同时“毁灭”互联网。

研究得出结论，要实现 AI 的长期可持续发展，唯一方法是确保其能够访问现有的非 AI 生成内容，并持续引入新的人工生成内容。

推荐体验

相关资讯

用AI生成数据训练AI，最终只会“模型崩溃”

2023年2月，美国华裔科幻文学家特德·姜发表文章称：ChatGPT等大语言模型，实质是对互联网语料库的有损模糊压缩，如同JPEG格式之于原始高清图片。按特德·姜的观点，用大语言模型生成的文本来训练新的模型，如同反复以JPEG格式存储同一图像，每次都会丢失更多的信息，最终成品质量只会越来越差。

ChatGPT 大语言模型

DoNews 2023-06-20

如何利用智能AI写作工具来创作内容？

网上冲浪时，突然灵感大发，想写一篇xx方向xx类型的推文。感觉信心满满，写出来的内容能深入人心。当落笔时，却发现写的内容枯燥乏味，没有一点吸引力，和自己想的简直天壤之别。呜呜呜呜，这大概就是所谓的“书到用时方恨少”吧，每次看到自己写出来的内容，都不忍直视，不想再写了。直到某天，我找到了一个创作的好帮手——智能ai写作工具，才让我重新开始接触写作。如果，你也怀揣着一颗想写好推文的心，那么不妨往下看看！✎什么是智能AI首先，我们要明白什么是智能AI。简单来说，智能AI就是人工智能，它

AI写作人工智能

办公软件小达人 2023-10-24

OpenAI与法国和西班牙媒体巨头合作：利用内容进行训练AI

鞭牛士报道，3月14日消息，据外电报道，美国生成人工智能(AI)巨头OpenAI通过与LeMonde和PrisaMedia出版物（包括ElPais、CincoDias和ElHuffpost）合作，扩大了对欧洲媒体的内容控制。

鞭牛士 2024-03-14

商汤科技推出AI内容创作社区平台“商汤秒画”，可定制训练专属LoRA模型

商汤自研的AIGC文生图大模型拥有超10亿参数，支持二次元、三次元等多种生成风格。

LAN 2023-04-13

Meta 推出“AI Sandbox”，可自动生成广告内容

Meta推出了一个面向广告商试用的新型生成式AI测试工具，名为“AISandbox”。Meta方面展示了它与部分广告商合作开发测试的文本变体、背景生成及图像剪裁等功能。Meta营收方向的副总裁JohnHegeman表示，这些新工具将帮助广告商节省时间并实现广告的“更好表现”。

ITheat热点科技 2023-05-12

近期资讯

退休，对你意味着什么？

你在退休后可以有多重身份。

哈佛商业评论 2024-09-14

美国16亿美元“狗粮”要开撒，针对中国的“舆论战”又来了吗？

美国的“舆论战”机器早就发动起来了，只不过因为隐藏太深，我们很多时候没有发现。现在美国众议院通过了一项代号为“HR 1157”的法案，取名为“对抗中国恶意影响基金”。说白了，就是针对中国的舆论法案。计划在5年内投入16亿美元，通过扶持扶植“独立媒体”和公民组织，在全球范围内污蔑和攻击中国。毫无疑问，这是一场舆论战。执行计划的都是美国的核心政府机构——“全球接触中心”和美国国际开发署”，这两个机构的名字看起来人畜无害，但是实际上”战功“赫赫。很多群体事件，或者“远程畜牧业”都有它们的影子。其实，9月9日-1

光电科技君 2024-09-14

C盘空间变小

原因：长时间不关机，生成的文件累计。解决方法：重启，用360清理一下就可以了。

Mr_古德 2024-09-14

真我13 Pro+:索尼超光影潜望长焦+二代骁龙 7s 芯片+学生拍照手机

真我13 Pro+，一款集科技美学与极致性能于一身的旗舰力作，它不仅重新定义了智能手机的边界，更是将“真我”品牌对创新与卓越的执着追求展现得淋漓尽致。该机型的问世，如同晨曦初露时分的第一缕阳光，穿透云层，照亮了科技世界的每一个角落，让人眼前一亮，心生向往。 [图片] 真我 13 Pro + 作为一款中端手机，在各个方面都展现出了令人惊艳的表现。在性能方面，它搭载了第二代骁龙 7s 芯片，虽然在高性能游戏方面表现稍显一般，但在日常使用中非常流畅，无论是刷社交媒体、观看视频，还是处理多任务，都能轻松应对。配

Geek智享优选 2024-09-14

专业视觉特效 Boris FX Mocha Pro 插件macos激活版

Boris FX Mocha Pro 是一款专为视觉特效设计的高级软件，广泛应用于电影、电视、广告及游戏行业。凭借其强大的功能，Mocha Pro 为用户提供了从动画创建、图像遮罩到高效渲染等全面的工具，成为特效制作的理想选择。主要功能介绍 1. 强大的视觉效果制作 Boris FX Mocha Pro 配备了多种视觉效果工具，包括颜色校正、模糊、锐化及扭曲效果。用户可以轻松应用这些工具，快速为图像和视频实现所需的视觉效果，从而提升作品的整体质量。 2. 动画与图形设计 Mocha Pro 拥有强大的动

龙岩二花网络科技 2024-09-14

二战以来飞机高速低速作战选择变迁

之前看了一下歼-8II飞机的高空高速性能，根据该飞机公开的性能，歼-8II可以在使用加力推进提升到1.8马赫后，关闭加力推进器并以军推动力巡航十分钟以上，此性能确实是令我深感震惊，因为公开资料下，F-22战斗机在不开加力维持超音速巡航的性能，是以1.6马赫巡航7分钟。歼-8II高空高速性能表不过经过我的认真思考，结合最近从二战大马力星型发动机飞机的技术性能思考的空战话题，我认为这里实际上反映出了二战以来战斗机，在不同的技术时代，对于“高空高速”和“低空亚音速”的不同思考，现在请我发表愚见如下：二战至第一代

冰封之龙 2024-09-14

2025年国自然基金项目撰写技巧全解析！如何选题、确定题目、如何设计技术路线图等

随着社会经济发展和科技进步，基金项目对创新性的要求越来越高。国家级和省级等各类项目的申请层出不穷，项目书的撰写几乎占据了申请人的全年时间。申请人既需要提出独特且有前瞻性的研究问题，具备突破性的科学思路和方法，又需要关注国际前沿研究动态，积极参与国际合作项目，并能够充分展示项目对国际学术和科技发展的贡献。尤其是青年学者，工作繁重、资源溃泛、基金申请缺乏经验、同时没有形成高效研究团队，仅凭一己之力，在竞争激烈的当下显然不具备优势条件。基金申请是每年学者重要工作内容，势必要时间与精力投入，但往往是在提交前，集中

科研充电吧 2024-09-14

水泥化验员证书咋考？化学检验员培训课件、要求✅水泥中化学分析检测方法与操作问题

水泥化验员证书咋考？化学检验员培训课件、要求✅水泥中化学分析检测方法与操作问题本文主要对水泥中化学分析检测方法与操作问题进行探讨，以供有关人员参考。 [图片] 圣问技术北京、上海、广州、深圳、成都、重庆、杭州、西安、武汉、苏州、郑州、南京、天津、长沙、东莞、宁波、佛山、合肥、青岛、昆明、沈阳、济南、无锡、厦门、福州、温州、金华、哈尔滨、大连、贵阳、南宁、泉州、石家庄、长春、南昌、惠州、常州、嘉兴、徐州、南通、太原、保定、珠海、中山、兰州、临沂、潍坊、烟台、绍兴化妆品厂微生物检验员（化妆品微检员），医疗器

圣问技术13412086256 2024-09-14

“汉堡界的特斯拉”连关3店，年轻人正在挤掉“高溢价”餐饮的泡沫？

贵价汉堡批量关门，高客单的”特色“餐饮进入战略“收缩”。

职业餐饮网 2024-09-14

宁德时代引发“蝴蝶效应”

宁德时代颇有“一布之慎”的风范。

汽车公社 2024-09-14

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1