OpenAI等公司被迫为训练数据付费，数据拥有者将获得更大影响力

作者：DeepTech深科技发布时间：2024-07-03

OpenAI 人工智能

生成式人工智能的繁荣是建立在规模之上的。训练数据越多，模型就越强大。

但现在出现了一个问题，由于人工智能公司通过掠夺互联网来获取训练数据，许多网站和数据集所有者开始限制他人抓取网站的能力。

对于人工智能行业不分青红皂白地抓取网络数据的做法，我们还看到了人们的强烈反对态度。

我们看到，用户选择不同意将自己的数据用于训练，艺术家、作家和《纽约时报》发起诉讼，声称人工智能公司在未经同意或给予补偿的情况下使用了他们的知识产权。

上周，三大唱片公司索尼音乐、华纳音乐和环球音乐宣布起诉人工智能音乐公司 Suno 和 Udio 涉嫌侵犯版权。

三大唱片公司声称，两家初创公司在训练数据中“以几乎难以想象的规模”使用了受版权保护的音乐，使人工智能模型能够生成“模仿真实人类唱片质量”的歌曲。

（来源：STEPHANIE ARNETT/MIT TECHNOLOGY REVIEW | ENVATO）

但这一时刻也为所有生成式人工智能的发展开创了一个有趣的先例。

由于高质量数据的稀缺性，以及建立更大更好模型的巨大压力和需求，我们正处于一个罕见的时刻，数据所有者实际上拥有了影响力。

音乐行业的诉讼传达出了迄今为止最明显的信号，高质量的训练数据不是免费的。

我们可能至少需要几年的时间才能在版权法、合理使用和人工智能训练数据方面获得法律明确性，但这些案例已经开始推动变化。

OpenAI 一直在与 Politico、《大西洋月刊》、《时代》、《金融时报》等新闻出版商达成付费协议，使用并引用它们的新闻资料（和文章）。

YouTube 在 6 月底宣布，将向顶级唱片公司提供许可协议，以换取版权音乐用于训练。

这些变化是喜忧参半的。一方面，我担心新闻出版商正在与人工智能进行不那么靠谱的交易。

例如，大多数与 OpenAI 达成交易的媒体公司表示，该交易规定 OpenAI 引用其来源。

但语言模型从根本上讲是不真实的，而且很擅长编造。报告显示，ChatGPT 和人工智能驱动的搜索引擎 Perplexity 经常产生引用幻觉，这使得 OpenAI 很难兑现其承诺。

这对人工智能公司来说也很棘手。这种转变可能导致他们建造更小、更高效的模型，污染要小得多。

或者，他们可能会拿出一大笔钱，获得更多数据，用来构建下一个更大的模型。

只有资金最充裕的公司，或者已经拥有大型数据集的公司（如拥有 20 年社交媒体数据的 Meta），才有能力做到这一点。

因此，接下来的发展有可能将权力进一步集中在最大的参与者手中。

另一方面，在这一过程中引入“同意流程”是一个很好的想法，不仅对从人工智能的繁荣中受益的权利持有人更好，对我们所有人来说也更好。

我们都应该有权利来决定如何使用我们的数据，更公平的数据经济意味着我们都可以受益。

作者简介：梅丽莎·海基莱（Melissa Heikkilä）是《麻省理工科技评论》的资深记者，她着重报道人工智能及其如何改变我们的社会。此前，她曾在 POLITICO 撰写有关人工智能政策和政治的文章。她还曾在《经济学人》工作，并曾担任新闻主播。

支持：Ren

运营/排版：何晨龙

近期资讯

e视线 2024-12-27

智能设备监控管理平台探索与实践

——“汽车智慧物流建设与发展”系列连载之十吉利集团近年积极开展汽车智慧物流建设，引入AGV等大量智能物流设备，并通过建设智能设备监控管理平台进行精准数据监控、智能故障预警和科学效能评估，实现对智能设备的全面管理与优化，助力企业生产与物流效率提升。前言随着汽车物流行业蓬勃发展，市场需求日新月异。吉利集团积极响应，努力开展汽车智慧物流建设与探索，引入大量AGV设备以提升生产效率。然而，因管理规范的缺失和系统建设的滞后，导致设备故障频发、运维操作不当等一系列问题，严重影响生产线的顺畅运行并增加运营成本。为此，吉

物流技术与应用 2024-12-27

吉利智能设备通用控制程序（GIDP）探索与实践

——“汽车智慧物流建设与发展”系列连载之九随着智能物流设备的应用越来越广泛，如何对各设备进行协调控制与管理成为难点问题之一。吉利通用型智能设备调度系统（GIDP）的成功研发，使原本多设备供应商、多智能设备所带来的多套系统得到统一，使业务系统使用者可不再关心复杂的多场景接入，从而专注于自身业务的实现。前言随着物流业升级发展，智能物流设备的应用越来越普及，并逐步替代传统的物流设备与作业模式。目前，市场上的智能物流设备种类众多，如何根据企业自身物流特点选择合适设备，如何使不同智能设备的功能得到充分发挥，并且如何

物流技术与应用 2024-12-27

好用又省心，体验感绝佳！vivo S20不愧是线下门店热销机型

经常线上购物的朋友，相信很多人都体验过卖家秀与买家秀的巨大落差，有些东西真的要自己实际体验才知道。而在线下手机门店中，vivo S系列产品多年来都是线下“常胜将军”般的存在，这次的vivo S20同样如此，很多真实体验过的人，最终都会选择它，原因其实很简单。在线下门店的时候，一款手机好不好大家是能够通过亲自体验感受得出来的，这也直接放大了vivo S20身上的优势。首先它非常好用，手机跑分达到百万级别，性能方面是绝对够用的是，而且OriginOS 5系统在交互体验这方面也做得相当出色，简洁又高效，流畅性

互联网号角 2024-12-27

MTK6771/MT6771安卓核心板详细参数介绍_联发科开发板主板方案

MT6771，也被称为Helio P60，是联发科技(MediaTek)推出的一款中央处理器(CPU)芯片，可运行 android9.0 操作系统的 4G AI 安卓智能模块。MT6771芯片采用了12纳米工艺制造，拥有八个ARM Cortex-A73和Cortex-A53核心，主频分别为2.0 GHz和2.0 GHz。 MT6771处理器支持 LTE-FDD（CAT-7）/LTE-TDD（CAT-7）/WCDMA/TD-SCDMA/EVDO/CDMA/GSM 等多种制式；支持 WiFi 802.11 a

新移科技 2024-12-27

临检实验室的建设施工与装修

临检实验室的建设施工与装修，是一项集科学性、专业性与严谨性于一体的综合性工程。它不仅关乎到实验室的日常运作效率与安全性，更是确保实验结果准确无误的基础保障。在筹备阶段，需深入调研实验室的具体需求，包括但不限于检测项目类型、样本量大小、仪器设备配置等，以此为依据进行科学合理的空间布局规划。施工过程中，采用高品质的建筑材料与先进的施工技术，确保实验室的墙体、地面及天花板具备优良的隔音、防尘、防潮性能，为精密的实验环境奠定坚实基础。装修方面，注重色彩搭配与光线调控，以营造明亮而不刺眼、温馨而不压抑的工作氛围

中净环球净化 2024-12-27

【新疆无人机培训领航者】保华润天航空，专业成就未来！

在广袤无垠的蓝天下，你是否也曾梦想过驾驶无人机翱翔于天际，探索未知的世界？现在，这个梦想不再遥远！保华润天航空无人机培训中心，作为新疆地区无人机培训的佼佼者，正以其专业的教学、先进的设备和丰富的实践经验，吸引着越来越多的无人机爱好者和行业精英。走进保华润天航空，你会被这里浓厚的学习氛围所感染。我们的师资力量雄厚，拥有多位经验丰富的无人机操作专家和教练，他们将用最通俗易懂的语言，为你解析复杂的无人机原理和操作技巧。同时，我们还配备了先进的无人机模拟器和实操场地，让你在学习理论知识的同时，也能亲身体验飞行的乐

新疆无人机培训考点 2024-12-27

2025年隐形车衣什么品牌好

随着汽车保养意识的提升，隐形车衣成为众多车主保护爱车的关键选择。在2025年的市场中，众多品牌竞争激烈，以下为您详细解析几个知名品牌。 [图片] 一、膜一姐膜一姐在隐形车衣领域可谓异军突起，凭借其对品质的执着追求和独特的技术优势备受瞩目。其采用的TPU材质具有出色的柔韧性，能紧密贴合车身的各类复杂曲线，无论是犀利的车身线条还是圆润的边角，都能实现无缝包裹，为车漆提供全方位的防护。先进的纳米涂层技术赋予了车衣卓越的抗污自洁能力，水渍、鸟粪等污渍难以附着，轻轻一擦即可洁净如新。而且，膜一姐的车衣具备高效的划

东风快递直达 2024-12-27

OpenAI等公司被迫为训练数据付费，数据拥有者将获得更大影响力

推荐体验

相关资讯

为训练AI，OpenAI等科技巨头花式淘数据

一项新法案将迫使OpenAI等公司披露其训练数据

「数据墙」迫近？苹果OpenAI等巨头走投无路，被迫「偷师」YouTube视频

微软、OpenAI等公司已使用合成数据来训练AI模型

OpenAI：不再依赖付费客户数据训练大模型

近期资讯

无人机飞行培训新选择：新疆保华润天航空，让你的梦想翱翔蓝天！

西门子SIEMENS 罗宾康功率单元 6SR0960-0AM50-0AD0

2299元起，vivo S20值吗？适合购买的几大理由

智能设备监控管理平台探索与实践

吉利智能设备通用控制程序（GIDP）探索与实践

好用又省心，体验感绝佳！vivo S20不愧是线下门店热销机型

MTK6771/MT6771安卓核心板详细参数介绍_联发科开发板主板方案

临检实验室的建设施工与装修

【新疆无人机培训领航者】保华润天航空，专业成就未来！

2025年隐形车衣什么品牌好

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响