OpenAI的数据采集是否是在剽窃人们的创意？

作者：知产专利信息发布时间：2024-04-30

在互联网时代，公开的内容极其容易被他人剽窃。人尚且如此，机器的采集则更加防不胜防。

对大模型开发而言，训练数据的数量与质量对模型有巨大的影响，因此当前的大模型开发对于数据采集有着较高的依赖性。但这些被采集的内容不少来自公域互联网，像OpenAI这样的企业并没有为其付费的打算。

针对这一问题，OpenAI在一场针对版权问题的诉讼中阐明道，自己使用的是合法公开的网络数据，并未将其运用在非法用途，因此是合理的。

如果我们按照这个逻辑来看，当前互联网上的任何内容都有可能被AI采集，成为训练数据的一部分。即便这些内容你并未授权其使用，但也仍旧会被剽窃走创意。

不止是一般民众的内容，作为OpenAI重要的数据库来源，《纽约时报》过往发表的数百万篇文章都被的OpenAI运用其训练聊天机器人。但相关的内容创作者，并未收到任何稿费、版权相关的费用。粗略统计，OpenAI光从此项活动中，就能够获利数十亿美元的利润。

OpenAI在当前的发展模式，无疑是高度依赖数据收集，这其中自然也包括一些受版权保护的内容。不过，他们并不认为这是可持的行为，因为如果不使用这些高质量数据，就不可能训练出优秀的AI。

当然，针对OpenAI利用搜索引擎采集数据的行为，谷歌也没少跟它掰扯。先前OpenAI采集油管的数据时，就遭到了谷歌的警告，并宣传要限制其数据采集。

AI的运用确实方便了我们的日常生活，但相对的，当下利用AI生成的无意义内容正在污染互联网数据，其蕴藏的价值正逐步降低。但AI发展已是必然的趋势，从长久来看，它仍旧有可能成为人类开启下个世代的关键。

相关资讯

关于ai绘画是否是抄袭剽窃的论述

为什么很多人觉得ai绘画是抄袭剽窃呢？我认为不是。 1、如果说绘画考验的是创造力，想象力（也就是画风问题），那么首先，人类画师真正做到画风完全由自己独创，并且画风的演化过程中完全没有借鉴他人的风格的画师能有多少？并且使用ai时，画风的创意和灵感占主导地位的并不是ai图库吃到了什么图，而是使用ai的人给了它什么关键词和指令，那么是不是可以说，使用ai的人的创造力和想象力要比部分画师强呢？（这么说其实也不对，我认为只是ai帮助大部分人完成了想象和创意的实现） 2、如果说绘画考验的是手法和笔触，那么在有电子板绘

AI绘画

训练大剑 2023-04-08

AI绘画，真的是在“剽窃”吗？

唉，绘画AI刚出那会，就为绘画工作者前景感到担忧，但没想到部分绘画er如此疯狂。AI绘画领域道德法律层面的问题我只说这一次，以后不再讨论，再遇见相关言论直接拉黑，以下是我的个人观点：人工智能的本质是机器学习，机器学习的本质是“学习”二字，尤其是深度学习，它那种神经网络式的学习和人类的学习机制很像，是在模仿人脑中电信号在神经元之间的传递，在这种模式下，机器逐渐学会了绘画的风格，并在学习过的所有绘画风格的基础上，根据使用者的提示和要求，生成属于自己的作品。有人说AI生成的作品是剽窃，是侵犯他人版权，我只能说

AI绘画法律人工智能深度学习

联想大叔 2023-04-19

开启创意之门：OpenAI在设计中的应用

chatgpt丨chatgpt丨chat丨openAI丨open丨小智ai丨openai丨chatgpt丨chat丨小智ai设计是一门融合艺术和科技的创造性行业，而OpenAI的研究和应用为设计领域带来了新的可能性和机遇。首先，人工智能可以用于设计灵感和创意的生成。通过分析大量的设计数据和图像，人工智能可以发现设计中的模式和趋势，并帮助设计师们获取灵感。例如，OpenAI的图像识别技术可以识别出设计中的视觉元素和风格特征，为设计师提供参考和启发。其次，人工智能还可以用于设计的自动化和优化。通过机器学习和优

OpenAI ChatGPT 艺术人工智能

人工智能小智Ai 2023-05-19

迷雾：我们是否拥有自己的数据

从上世纪 60 年代个人电脑出现到现在，数字世界已经深入到我们生活的点点滴滴，从微小 “数字细胞” 到庞大概念的 “元宇宙”。ChatGPT 的火热也再次我们感受到强大的数字力量，甚至很多人都在思考如何改变才能避免工作上被替代。但是在数字世界中，我们是否拥有自己的数据？您是否面对过个人数据丢失、个人隐私泄漏、数字生活成本增长、依赖平台、被平台 “杀熟” 等各种问题呢？个人在数字世界中的地位会是怎样呢？我们将依次通过三篇文章《迷雾》、《探索》、《家园》来分析个人数据的现状和核心问题、剖析当前的技术和设计、

元宇宙 ChatGPT

傲空间 2023-05-22

微软、OpenAI等AI公司采用合成数据应对数据采集挑战

【头部财经】人工智能公司Cohere的首席执行官Aiden Gomez透露，由于Reddit、Twitter等公司收取的数据采集费用过高，许多AI公司，包括微软、OpenAI和Cohere在内，已开始

微软 OpenAI 人工智能

大力财经 2023-07-20

近期资讯

三星想用掌机振兴芯片业务，现实或许没那么美好

三星计划将Exynos用于掌机，面临ARM兼容挑战。

三易生活 21小时前

MIT教授NeurIPS歧视言论炸雷，中国女学生霸气反击，AI大佬集体痛斥，道歉信来了

一页PPT引发「血案」

新智元 23小时前

前极越中层人士发声：夏一平原本没有通过面试

以“中国版埃隆·马斯克”自居的夏一平，是极越汽车走向倒塌的导火索。

田哲 22小时前

剧集“脱水”大砍、16集以上全毙，短剧迎来新一轮冲击

新一轮冲击！

DataEye 23小时前

一笔交易105亿，宠物经济又火了

“猫猫狗狗统治华尔街”。

36氪的朋友们 22小时前

当一个音乐节操盘手决意去海外｜暗涌看世界

面对面，眼神对眼神。

任倩 22小时前

健身人的冬训，在滑雪场

滑雪运动的「瘾」为什么很大？

精练GymSquare 21小时前

《极越车主自救指南》：不幸买了“烂尾车”，车主该如何自救？

宁愿买大品牌的小众车，也不要买小品牌的大众车。

电车通 21小时前

「万勋科技」连获近2亿元A轮系列融资，加速智能柔韧机器人多场景规模应用｜硬氪首发

高适应性、低成本的智能机器人。

黄楠 22小时前

PS30年，没有它或许没有英伟达今天

PS推动3D图形发展，促英伟达崛起，变革游戏市场。

日经中文网 23小时前

OpenAI的数据采集是否是在剽窃人们的创意？

推荐体验

相关资讯

关于ai绘画是否是抄袭剽窃的论述

AI绘画，真的是在“剽窃”吗？

开启创意之门：OpenAI在设计中的应用

迷雾：我们是否拥有自己的数据

微软、OpenAI等AI公司采用合成数据应对数据采集挑战

近期资讯

三星想用掌机振兴芯片业务，现实或许没那么美好

MIT教授NeurIPS歧视言论炸雷，中国女学生霸气反击，AI大佬集体痛斥，道歉信来了

前极越中层人士发声：夏一平原本没有通过面试

剧集“脱水”大砍、16集以上全毙，短剧迎来新一轮冲击

一笔交易105亿，宠物经济又火了

当一个音乐节操盘手决意去海外｜暗涌看世界

健身人的冬训，在滑雪场

《极越车主自救指南》：不幸买了“烂尾车”，车主该如何自救？

「万勋科技」连获近2亿元A轮系列融资，加速智能柔韧机器人多场景规模应用｜硬氪首发

PS30年，没有它或许没有英伟达今天

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响