AI训练数据不用担心版权问题？日本政府表态引发热议

作者：南方都市报发布时间：2023-06-02

生成式AI爆火的现在，其背后模型用以训练的信息数据的版权问题一直是人们关注的焦点——到底怎样才算合法的训练数据？是否会在无意间侵犯他人版权？

对此，有外媒称，日本的政府人工智能战略委员会于5月26日提交了一份草案，表示不会强制人工智能训练中使用的数据符合版权法。而日本文部科学（相当于国内教育部）大臣永冈桂子在当地会议上证实了这一消息，称日本的法律不保护AI训练所用资料的版权。

永冈桂子图源日本“文部科学省”官网

具体在4月24日，日本众议院定居点管理监督委员会第二小组委员会上，日本的一位名叫纪伊隆的议员与永冈桂子进行了直接讨论。

根据纪伊隆在会后整理的问答可以看到，永冈桂子在谈到日本关于使用AI进行信息分析的法律制度（版权法）时，表示“在日本，无论使用何种方法，无论是出于营利或非营利目的，无论用于复制以外的行为，还是从非法网站获得的内容，都可以使用信息分析作品。”

此外，两人也谈到了在学校使用ChatGPT等人工智能聊天机器人的教育指导方针。据外媒报道，该技术或工具最早将于2024年3月被日本教育系统采用。对此，永冈桂子并没有给出具体的时间，只是表示会“尽快”回复。

此事引起了极其广泛的讨论。AI三巨头之一，Meta首席科学家杨立昆（Yann LeCun）就发推表示：

日本已经成为机器学习的天堂。

但有网友指责他不应该将“能够窃取知识版权而不受影响”称之为“天堂”，杨立昆则在评论下方回复道：构成知识产权“财产”的本质是由政府定义和执行的。它也受到政府的限制。驱动原则是最大化公共利益，而不是最大化内容所有者的权利。

事实上，围绕AI训练资料是否应得到版权保护这一点，网友们展开了激烈的讨论。有人赞同日本大臣的这一立场，并提出，一批待训练的图像数据一定会经过层层处理，最终转换成为AI模型或者计算机能看懂的数据、代码或其他电子格式。也就是说，模型训练所使用的数据基本上都高度有损，因此，即使在最坏的情况下也只是在用“派生作品”，这当然是合理使用。只有当模型抄袭受版权保护的代码、制作版权图像的图像或者复制书籍，最后再分发输出，这才算是侵权。

对此，马上有人反对：无论是否有损，训练数据都提供了价值。如果各种各样的人没有花时间制作所有最终成为训练数据的东西，那么它训练的模型就不会存在。

还有网友提出，争论版权问题没有意义，人类总是通过研究已经存在、曾经发布过的东西来不断学习进化，所以更重要的是从监管层面讨论如何更便捷合理地使用、分享或组织控制这些“共享信息”。

采写：南都记者杨博雯

相关资讯

日本政府表态：不会对AI训练使用的数据实施版权保护

日本政府方面，最近重申不会对人工智能训练中使用的数据实施版权保护。该政策允许AI使用任何数据，“无论是出于非营利或商业目的，是否是复制以外的行为，也无论是从非法网站或其他方式获得的内容。可见日本的立场很明确——如果西方用日本文化来训练人工智能，那么西方文学资源也应该可以用于日本人工智能。(站长之家)

人工智能

2023-06-01

严苛版权保护阻碍AI技术发展？日本政府重申：AI所用数据不受版权保护

人工智能法律

红星新闻 2023-06-02

财联社 2023-04-11

AI训练数据不用担心版权问题？日本政府表态引发热议

推荐体验

相关资讯

日本政府表态：不会对AI训练使用的数据实施版权保护

严苛版权保护阻碍AI技术发展？日本政府重申：AI所用数据不受版权保护

AI时代，如何安全使用ChatGPT引发热议

日本政府现阶段无意监督ChatGPT

日本政府探讨运用ChatGPT减轻行政负担

近期资讯

挖来“95后天才少女”，雷军还想创造奇迹

“众神”落座，2025春节档戴上荆棘王冠

中国人内卷，韩国人怎么先哭了？

36氪研究院 | 2024年中国人工智能之自然语言处理（NLP）技术洞察

8点1氪｜河北邯郸初中生被杀案一审宣判；韩国济州航空又一客机起落架故障；华为悬赏300万元求解难题

新能源汽车全球合作势不可挡

闲鱼“搞钱”，可能比年轻人更急迫？

通往网红之路，这座中部城市有多努力？

我们关于大脑的5个误解

东方甄选三周年：孙东旭成“男明星”，董宇辉越行越远

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响