在人工智能快速发展的今天,各大科技公司争相抢占市场份额,但在这场AI淘金热中,一些企业的做法引发了争议。近日,市值高达2.4万亿美元的科技巨头NVIDIA被曝出涉嫌未经许可使用大量受版权保护的视频内容来训练AI模型,这一做法引发了业界广泛关注和讨论。
据香港IDC新天域互联了解,NVIDIA要求员工从YouTube、Netflix等平台下载视频,用于开发包括Omniverse 3D世界生成器、自动驾驶系统和"数字人"等多个商业AI项目。除此之外,NVIDIA还指示员工使用电影预告片数据库MovieNet、游戏片段软件库以及GitHub上的WebVid和InternVid-10M等数据集进行AI训练。
为了规避YouTube的检测,NVIDIA还采取了一些技术手段。据报道,该公司使用支持IP地址轮换的虚拟机下载视频,以避免被封禁。当一名员工建议使用第三方IP轮换工具时,另一名NVIDIA员工表示,他们在AWS上重启虚拟机实例就能获得新的公共IP,因此目前还没有遇到问题。
面对这一争议,NVIDIA发言人表示,公司的研究"完全符合版权法的条文和精神"。他们认为,知识产权法保护特定的表达,"但不保护事实、想法、数据或信息"。NVIDIA将这种做法类比为个人有权"从其他来源学习事实、想法、数据或信息,并表达自己的观点"。
然而,内容提供方显然不买账。YouTube发言人Jack Malon引用了该公司CEO Neal Mohan的话,称使用YouTube视频训练AI模型"明显违反"其使用条款。Netflix的发言人也表示,公司没有与NVIDIA签订任何内容使用协议,其服务条款不允许非法使用内容。
值得注意的是,NVIDIA并非第一家陷入此类争议的公司。今年4月,OpenAI就被曝出未经许可使用YouTube视频训练其Sora文字转视频AI模型。7月底,新创公司Runway AI也被指做了类似的事情。这反映出在AI快速发展的背景下,数据获取和使用的合法性问题正成为业界的一大挑战。
对于员工提出的道德和法律顾虑,NVIDIA研究副总裁刘洺堉表示,这是高层的决定,公司已获得所有数据使用的批准。有员工将数据采集描述为"公开法律问题",并表示将来会解决这个问题。这种态度让人不禁联想到Facebook(Meta)曾经的"快速行动,打破陈规"口号。
这一事件引发了人们对AI发展中数据伦理和法律边界的思考。在追求技术进步的同时,如何平衡创新与版权保护,如何在合法合规的基础上获取有效训练数据,成为摆在各大科技公司面前的难题。
随着AI技术的不断发展,类似的争议可能会越来越多。监管机构、科技公司和内容创作者需要共同努力,制定更清晰的规则和标准,以确保AI的发展既能推动技术创新,又能尊重知识产权,维护各方利益。