当前位置:首页|资讯|Sora|OpenAI

Sora训练数据何处寻?OpenAI首席技术官表示不确定

作者:网界发布时间:2024-03-25

原标题:Sora训练数据何处寻?OpenAI首席技术官表示不确定

近日,备受瞩目的AI公司OpenAI推出了其全新的文本转视频生成模型Sora,然而,在公众对该技术的热情追捧中,有关其训练数据的疑问却逐渐浮出水面。在接受华尔街日报的采访时,OpenAI的首席技术官Mira Murati对于Sora的训练数据来源表现得极为保守,令人困惑。

当被问及Sora的训练数据时,Murati只是笼统地表示:“我们使用的是公开可用数据和许可数据。”然而,当记者进一步追问这些数据是否包括YouTube视频时,Murati的回答却出人意料:“我实际上并不确定。”对于是否使用了Instagram或Facebook视频的问题,她也同样避而不答。

Murati的含糊其辞引发了外界对OpenAI的质疑。此前,该公司就曾因数据抓取行为而引发争议,甚至面临多起版权诉讼,其中包括纽约时报的指控。如今,连公司的首席技术官都无法明确说明其最热门模型的训练数据来源,这无疑让人对OpenAI的数据使用策略产生了严重的怀疑。

据报道,采访结束后,Murati曾私下承认确实使用了Shutterstock视频来训练Sora。然而,考虑到网络上视频的庞大数量,这些来自Shutterstock的素材可能只是Sora训练数据中的冰山一角。那么,其他的训练数据究竟来自何处?Murati为何在采访中对此三缄其口?

一些网友对Murati的表现表示失望,认为她缺乏坦诚,甚至质疑她是否真正了解自己的产品。他们指出,作为首席技术官,对如此关键的问题不知情是难以接受的。然而,也有人持理解的态度,认为既然内容已经公开,人工智能公司就有权使用。他们认为,用户在公开内容时就应该意识到可能被使用的风险。

不过,无论外界的看法如何,一个不争的事实是:公众对于AI训练数据的来源和使用方式有着极高的关注度。尤其是在数据隐私和版权问题日益受到重视的今天,含糊其辞的官方说辞显然无法平息人们的疑虑。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1