Sora训练数据何处寻？OpenAI首席技术官表示不确定

作者：网界发布时间：2024-03-25

近日，备受瞩目的AI公司OpenAI推出了其全新的文本转视频生成模型Sora，然而，在公众对该技术的热情追捧中，有关其训练数据的疑问却逐渐浮出水面。在接受华尔街日报的采访时，OpenAI的首席技术官Mira Murati对于Sora的训练数据来源表现得极为保守，令人困惑。

当被问及Sora的训练数据时，Murati只是笼统地表示：“我们使用的是公开可用数据和许可数据。”然而，当记者进一步追问这些数据是否包括YouTube视频时，Murati的回答却出人意料：“我实际上并不确定。”对于是否使用了Instagram或Facebook视频的问题，她也同样避而不答。

Murati的含糊其辞引发了外界对OpenAI的质疑。此前，该公司就曾因数据抓取行为而引发争议，甚至面临多起版权诉讼，其中包括纽约时报的指控。如今，连公司的首席技术官都无法明确说明其最热门模型的训练数据来源，这无疑让人对OpenAI的数据使用策略产生了严重的怀疑。

据报道，采访结束后，Murati曾私下承认确实使用了Shutterstock视频来训练Sora。然而，考虑到网络上视频的庞大数量，这些来自Shutterstock的素材可能只是Sora训练数据中的冰山一角。那么，其他的训练数据究竟来自何处?Murati为何在采访中对此三缄其口?

一些网友对Murati的表现表示失望，认为她缺乏坦诚，甚至质疑她是否真正了解自己的产品。他们指出，作为首席技术官，对如此关键的问题不知情是难以接受的。然而，也有人持理解的态度，认为既然内容已经公开，人工智能公司就有权使用。他们认为，用户在公开内容时就应该意识到可能被使用的风险。

不过，无论外界的看法如何，一个不争的事实是：公众对于AI训练数据的来源和使用方式有着极高的关注度。尤其是在数据隐私和版权问题日益受到重视的今天，含糊其辞的官方说辞显然无法平息人们的疑虑。

Sora训练数据何处寻？OpenAI首席技术官表示不确定

推荐体验

相关资讯

OpenAI 首席技术官：不确定 Sora 的训练数据来自哪里

美国OpenAI首席技术官：不确定是否使用社交媒体数据训练Sora

OpenAI首席技术官：不确定是否使用了社交媒体数据训练Sora

是否用社媒数据训练Sora？OpenAI技术官：不确定

OpenAI首席技术官：不确定是否使用了社交媒体数据训练Sora丨前沿抢先看

近期资讯

深圳数码模取得连续模传递生产用防变形支撑装置专利，可防止连续模传递生产变形

光皓光学申请红外硫系超精密玻璃模压成型专利，提高成型装置工作效率

新旗滨科技申请旋转管气泡消除装置专利，解决玻璃管生产中气泡降低品质的问题

洛阳北方玻璃申请曲面玻璃制备方法及装置专利，提高成型玻璃的产品精度

安徽巨一科技取得一种包边系统压刀驱动装置专利，为包边质量提供有力保障

亿森（上海）模具有限公司取得冲压模具定位装置专利，解决模具偏移问题

昆山合德欣取得一种钣金件冲压模具的组装设备专利，能够快速对模具进行安装与拆卸

苏州铭伍金属科技取得一种导向机构及其冲压模具专利，稳定性更好

夏津县德泽机械设备配件有限公司取得高效伺服组角机专利，组角效率高

万源市德诺仪表有限公司取得用于压力表机芯的铆压设备专利，避免长时间等待导致铆压效率不佳

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响