日前,《华尔街日报》于刊登了一篇对OpenAI首席技术官米拉·穆拉蒂的专访。在采访中,她透露了OpenAI即将在今年推出的全新项目——Sora,并指出可能需要等待数月时间才能与公众见面。
除了向公众推出Sora外,穆拉蒂还表示,OpenAI计划为该项目增添音频生成功能,以进一步提升场景的逼真程度。同时,为了应对AI工具在生成内容时可能出现的不准确性,公司还计划赋予用户编辑Sora生成内容的权限。她解释说,OpenAI正在积极探索方法,以使用户能够更自由地编辑和创作影音内容。
当被问及Sora的训练数据来源时,穆拉蒂并未提供太多具体信息。她仅表示:“虽然我们不会详细透露所使用的数据,但可以确保这些数据都是公开的或已获得许可的。”同时,对于是否使用了YouTube、Facebook和Instagram等平台上的视频数据,她表示并不确定,只确认Sora使用了与Shutterstock合作的内容。
此外,穆拉蒂还透露,Sora在发布后可能无法生成包含公众人物的影音内容,并且生成的视频将带有AI水印。这一举措可能是为了遵守相关法律法规和保护公众人物的权益。
值得一提的是,在不久前的3月10日,另一个文生视频平台Pika宣布推出了一项新功能,允许用户在生成的视频中无缝地整合声音。用户既可以通过提示词来描述所需的声音,也可以直接让Pika根据视频内容自动生成相应的声音。这一功能的推出进一步丰富了视频生成领域的技术手段,为用户提供了更多选择和可能性。
与此同时,Sora核心团队的三名成员近期在做客WVFRM播客频道时也表示,目前Sora仍处于反馈获取阶段,尚未成为一个成熟的产品,因此短期内不会向公众开放。这表明OpenAI在推出新产品时持谨慎态度,注重产品的稳定性和用户体验。