·在“可预见的未来”Sora不会被发布,目前的版本仍是一个研究项目,不能在ChatGPT或其他地方使用。“对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。”
OpenAI的Sora团队在一档播客中接受采访。胡逸璠 来源:澎湃新闻(03:03)
OpenAI文生视频大模型Sora不会很快发布。
Sora团队日前在一档播客中接受采访时表示,在“可预见的未来”Sora不会被发布,目前的版本仍是一个研究项目,不能在ChatGPT或其他地方使用。“对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但我们应该如何改进它是一个悬而未决的问题。”OpenAI的Sora项目研究负责人蒂姆·布鲁克斯(Tim Brooks)说。
“要听听安全专家的意见,如何让这项技术对世界更安全。听听艺术家的意见,如何让这项技术在工作流程中发挥作用。”布鲁克斯表示,早期的反馈是,用户希望对视频生成有更多的控制,而不仅仅是文本提示。
2月16日,OpenAI推出新的AI大模型Sora,该文生视频大模型可通过快速文本提示创建“逼真”和“富有想象力”的60秒视频。研究人员表示,Sora是在公开可用数据和OpenAI授权数据的组合上进行训练的。目前Sora在生成手部、复杂的物理过程,以及随时间发生的运动或轨迹方面存在局限。
而在Sora生成视频中添加音频并不直接出现在开发路线图上,但这是一种选择。OpenAI的Sora项目负责人比尔·皮布尔斯(Bill Peebles)表示,对于目前的Sora版本,OpenAI聚焦推进视频生产模型的能力,因为在此之前,很多AI生成视频的时长只有4秒,质量也不高。添加音频确实会让AI生成视频更加沉浸式,这是团队考虑的事情,但目前Sora主要是一个视频生成模型。
AI可能会生成与真实视频无法区分的视频。为了遏制虚假的人工智能视频,Sora团队负责人阿迪亚·拉梅什(Aditya Ramesh)表示,OpenAI计划为Sora调整OpenAI图像生成工具DALL-E 3的分类器。图像分类器可以可靠识别图像是否使用DALL-E 3创建。“这本身不是一个完整的解决方案,但可以看作是第一步。”
他们还提到了Sora在创意产业中潜在的革命性作用:通过降低生产成本,Sora可以实现以前由于资金问题而无法实现的创新内容。布鲁克斯表示,“通过创造全新的工具,让有创造力的人推动创意的边界,是非常令人激动的。”