当前位置:首页|资讯|OpenAI

突发!OpenAI震撼发布文本生成视频模型Sora

作者:格物时间发布时间:2024-02-16

2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。


Sora 模型的能力超乎想象,它能够仅凭用户的文字描述,就创造出充满细腻情感交流和复杂动作轨迹的视频,每一个片段都是对原始文本的生动再现。这标志着我们正式迈入了一个全新的时代——文本不再是静态的叙述,而是可以转化为动态、丰富多彩的视觉故事。


根据 OpenAI 的介绍博文,Sora 能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出,该模型能够理解物体"在物理世界中的存在方式",还能"准确解释道具并生成表达生动情感的引人注目的角色"。


该模型还能根据静态图像生成视频,以及在现有视频中填充缺失的帧或扩展视频。OpenAI 的博文中包含的 Sora 生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹--比如在一段博物馆的视频中,地板疑似在移动。OpenAI 表示,该模型"可能难以准确模拟复杂场景的物理现象",但总体而言,演示结果令人印象深刻。


仅几年前,Midjourney等文本到图像生成器在将文字转换为图像的能力上引领潮流。然而,随着视频技术的飞速发展,Runway、Pika等公司推出的文字转视频模型开始吸引广泛关注,标志着数字创作领域的新篇章。Google的Lumiere模型,作为OpenAI在视频生成技术领域的主要竞争者之一,也展现了其强大的文字转视频能力。这些进步不仅体现了技术的快速进步,也预示着创作者将拥有更多将文字想象力转化为动态视觉体验的工具。Sora和Lumiere等工具的出现,为数字艺术和内容创作开辟了新的可能性,让静态图像和文字故事以电影级别的质量复活。

是的,另一个AI 的春天到了,很多行业的冬天也要来了。我们开始迎接这愈来愈快的滚滚洪流吧!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1