整理 | 褚杏娟
无论是可以做多模态推理的满血版 o1(给少数人准备的 200 美元 / 月 ChatGPT 大会员),还是少量数据就可以通过极少量高质量示例就可以快速调整模型的强化微调功能,OpenAI 12 天活动的前两天都让网友们直呼不过瘾和些许失望。
在提前一天就开始造势后,OpenAI 终于迎来了令 Altman“非常兴奋”的第三天。这次 Altman 毫不犹豫地确认 Sora 已经到来。Sora 今天起将在美国和“大多数国家”推出,并将在 Sora.com 上为 ChatGPT Plus 用户和 ChatGPT Pro 用户提供服务。此外,Sora Turbo 将于今天推出,具有更多功能,包括更快的处理器时间。
截图来自:Sora.com
此次发布的 Sora 版本,能够生成包含多个角色、特定类型动作以及主题和背景准确细节的复杂场景。该模型不仅理解用户在提示中所请求的内容,还理解这些事物在现实物理世界中的存在方式。
此外,OpenAI 还发布了 Sora 视频编辑器( Sora Video Editor),可以生成长达 20 秒的视频,同时保持视觉质量并符合提示词要求。
用户可以在屏幕底部通过在输入字段中提供文本来描述视频,或者在初始提示中上传图片或视频文件。如果要上传图片或视频文件,需要在输入字段中选择 + 选项,然后上传。根据上传条款协议,用户不得上传任何非自己所有或不拥有所有必要权利的内容,并且未经他人明确书面同意,用户不得上传任何他人的图像或视频。
提交提示词后,Sora 可能需要一分钟才能生成视频,此前用户可以查看设置,更改宽高比、分辨率、持续时间以及要创建的变体数量,不过更改这些设置将影响用户在生成上花费的积分。
视频生成完成后,用户可以将鼠标悬停在库中的预览上,观看所有视频的播放,以比较结果。用户可以点击单个视频以便在更大的视图中查看、编辑和构建生成的视频,Sora 视频编辑器包括以下功能:
Re-cut,在新的 Storyboard 中修剪、延长视频。Remix ,描述更改并基于此生成新的视频。Blend,从一个视频和另一个视频中的过渡元素Loop,根据视频的任何部分创建无缝循环
其中,Storyboard 可以让用户通过按时间戳选择要在视频中生成的单个帧来创建视频。
OpenAI 展示了 Sora 的 Remix 功能,将猛犸象换成了机器人,效果确实不俗。不过它不像第一代那样可以瞬间完成,需要几分钟时间。
用户还可以将视频添加到特定文件夹、举报视频或删除视频,但是已删除的内容是无法恢复的。
系统都挤爆了
Sora 研究副总裁 Aditya Ramesh 在 x 上也展示了新的视频:
OpenAI 前 CTO Mira Murati 也前来恭喜。
OpenAI 研究员 Will DePue 在 x 上表示,“我们付出了巨大的努力才实现这一目标,我认为该产品非常有趣且直观。”他表示自己最喜欢做的事情是生成虚假的历史镜头,他展示的视频也是此类:
发布后,就有用户迫不及待尝试。ChatGPT Plus 用户 Lance Ulanoff 在提示字段中输入,请求生成一个中年男子在海边建造火箭的场景。他描述了一个宁静的场景,有月亮、海浪轻拍、篝火和一只友好的狗。默认设置:5 秒、480p。
根据他的描述,只花了大约一分钟的时间,就出现了两个视频选项。一个是 5 秒钟的视频片段,里面有一只狗,但它的尾巴长在了头上。另一个 5 秒的视频不仅狗是正确的,也展示了一个男人正在建造一个小火箭模型。
“我想我不是唯一一个想使用 Sora 的人。截至目前,该系统已满负荷,尽管 Sora 界面中的某些功能(如 Storyboard )仍可工作,但由于系统已满负荷,它无法生成任何新的 AI 视频。事情可能需要一段时间才能平息下来——毕竟这是第一天——但当平息下来时,你会想尝试一下 Sora,相信我。”Ulanoff 说道。
不久后,Altman 就在 X 上发帖称,由于需求高于预期,他们暂停了视频生成器 Sora 的新注册,并且视频生成速度暂时会变慢。
当然,由于效果过于逼真,有的网友也会有些忧虑,“有点担心小孩子看这些视频可能会对自然界的物理现象产生不准确的印象。例如那只瓢虫看起来非常自然,但其中有一个小瑕疵,一个从未见过瓢虫移动的不知情的观察者可能会误以为这是正常的。”
使用有限制:账户、积分
Sora 目前只对 ChatGPT Plus 和 ChatGPT Pro 用户开放,ChatGPT Free、Enterprise 和 Edu 账户无法访问 Sora。
其中,ChatGPT Plus 用户最多 50 个优先视频(消耗 1,000 积分),视频分辨率高达 720p,时长为 5 秒;ChatGPT Pro 用户则最多 500 个优先视频(消耗 10,000 积分),可以生成无限 relaxed 视频(不消耗积分,但可能被安排在网站流量低时排队完成),最高支持 1080p 分辨率、20 秒时长、同时可以生成 5 个视频,并且下载无水印。
需要注意的是,通过 Sora 制作视频需要积分。不同分辨率、不同时长需要消耗的积分也不相同。一次请求生成多个视频将按与运行两个单独的生成请求相同的费率收费。
如果使用 Re-cut、Remix、Blend 和 Loop 来创建超出 5 秒增量的内容,则积分将按以下方式消耗:
另外,截至目前,OpenAI 尚不清楚何时在欧洲和英国推出。
Sora 支持的国家列表:https://help.openai.com/en/articles/10250692-sora-supported-countries
需要注意的是,OpenAI 会选择使用用户数据进行模型训练。如果想要禁止将个人数据用于模型训练,可以在个人资料中选择“设置”> “数据控制”,然后禁用“为每个人改进模型”功能。
结束语
或许是因为 Sora 一直未正式发布,但大家对其呈现的效果都很惊叹,因此 Sora 一直备受关注和期待。
昨天,LontVideo 联合创始人 CEO Ruud van der Linden 还在 x 上透露,OpenAI 的 Chad Nelson 在伦敦的 C21Media 主题演讲中表示 Sora v2 即将发布。根据泄露的视频内容,Sora v2 能够生成长达一分钟的动态视频,支持文本生成视频(text-to-video)、图像生成视频(text+image-to-video)、视频编辑生成(text+video-to-video)、视频间转换(video-to-video)。不过这次发布并未如提及的这般。
Sora 在上月底还被人在 huggingface 上恶意泄露了 API,使其短暂的开放了 1 小时左右。原因则是获得早期访问权限、测试 Sora 的艺术家和 OpenAI 爆发了巨大矛盾。他们认为,OpenAI 利用其进行免费工作,通过过分控制其早期测试计划,让他们白白为 OpenAI 制作宣传视频,于是这群艺术家通过泄露了 OpenAI 的 Sora 视频生成器访问权限,表达了对 OpenAI 的不满。
根据当时泄露的信息,这版 Sora 可以生成最高 1080P 分辨率、时长 10 秒的视频。有网友在使用 Sora 的 API 时候发现,泄露的 API 实际上是 Sora Trubo。但 OpenAI 发言人回应只表示,Sora 仍处于“研究预览”阶段。
此次Sora终于如愿发布,是否满足了大家的期待?