横空出世的Sora，OpenAI的王炸？

作者：水哥发布时间：2024-08-17

谁能料到，OpenAI的王炸留到了这个时候，但是以阿尔特曼迄今为止的表现和公开态度来看，Sora是否为最后的底牌仍不可知。

Sora是一个能以文本描述生成视频的人工智能模型，由知名人工智能研究机构OpenAI开发。

Sora这一名称源于日文“空”（そら sora），即天空之意，以示其无限的创造潜力。其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的。模型的训练数据既包含公开可用的视频，也包括了专为训练目的而获授权的版权视频，但OpenAI没有公开训练数据的具体数量与确切来源。

在Sora之前，该领域已经有了其他几种文生视频模型，包括Meta的Make-A-Video、Runwa的Gen-2和Google的Lumiere，其中最后一个模型截至2024年2月已发布还处于研究阶段。Sora其开发公司OpenAI于2023年9月发布了DALL•E 3，这是其第三版DALL-E文生图模型。

Sora背后的技术基于DALL•E3模型。根据OpenAI的说法，Sora是一个扩散变压器——一种去噪潜在扩散模型，使用一个Transformer作为降噪器。通过对 3D“补丁”进行去噪，于潜在空间生成视频，然后通过视频解压器将其转换为标准空间。重新生成的字幕用于通过使用视频到文本模型在视频上创建详细的字幕来增强训练数据集。

OpenAI于2024年2月15日向公众展示了由Sora生成的多个高清视频，称该模型能够生成长达一分钟的视频。同时，OpenAI也承认了该技术的一些缺点，包括在模拟复杂物理现象方面的困难。《麻省理工科技评论》的报道称演示视频令人印象深刻，但指出它们可能是经精心挑选的，并不一定能代表Sora生成视频的普遍水准。

由于担心Sora可能被滥用，OpenAI表示目前没有计划向公众发布该模型，而是给予小部分研究人员有限的访问权限，以理解模型的潜在危害。Sora生成的视频带有C2PA元数据标签，以表示它们是由人工智能模型生成的。OpenAI还与一小群创意专业人士分享了Sora，以获取对其实用性的反馈。

相关资讯

MoonBit 2024-02-21

横空出世的Sora，OpenAI的王炸？

推荐体验

相关资讯

Sora横空出世影响几何？

ChatGPT横空出世

新能源汽车之后，中国又一产业王炸横空出世

ChatGPT之后，Sora横空出世，可怕还是可敬？

Sora横空出世！AI将如何撬动未来？

近期资讯

网易云音乐 2024 年度听歌报告被吐槽不准，客服回应

网易云音乐年度听歌报告被吐槽不准

AI 大模型：教育变革的新引擎

万字长文起底AI副业内幕，2024爆火AI副业方向整理

白皮书：近九成用户购买科技产品前在B站搜索测评内容

日本熊本县知事：“台积电熊本厂”JASM 首座晶圆厂已投产

微软再陷反垄断泥潭，Office 捆绑销售安全、云服务策略遭调查

DeepSeek V3获众多AI大佬赞誉：高性能低成本是智慧和实用主义的体现

OPPO周意保：接下来Find系列节奏会稳定下来，每年春秋季各有一场旗舰发布会

消息称亚马逊要求大卖家“二选一”，亚马逊回应：不符合事实，卖家自主决定

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响