当前位置:首页|资讯|Sora

短视频终结者?Sora离民用还有多少距离

作者:小高说发布时间:2024-03-08

原标题:短视频终结者?Sora离民用还有多少距离

作为新媒体的代表,短视频作为人们获取资讯、娱乐和社交的重要方式,逐渐深入到人们的日常生活中。与此同时,随着科技的蓬勃发展,在2024年2月16日的凌晨(美国当地时间2月15日),OpenAI提供了一款文声视频模型——Sora。

这一消息迅速在全球范围内引起了强烈的震撼。Sora破解传统视频制作的局限,呈现给用户全新的视觉体验,通过使用人工智能技术将用户的语言描述、动作和表情实时转换为虚拟化的角色形象。如此独特的技术创新,让人们挂冠Sora为“短视频的终结者”。

本篇文章将为你揭开Sora技术原理的神秘面纱,分析Sora当前所面临的局限性和挑战并探讨Sora能否完全取代短视频,它离我们日常生活的距离,又有多远?

一、Sora——短视频制作的新方向

Sora是由美国人工智能研究机构OpenAI开发的一种人工智能模型。它的名字来源于日文的“空”(そら sora),象征着无限的创造潜力。

踏进Sora的官方网站,两段深入浅出的关于Sora的介绍即刻映入眼帘:我们正致力于帮助人们处理需要实际世界互动的各种问题。从文本到视频模型,Sora可生成长达一分钟的视频,同时保持卓越的视觉质量,且严格遵循用户的提示。

简单来说,它的主要功能就是根据用户文本描述生成视频,通过多个静态图像生成动画,或拓展现有的视频从而创造出多个画面。例如,如果你给Sora一个描述:“一个女子在东京街道上行走”,Sora便能快速地生成一个符合这个描述的视频。

由一段文本描述所生成的一镜到底60秒的1080P高清视频中:在东京街头霓虹灯与城市标志温暖发光,一个充满自信的女人稳步行走,道路映着灯光,形成五彩斑斓的镜面效果,街头行人忙碌的身影,每一个细节都跃然画面之上。精致的角色栩栩如生,如同观赏一段高质量的实拍视频。

那么,如此神奇的效果又是如何被实现的呢?

Sora是一种创新的技术产品,其核心基于Transformer架构构建,这是一种深度学习模型,被广泛应用于机器翻译、语音识别等领域。Sora的出现并非偶然,而是在DALL·E和GPT等先前的研究基础上孕育而生,这些研究都是人工智能领域的里程碑式成果。

Sora的独特之处在于借鉴了DALL·E3的重述技术,这是一种将一种表述方式转化为另一种表述方式的技术,如将文字转化为图像,或者将一种语言的表述转化为另一种语言的表述。借助这种技术,Sora能够将用户的文字描述和行为表情实时转化为虚拟角色的形象和动作,这种转化不仅快速,而且准确,能够很好地捕捉到用户的意图。

这种技术的创新突破,打破了传统视频的制作方式,即不再需要复杂的摄影设备和专业的技术人员,任何人都可以通过Sora创建出自己想要的虚拟角色,并通过文字和表情控制角色的行为。这为用户提供了许多创新和自由空间,他们可以在虚拟世界中尽情发挥,创作出更多新颖、有趣的内容。为视频创作者和观众带来全新的视觉体验,也预示着虚拟世界的未来可能会有更多的创新和发展。

二、Sora——短视频的新机遇与挑战

视频在信息传递和娱乐领域所代来的便利深入到人们的日常生活,但是制作短视频需要复杂的设备和技术支撑,对于大多数使用者而言,创作难度相对较高。加上短视频的制作过程往往需要耗费大量的时间和精力,这在某种程度上,对其发展形成了制约。而Sora的出现,无疑为用户提供了一种全新的选择。那么,Sora能否取代短视频,成为新的主流媒体形式呢?

事实上,尽管Sora看上去技术强大,但也存在着诸多待以解决的问题。

首先,Sora所创作的视频在物理交互的模拟准确性上存在一些误差,混乱的空间细节提示等等。场景的具体表述中,如一分钟的东京街头女郎漫步中,女人走路过程中存在腿部变形、腿部交叉换位时错乱、右腿连续两次在前方迈步等错误;或者“一人跑步的场景”中,主角在跑步机上反向奔跑,或是提示词为“考古学家在沙漠发现塑料椅子”的视频中,椅子呈现悬浮状态,破碎的玻璃杯和燃烧着的蜡烛所存在的错误的物理现象。

其次,Sora的AI算法还需要进一步完善与优化,以便生成更自然流畅的虚拟角色动画。最后,在安全性上,Sora的使用更需要严格的规范与监管,以防止其被不法分子滥用,从而产生误导性的内容或安全性和隐私问题。

三、Sora——离我们尚存距离

从目前来看,虽然Sora提供了一种全新的短视频创作方式,但它是否能在确保安全性的同时既能满足用户的需求又能符合基本的物理现象,还需要进一步的探索与研究。

动画师Owen Fern对Sora的评价是,虽然它的视频质量令人惊叹,但是在为客户提供精益求精的作品方面,Sora还有很长的一段路。他认为,动画制作是一个需要反复修正的过程,而目前的AI技术还无法满足这一需求。

Perplexity AI的创始人之一Aravind Srinivas指出,它还没有做好准确模拟物理的准备。他认为Sora虽然在很多方面令人印象深刻但是模拟复杂场景,理解因果关系等等方面还有着诸多的困难。

这些专家们对Sora和其他AI视频技术的看法如出一辙,既认同其潜力,但也指出了Sora当前所面临的局限性和挑战。

总的来说,作为一种新型媒体形态,Sora拥有无可估量的开发潜力。尽管其离民用市场还有一段距离,但我们有充分的理由相信,随着技术进步和规范制定的深化,Sora潜力得以发挥,可能会在不远的未来成为我们生活的一部分。对于短视频而言,这既是一崛起的挑战,同时也是一次历史性的机遇。在新媒体生态环境下,如何找到自身的位置,将是短视频行业需深入思考的课题。

End

高净值研究院

学点东西 | 交点朋友 | 合作共赢


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1