Sora火了,简直就是视频界的爆款神话。这货一出,立马成了网红,各种狂欢,人气爆表。看着作者小哥那些让人眼前一亮的视频,连失败的都让人停不下来。点赞破万,学术界大咖们也忍不住加入讨论,一时间,Sora成了头号话题。
纽约大学的谢赛宁直接宣布:Sora要重塑视频生成领域。英伟达的Jim Fan更是激动地呼喊:这就是视频生成的GPT-3时代啊!技术细节虽然有点模糊,但这反而激起了更多猜测,Sora到底是怎样的存在?
体验中国版Sora公众号搜:索啦AI创意
让我们来掰扯一下,Sora究竟有啥玄机?它是一个在各种格式视频和图像上训练的扩散模型,还整了个Transformer架构,简直就是扩散界的变形金刚。官方放出的技术干货虽然只有那么几点,但足够让人好奇:从视觉数据的独特处理,到视频压缩技术,再到扩展Transformer的黑科技,每一样都让Sora的魅力加分。别的不说,单是Sora对视频多样性的处理,就已经让它在视频生成界独树一帜。
接着,语言理解能力也不容小觑,这得益于OpenAI将DALL·E 3的技术引入视频领域。总而言之,虽然文中对“patch”等关键技术讲解不多,但Sora的能力已经显而易见。
体验中国版Sora公众号搜:索啦AI创意
当然,对于Sora的猜测五花八门。有的说它建立在DiT上,有的说可能采用VAE架构,参数大概30亿。而且,Sora的训练可能并不需要想象中那么疯狂的资源。另一边,有人认为Sora是个数据驱动的物理引擎,甚至有胆大的网友猜测Sora用了虚幻引擎5做训练数据。各种猜测虽然有趣,但也显示出Sora的神秘和吸引力。
OpenAI因Sora火得一塌糊涂,估值飙升至800亿美元,直追字节跳动和SpaceX,成为科技界的新贵。这不仅是对Sora,也是对OpenAI技术实力的一种认可。虽然“GPT”商标申请没过,但这点小插曲丝毫不影响Sora的光芒。
最后的彩蛋是,Stability AI似乎也想分一杯羹,但在Sora的光环下,他们的SVD 1.1显得有点黯淡。
简言之,Sora不仅仅是技术的革新,更是一次对视频生成领域想象力的挑战。它的火爆,预示着视频生成技术的新纪元已经来临。想深入体验,就来搜索啦AI创意,看看Sora能带给我们怎样的视觉盛宴!
胖橘与科研123 2024-11-15
你好太空2022 2024-11-15