当前位置:首页|资讯|Sora

全面媲美Sora!为国产打CALL!国产首个纯自研视频大模型Vidu有多能打?

作者:搜狐智库发布时间:2024-06-03

出品|搜狐智库

编辑|任婧瑄

这是AI视频——

这也是AI视频——

这还是AI视频——

不会有人以为这几段都是Sora做的吧?风水轮流转,这次“血洗”AI届的是昨天刚刚亮相的中国首个原创视频大模型——Vidu!

“长时长、高一致性、高动态性”,而且更适合中国宝宝体质,都是Vidu最能打的特点。不过有没有人和我一样好奇,Vidu真能能对标今年二月份引发科技圈“地震”的Sora吗?今天咱就边看,边一块儿为国产“打call”!

画质方面,Sora和Vidu在逼真细腻、以假乱真上,不相上下。Vidu可以根据文本描述直接生成长达16秒的1080P高清视频。但Sora在时长上略胜一筹,能一键生成长达一分钟的高清视频。

不过清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右。

这样一对比,Vidu确实已经极具突破性。

从写实角度出发,Vidu也能像Sora一样深度模拟真实物理世界,还原复杂的运动场景,例如合理的光影效果、细腻的人物表情等。

另外,Vidu能在一段画面里生成不同景别的动态镜头切换,而且能实现追焦、转场等效果。同时,随着镜头的移动,人物和场景在时间、空间中能保持高一致性,整体质感确实可以与Sora相媲美。

在“阅读理解”方面,Sora和Vidu都对提示词有深入的理解并能准确还原。Vidu的加分项,一是生数科技官方文案写道的“理解中国元素最在行”,能生成熊猫、龙等中国文化特色的形象;二是富有想象力,可以虚构场景以及想象超现实主义的画面。

那么敢和OpenAI掰手腕的到底是谁?Vidu的背后是生数科技和清华大学强强联手的团队。生数科技创始团队来自清华大学人工智能研究院,是全球最早从事扩散概率模型研究的团队之一。据报道,生数也是目前多模态大模型赛道估值最高的初创公司之一,目前已完成三轮融资,融资额达数亿元人民币。

评论区聊聊,你们觉得Vidu和Sora,谁的视频更逼真?


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1