出品|搜狐智库
编辑|任婧瑄
这是AI视频——
这也是AI视频——
这还是AI视频——
不会有人以为这几段都是Sora做的吧?风水轮流转,这次“血洗”AI届的是昨天刚刚亮相的中国首个原创视频大模型——Vidu!
“长时长、高一致性、高动态性”,而且更适合中国宝宝体质,都是Vidu最能打的特点。不过有没有人和我一样好奇,Vidu真能能对标今年二月份引发科技圈“地震”的Sora吗?今天咱就边看,边一块儿为国产“打call”!
画质方面,Sora和Vidu在逼真细腻、以假乱真上,不相上下。Vidu可以根据文本描述直接生成长达16秒的1080P高清视频。但Sora在时长上略胜一筹,能一键生成长达一分钟的高清视频。
不过清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右。
这样一对比,Vidu确实已经极具突破性。
从写实角度出发,Vidu也能像Sora一样深度模拟真实物理世界,还原复杂的运动场景,例如合理的光影效果、细腻的人物表情等。
另外,Vidu能在一段画面里生成不同景别的动态镜头切换,而且能实现追焦、转场等效果。同时,随着镜头的移动,人物和场景在时间、空间中能保持高一致性,整体质感确实可以与Sora相媲美。
在“阅读理解”方面,Sora和Vidu都对提示词有深入的理解并能准确还原。Vidu的加分项,一是生数科技官方文案写道的“理解中国元素最在行”,能生成熊猫、龙等中国文化特色的形象;二是富有想象力,可以虚构场景以及想象超现实主义的画面。
那么敢和OpenAI掰手腕的到底是谁?Vidu的背后是生数科技和清华大学强强联手的团队。生数科技创始团队来自清华大学人工智能研究院,是全球最早从事扩散概率模型研究的团队之一。据报道,生数也是目前多模态大模型赛道估值最高的初创公司之一,目前已完成三轮融资,融资额达数亿元人民币。
评论区聊聊,你们觉得Vidu和Sora,谁的视频更逼真?