清华团队国产“Sora”火了！Vidu为沉浸式投影带来丰富视效

作者：偏锋光术3D全息投影发布时间：2024-04-28

4月27日，在中关村论坛未来人工智能先锋论坛上，中国首个长时长、高一致性、高动态性视频大模型Vidu正式发布。这一模型由清华大学和大模型创业公司生数科技联合发布，可以一键生成长度达16秒、分辨率为1080P的高清视频内容，这也是自OpenAI发布Sora以后，全球率先取得重大突破的视频大模型。借助这一智能大模型，未来它是否能与沉浸式投影融合，为观众带来更丰富、更便捷的生动视效呢？

生成视频长度突破10秒大关

近日，生数科技联合清华大学发布了视频大模型Vidu，引发了广泛关注。这一模型支持一键生成长达16秒、分辨率达1080p的高清视频内容，画面效果接近Sora，并且在多方面表现出色，包括镜头语言、时空一致性、物理模拟等方面，让人惊叹不已。在实践过程中，Vidu生成的视频不再是持续几秒的GIF，而是达到了16秒，并且做到了画面连续流畅，且有细节、逻辑连贯，尽管都是运动画面，但几乎不会出现穿模、鬼影、运动不符合现实规律的问题，而实现这般效果，背后团队只用了两个月的时间。

Vidu视频大模型的特点与优势

“画室里的一艘船驶向镜头”，只需要输入这样一句简单的指令，即可以生成效果逼真、镜头连贯的一段视频。据生数科技介绍，Vidu模型采用团队原创的Diffusion与Transformer融合的架构U-ViT，支持一键生成长达16秒、分辨率高达1080P的高清视频内容。正是基于在机器学习和多模态大模型的长期积累，团队才能够在短短的两个月时间里突破了长视频表示与处理的多项关键技术，成功研发推出Vidu视频大模型。

那么，这一视频大模型与其他相比，又有哪些特点与优势呢？首先，它可以模拟真实物理世界，可以生成复杂、细节丰富的场景，光影效果与人物表情都能够符合真实的物理规律，同时，Vidu具有多镜头语言，不再局限于固定镜头，能够在遵循主体一致性的情况下实现远景、近景、中景、特写等不同镜头的动态切换，还可以实现长镜头、追焦等效果。富有想象力的提示词，可以虚构出丰富的场景以及超现实主义的画面，出色的视频时长也能保持镜头和主体的连贯一致，更具特色的是，Vidu能够生成特有中国元素的画面，比如熊猫、神龙、宫殿场景等，创造出活力与平静的和谐融合。

大模型融合沉浸式投影，丰富特效触手可及

在视频大模型Vidu的卓越性能之下，它可以生成高清、长时长、高动态性的视频，如果在未来它能与沉浸式投影相结合，将为体验空间提供更为生动、逼真的画面，进一步增强观众的沉浸感。

Vidu能够生成丰富多样的视频内容，借助多媒体投影融合技术，这些画面能够呈现出更好的效果，为观众带来一种身临其境的体验。例如山川河流、森林草原、城市街景、科幻世界等等，Vidu都能通过其强大的视频生成能力提供逼真的场景再现，同时还可以用于创造和展示一些超现实的、富有想象力的内容，无论是在娱乐、教育还是商业领域，这一技术都将具有巨大的发展潜力。

文章编辑：偏锋光术栗子

清华团队国产“Sora”火了！Vidu为沉浸式投影带来丰富视效

生成视频长度突破10秒大关

Vidu视频大模型的特点与优势

大模型融合沉浸式投影，丰富特效触手可及

推荐体验

相关资讯

生数科技发布视频大模型「Vidu」引关注清华团队国产Sora火了

国产Sora诞生，清华团队发布Vidu大模型

清华团队国产“Sora”火了：全面对标国际顶尖水平

国产Sora诞生！清华团队发布Vidu大模型，可直接生成16秒视频

清华团队国产“Sora”火了！画面效果对标OpenAI，长度可达16秒

近期资讯

深圳市周励电子科技取得能够限制最大功率的开关电源专利，能够限制最大功率

从RayBan Meta起头，聊聊智能眼镜

赛博传单，为300多万人的生活托底

力零科技申请用于带电作业的并沟线夹安装工具专利，提升并沟线夹带电作业效率

“微信送礼”重燃战火，电商格局迎来新变数？

10个产品细节剖析，看高手是如何做趣味设计的？

供应链金融在物流平台领域创新发展案例（一）

威胜能源技术取得一种负电源电路专利，成本极低

上海航天能源取得一种基于本安关联的电源专利，降低产品成本

力林科技取得电源转换装置专利，具有高电压需求且具备小体积

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响