当前位置:首页|资讯

AI视频生成新进展,Vidu上线“主体参照”功能

作者:北京日报发布时间:2024-09-12

今年4月,生数科技联合清华大学发布了中国首个原创全自研,长时长、高一致性、高动态性的视频大模型Vidu。9月11日,生数科技在行业内首次发布“主体参照”(Subject Consistency)功能,该功能能够实现对任意主体的一致性生成,让视频生成更加稳定、可控,目前该功能已面向用户免费开放。

所谓“主体参照”,就是允许用户上传任意主体的一张图片,Vidu 就能够锁定该主体的形象,通过描述词任意切换场景,输出主体一致的视频。该功能不局限于单一对象,而是面向“任意主体”,无论是人物、动物、商品,还是动漫角色、虚构主体,都能确保其在视频生成中的一致性和可控性,这是视频生成领域的一大创新。Vidu 也是全球首个支持该能力的视频大模型。

比如进行人物角色的“主体参照”,无论是真实人物还是虚构角色,Vidu 都能保持其在不同环境中、不同镜头下的形象连贯一致。以具体案例来看,输入一张林黛玉的角色照,输入同样的“在现代咖啡厅喝咖啡”的描述并让Vidu生成相应的视频后,能直观看到,在Vidu “主体参照”功能下,林黛玉的形象在现代场景中得到了完美保留,场景输出也自然而真实。而未具备该功能时生成的视频中,林黛玉仅保留了面部特征,神态、人物整体形象都产生了略显突兀、不自然的变化。

“主体参照”功能使得AI视频生成展现出不小的变现潜力。以广告片生成为例,广告片的一大关键在于要保证多个镜头、不同场景下品牌物形象的一致性。视频大模型领域的竞争日益激烈,尽管众多模型层出不穷,但过去普遍存在着一个核心问题——可控性不足,或者叫一致性的不足。“主体参照”功能能够很好地解决这一问题。例如,在一个长度36秒的跑步鞋广告视频中,仅通过一张商品图,便完成了所有视频画面的生成,无论是不同角度、背景,还是动态表现,跑步鞋的形象在整个视频中都保持了高度一致。

生数科技相关负责人介绍,该视频仅一位人员花费6个小时完成,包含前期策划、素材生成,后期剪辑,其中30段AI视频素材的生成仅花费3个小时,整个流程仅参照一张商品图。传统广告片制作高度依赖线下实拍和后期制作,时间周期长、成本投入大,但现在通过 Vidu 能够极大地节省广告制作的成本,整个产出流程更加高效。

在功能发布同时,生数科技也推出了合作伙伴计划,邀请广告、影视、动漫、游戏等行业的机构加入,在内容共创、技术支持、市场拓展等方面展开合作,首批合作伙伴包括开心麻花、猫眼娱乐、巨人网络、美克家居、融创文化、河南省非物质文化遗产保护和智慧化中心、李可柒画院等知名企业与机构。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1