当前位置:首页|资讯|Sora|提示词

国内首个纯自研视频大模型Vidu全面开放使用

作者:北京日报发布时间:2024-07-30

7月30日,曾在今年中关村论坛期间亮相发布的首个国产纯自研视频大模型Vidu(www.vidu.studio)宣布在全球范围内上线,向公众提供服务,其开放了文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。

据了解,目前业界对类Sora视频模型的评价主要围绕三大核心维度:语义理解准确性、画面美观性、主体动态的一致性,Vidu很好地平衡了三方面的表现。 Vidu能够准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一人称、延时摄影等镜头语言,也能精准表达,用户只需要细化自己所输入的提示词,就能大幅提升视频的可控性。同时,Vidu支持大幅度、精准的动作生成,保持高流畅、高动态的画面效果。

此外,在“图生视频”板块中,Vidu上线了角色一致性功能,用户可以上传人像图或者自定义的角色图,然后通过文字描述指定该角色在任意场景中做出任意动作。例如,可以上传埃隆·马斯克的照片,通过输入描述词,让这位科技巨头化身宇航员遨游太空,或者变身钢铁侠。这一功能简化了视频制作流程,节省了设计和调整角色形象的时间,同时也为视频创作者提供了较大的创作自由度。

Vidu以马斯克为形象生成的钢铁侠视频截图

近几个月来,国产大模型团队在视频生成领域进展频频。四月份Vidu首次亮相后,商汤、智谱也相继发布了视频生成大模型服务,此前主要以申请内测形式提供服务。目前Vidu无需申请,用户直接使用邮箱注册就可以上手体验。

记者体验后发现,首次注册进入Vidu视频大模型官网后,系统免费提供了每月80积分的免费额度,生成一条4秒的视频约消耗4积分。当记者输入了“两只小雏鸡从斑驳的笼子里走出,奔跑在阳光下的草坪上”这样一句话后,不到一分钟后,一条光线丰富自然、以两只小鸡为主角的4秒短视频就完成了生成。不过,免费生成的视频在清晰度上仍有待提升,如果需要生成更高质量画质、更长时间的视频,则需要成为付费订阅用户才能实现,订阅费用从月费7.99美元到79.99美元不等。

图片来源:生数科技

来源:北京日报客户端

记者:孙奇茹


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1