当前位置:首页|资讯|提示词

发布即开源:智谱AI最新视频模型支持10秒60帧4K画质,还自带音效

作者:澎湃新闻发布时间:2024-11-10

11月8日,智谱AI清影迎来升级,发布最新版视频模型CogVideoX v1.5。升级后的清影在复杂提示词理解等方面的能力得到提升,能够生成10秒、4k、60帧超高清画质,同时支持任意比例图像生成视频,可以一次性生成4个视频。

智谱也同步发布了音效模型CogSound和音乐模型CogMusic,可以生成与画面匹配的音效,音效功能将在本月上线公测。

新模型发布后,智谱也宣布将CogVideoX v1.5进行开源,相比于原有模型,CogVideoX v1.5包含5/10秒、768P、16帧视频生成能力,I2V模型支持任意尺寸比例,大幅提升图生视频质量及复杂语义理解。 

智谱AI表示,真正的智能一定是多模态的,因此希望智谱多模态大模型家族能进一步提高大模型的应用和工具能力,未来还将与视觉中国等合作,基于更丰富的视觉内容产出更好的AI生成视频工具。(澎湃新闻记者 秦盛)


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1