“只要你有好的创意(几个字到几百个字),再加上一点点耐心(30秒),清影(Ying)就能生成1440x960清晰度的高精度视频。”
近日,智谱发布“清影”大模型,并面向所有用户开放。输入一段文字后(俗称Prompt),用户即可选择自己想要生成的风格,生成充满AI想象力的视频片段,目前支持生成6秒内的视频。
除了文本生成视频,也可以到清影上玩图片生成视频。图生视频带来了更多的新玩法,包括表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的「老照片动起来」小程序也会同步上线,只需一步上传老照片,AI就能让凝练在旧时光中的照片灵动起来。
清影(Ying)API 也同步上线大模型开放平台,企业和开发者可通过调用API的方式,体验和使用文生视频以及图生视频的模型能力。
发布会上,智谱AI CEO张鹏表示:“本次清影底座的视频生成模型是CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了Sora的算法设计,它也是一个DiT架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了6倍。我们将继续努力迭代,在后续版本中,陆续推出更高分辨率、更长时长的生成视频功能。”
据了解,bilibili也作为合作伙伴也参与了清影的技术研发过程,并致力于探索未来可能的应用场景。合作伙伴华策影视参与了模型共建。此外,智谱清影的算力支持来自于北京亦庄人工智能公共算力平台,聚焦建设全域人工智能之城,北京亦庄围绕“大模型+大数据+大算力”,夯实人工智能产业基础底座,也为智谱AI开展大模型研发提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。