智谱AI生成视频模型清影（Ying）正式上线，有“点子”就能进行创作

作者：DoNews发布时间：2024-07-27

DoNews7月26日消息，Sora毫无疑问带来AI大模型的全新玩法，大模型可基于任意文字生成视频，这也是这个“大家庭”若干努力（包括Runway的Gen系列、微软的Nuwa、Meta的Emu、谷歌的Phenaki/VideoPoet、CogVideo等）的一个全新高度。

7月26日，这个大家庭迎来一个新伙伴：清影（Ying）。

智谱AI CEO张鹏在智谱 Open Day上宣布，AI生成视频模型清影（Ying）正式上线。即日起，清影上线清言App，面向所有用户开放。

只要有好的创意（几个字到几百个字），再加上一点点耐心（30秒），清影（Ying）就能生成1440x960清晰度的高精度视频。输入一段文字后（俗称Prompt），可以选择自己想要生成的风格，包括卡通3D、黑白、油画、电影感等，配上清影自带的音乐，就生成了充满AI想象力的视频片段。

（链接：https://chatglm.cn/video）

除了文本生成视频，也可以到清影上玩图片生成视频。

图生视频带来了更多的新玩法，包括表情包梗图、广告制作、剧情创作、短视频创作等。同时，基于清影的「老照片动起来」小程序也会同步上线，只需一步上传老照片，AI就能让凝练在旧时光中的照片灵动起来。

清影（Ying）API 也同步上线大模型开放平台bigmodel.cn，企业和开发者通过调用API的方式，体验和使用文生视频以及图生视频的模型能力。

新型DiT模型架构，更高效地压缩视频信息，以及更充分地融合文本和视频内容，让清影在复杂指令遵从能力、内容连贯性、大幅的画面调度上具有一定独到之处。

在生成式视频模型的研发中，Scaling Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的scaling方式。”在智谱 Open Day 上，智谱AI CEO 张鹏表示：“随着算法、数据不断迭代，相信Scaling Law将继续发挥强有力作用。”

“本次清影（Ying）底座的视频生成模型是CogVideoX，它能将文本、时间、空间三个维度融合起来，参考了Sora的算法设计，它也是一个DiT架构，通过优化，CogVideoX 相比前代（CogVideo）推理速度提升了6倍。我们将继续努力迭代，在后续版本中，陆续推出更高分辨率、更长时长的生成视频功能。”

值得注意的是，北京市对智谱AI的研发给予了大力支持，海淀区作为智谱AI总部所在地，提供了全方位的支持。清影(Ying)的训练依托亦庄高性能算力集群，未来将应用于北京亦庄的高精尖产业集群，推动大模型赋能实体经济的新业态发展。合作伙伴bilibi和华策影视也参与了清影的技术研发过程，共同探索未来的应用场景。