作者 | 刘宝丹
编辑 | 黄昱
AI大模型的能力已经从语言卷向多模态。继快手和爱诗科技发布视频生成工具后,智谱AI也亮出了自己的大招。
7月26日,智谱AI CEO张鹏在智公司Open Day上宣布,AI生成视频产品清影(Ying)正式上线,只需30秒就可以生成6秒视频,而且是1440x960清晰度的高精度视频。
目前,清影已经在清言App、PC和小程序端同步上线,所有C端用户都能通过清影免费体验到AI文生视频、图生视频能力。同时,清影API也同步上线大模型开放平台bigmodel.cn供企业和开发者调用。
对智谱AI来说,清影的推出无异于在C端市场又增添了一枚重要棋子,这也是智谱AI成立五年来对多模态能力的一次检验。
智谱AI成立于2019年,由清华大学知识工程实验室(KEG)技术成果转化而来,是国内最早研发大模型的企业之一。公司的愿景是实现通用人工智能(AGI),而多模态是必经之路。
会上,张鹏表示,“为什么要做多模态这件事,视频生成并不是孤立来看,是放到整个技术和产品发展路线当中来看,我们认为它是AGI必须走的路径。”
公司很早就确定要做TO B业务,对于C端战略,张鹏年初表示,TO C也会去做,但目的比较明确,把闭环做起来,给未来也留下一个可能性。他判断,TO C应用可能未来也是一个要爆发的点。
显然,清影就是这一战略思维下的产品。
在C端层面,智谱AI已经打造了清言APP,这是一个人工智能助手,帮用户解决工作学习生活当中的实际问题,做生产力提效。根据公司定位,清影不会单独成为一个独立产品去商业化落地,它是智谱清言产品打造的视频创作智能体。
具体来看,用户输入一段文字后(Prompt),可以选择自己想要生成的风格,包括卡通3D、黑白、油画、电影感等,配上清影自带的音乐,就可以生成充满AI想象力的视频片段。
除了文本生成视频,清影还可以实现图片生成视频,即输入一张图片+相应的提示词,清影大模型将根据提示将图片转变为视频画面。
清影在图生视频带来了更多的新玩法,包括表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的“老照片动起来”小程序也会同步上线,只需一步上传老照片,AI就能让凝练在旧时光中的照片灵动起来。
随着清影的上线,国内AIGC赛道将迎来更加激烈的竞争,尤其是在具备多模态能力的C端产品领域。
7月6日,快手宣布,基于自研的视觉生成大模型产品可灵AI网页端正式上线,普通用户可以登录网站进行功能试用,创作者单次生成的文生视频时长增加至10s;7月24日,爱诗科技发布视频生成产品PixVerse V2,可实现单片段8秒。
MiniMax也公开表示,视频可能下个月会出来,在星野和海螺AI里面也可能会有应用场景。华尔街见闻获悉,月之暗面内部也在做多模态,并且可能很快就会对外公布进展。
清影上线是一个重要信号,在AI大模型的全球技术迭代中,智谱AI已经亮出了手里的多模态武器。接下来,清影将接受残酷的市场考验,它和清言APP也将朝着杀手级应用更进一步。