在OpenAI文生视频大模型Sora发布后,国内企业争相入局,国产文生视频大模型迈入加速阶段。日前,快手“可灵”视频生成大模型官网正式上线,官网放出数段展示视频,并称已开放邀测体验。
以下是可灵官网展示的一段“一只手将牛奶从钢制打奶壶倒入桌上一杯咖啡中,背景为模糊的厨房”的视频片段。
动图截取有压缩,画质逊于展示视频,效果以官网为准,下同
官网展示的一段小男孩吃汉堡的生成视频,可以看到视频细节较全面,包括汉堡咬下去的齿印、小男孩面部肌肉的运动、粘在嘴边的残渣等。
提示词:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡
除了吃汉堡,还有吃面的。
提示词:一个中国男人坐在桌前,用筷子吃面条
一段非专业人士难以区分是生成还是实拍的延时摄影。
官网展示了真实世界物理交互的视频外,也展示了一些“想象力场景”,如一只戴着眼镜,喝咖啡看报纸的兔子。
据介绍,可灵大模型为快手AI团队自研,采用类Sora的技术路线并结合多项自研创新技术。具备的能力包括:
能够生成大幅度的合理运动;
能够模拟物理世界特性;
具备强大的概念组合能力和想象力;
生成的视频分辨率高达1080p,时长高达2分钟(帧率30fps),且支持自由的宽高比。
目前官网显示,快影App的AI创作功能中已正式开放文生视频功能的邀测,支持创作者申请并体验可灵大模型最新的文生视频功能。图生视频功能也将于近期开放。
随着AI大模型时代来临,快手也动作频频。快手已先后发布通用大语言模型“快意”、文生图大模型产品“可图”,还推出了Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等视频关键技术。据悉,伴随此次可灵大模型的发布,快手将持续加速大模型的研发与应用。