“中国版Sora”来了！仅需一张全身照，就可以原地“唱跳”，分辨率高达1080p！来看效果

每日经济新闻

2024-06-08 13:12发布于四川每日经济新闻官方账号

每经编辑：段炼,杜宇

据新华社，近日，快手“可灵”视频生成大模型官网正式上线。相较此前各家放出的视频大模型以展示视频为主，本次亮相的可灵大模型已在快手旗下的快影App开放邀测体验。

据官网介绍，快手在短视频技术方面有多年的深入积累，其视频生成大模型也有天然、广泛的应用场景。可灵大模型为快手AI团队自研，具备诸多优势：能够生成大幅度的合理运动；能够模拟物理世界特性；具备强大的概念组合能力和想象力；生成的视频分辨率高达1080p，时长高达2分钟（帧率30fps），且支持自由的宽高比。

“可灵”大模型为快手AI团队自研，基于快手在视频技术方面的多年积累，采用“Sora”相似的技术路线，结合多项自研技术创新，效果对标“Sora”。

据悉，可灵使用了与Sora一样的Diffusion Transformer架构，3D时空联合注意力机制等，该架构巧妙地融合了时间与空间的信息，对视频数据进行综合分析和处理。

可精准捕捉到视频帧内的局部空间特征以及跨帧的时间动态特征，从而更全面地理解和再现视频中的运动信息。

所以，无论是快速移动的物体、剧烈变化的场景，还是复杂的人物动作都能被精确捕捉，使得生成的视频内容动态性十足，同时具有很高的物理世界真实感。

让我们一睹官方效果，动图截取有压缩，画质逊于展示视频，效果以官网为准。

提示词：两朵花在黑色背景下缓慢绽放，展示出细腻的花瓣和花蕊

提示词：一只手将牛奶从钢制打奶壶倒入桌上一杯咖啡中，背景为模糊的厨房

基于对文本-视频语义的深刻理解和 Diffusion Transformer 架构的强大能力，可灵能够将用户丰富的想象力转化为具体的画面，虚构真实世界中不会出现的场景。

提示词：一只戴眼镜的小白兔坐在咖啡馆的椅子上看报纸，桌上有一杯热咖啡

基于自研的3D人脸和人体重建技术，结合背景稳定性和重定向模块，实现表情肢体全驱动技术，仅需一张全身照片，即可体验生动的“唱跳”玩法。

公开资料显示，快手已先后发布通用大语言模型“快意”、文生图大模型产品“可图”，还推出了Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等视频关键技术，引发了广泛关注。据悉，伴随此次可灵大模型的发布，快手将持续加速大模型的研发与应用，带来更加多元的AI创作与互动体验。

编辑|段炼杜宇杜恒峰

校对|何小桃

每日经济新闻综合自新华社、公开资料等

每日经济新闻

“中国版Sora”来了！仅需一张全身照，就可以原地“唱跳”，分辨率高达1080p！来看效果

“中国版Sora”来了！仅需一张全身照，就可以原地“唱跳”，分辨率高达1080p！来看效果

推荐体验

相关资讯

“中国版Sora”来了！可生成2分钟1080P视频，来看效果……

中国版 Sora 来了！一键生成 16 秒 1080P 视频，清华系团队能对标 OpenAI 吗？

中国首个Sora级模型 Vidu 发布：生成最长16秒、最高 1080P 视频

不能用 Sora ？那就用 Morph Studio，免费文生视频 1080P

Sora劲敌！谷歌视频生成模型发布：支持1080P视频

近期资讯

年前屯一波！洽洽瓜子官旗8.66元/斤大促：四种口味随便选

一博主长期侵犯华为权益被判公开致歉：拒不执行被法院公示

价格屠夫！小米米家面板灯众筹：89元起自带人在传感器

快科技2024年度评奖：内存篇

10万块就能买到的混动SUV卖爆！五菱星光S累计销量破3万台

特斯拉CyberCab再现颠覆式设计！游戏手柄替代方向盘

奇瑞iCAR总经理：开V23别人都得仰视我、看他人像小乌龟壳

博主曝有人招募水军恶意刷蔚来差评：一条评论5毛钱

解禁摩令吗！国标限速25km/h 电动自行车要取代燃油摩托车

影视飓风2024年度相机颁奖：iPhone 16 Pro Max获最佳手机

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响