当前位置：首页|资讯|Sora

媲美Sora？快手文生视频模型可灵开放测试最长可生成2分钟视频

作者：站长之家发布时间：2024-06-11

站长之家(ChinaZ.com) 6月7日消息:昨天，快手公司推出了一款名为「可灵」的全新视频生成大模型，该模型采用了与Sora相似的技术路线，并结合了快手自研的多项技术创新。这款模型不仅能够生成长达2分钟、30fps、1080p分辨率的超长视频，支持多种宽高比，还能模拟物理世界的特性，精准建模复杂运动。

亮点:

1、生成能力强大:

支持长达2分钟的30fps高清视频生成，分辨率高达1080p。

支持多种宽高比，包括竖版视频，非常适合快手的短视频生态。

2、运动和物理模拟:

准确刻画复杂、大幅度的运动，如公路上奔跑的老虎、宇航员在月球上行走等。

能够模拟物理特性，如重力、液体流动和光学反射等，生成的画面更符合真实物理规律。

3、应用场景广泛:

从娱乐到教育，可灵的应用场景广泛。

支持文本转视频、多种控制信息输入、以及丰富的内容控制能力。

「可灵」大模型够准确刻画复杂、大幅度的时空运动，如公路上高速奔跑的老虎，画面连贯，动作协调，甚至奔跑过程中躯干的抖动也得到了细致展现。它还能模拟真实物理世界的特性，比如倒牛奶时的重力规律和液面上升，以及光学上的反射规律。此外，「可灵」还能真实反映与真实物理世界的交互，如小男孩吃汉堡时齿印的变化等。

以下是官方发布的视频案例及提示词：

prompt:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

prompt:一名宇航员在月球表面奔跑，低角度镜头展现了月球的广阔背景，动作流畅且显得轻盈

一只戴着眼镜的兔子在看报纸

厨师正在切菜

一只蓝色的鹦鹉

技术特点

1、原生视频生成技术:

采用类似Sora的DiT结构，用Transformer代替传统的卷积网络U-Net。

3D VAE网络用于时空同步压缩，提高重建质量和训练性能。

3D Attention机制用于时空建模，提升复杂时空运动的建模能力。

2、高质量数据支持:

构建了完备的标签体系，对训练数据进行精细化筛选和分布调整。

专用的视频描述模型生成精确、详尽的结构化视频描述，提升模型的文本指令响应能力。

3、高效训练策略:

使用分布式训练集群和优化策略提高运算效率。

分阶段训练策略:初期低分辨率阶段侧重数量，后期高分辨率阶段侧重质量，确保模型在各阶段的优化。

实际应用

1、快影APP:

可灵大模型已在快影APP中开启邀测，当前版本支持生成720P视频，竖版视频生成能力即将开放。

2、其他应用:

“AI舞王”:上传全身照，生成人物跟随音乐跳舞的视频。

“AI唱跳”:生成跳舞并唱歌的视频。

未来还将推出图生视频功能。

快手在大模型技术方面动作迅速，与多个高校或科研机构合作发布了多项关键技术，为「可灵」大模型积累了深厚的技术沉淀。现在，快手的文生视频功能已正式亮相，期待其在短视频场景中的应用落地。

对AI视频创作感兴趣的用户，可以在快影APP中体验「可灵」大模型的功能。

体验方法：快影 APP-AI 玩法-AI 视频生成中申请。

推荐体验

相关资讯

快手“可灵”大模型可生成最长约3分钟视频

6月21日消息，快手“可灵”视频生成大模型今日宣布推出图生视频功能，支持根据不同文本内容，将静态图像转化为生动的5s视频。同时，支持对已生成的视频一键续写和连续多次续写，单次可让视频延续约5秒，最长可生成约3分钟视频。此前，快手表示“可灵”将对标Sora，目前已有约14万人申请测试。

金融界 2024-06-21

快手对标Sora发布视频生成大模型“可灵”，支持生成2分钟视频

快手6月6日宣布，“可灵”视频生成大模型官网正式上线，效果对标OpenAI旗下的视频生成大模型Sora。快手介绍称，可灵大模型为快手AI团队自研，采用与Sora相似的技术路线，结合了多项自研技术创新。该模型支持生成长达2分钟、帧率30fps的视频，分辨率可高达1080p，并支持自由的宽高比。

蓝鲸新闻 2024-06-06

可灵对标Sora 快手加入文生视频战局

可灵对标Sora 快手加入文生视频战局中国经营报2024-06-21 19:31发布于北京中国经营报官方账号本报记者李昆昆李正豪北京报道在OpenAI文生视频大模型Sora发布后，国内企业争

中国经营报 2024-06-21

对标 Sora：快手视频生成大模型“可灵”开放邀测

快手“可灵”视频生成大模型今日正式上线。官方表示，可灵大模型为快手 AI 团队自研，其采用 Sora 相似的技术路线，号称结合多项自研技术创新、效果对标 Sora。

2024-06-06

1分钟教会你，用“中国版Sora”可灵AI生成视频

在快手推出可灵之际，我接受了媒体采访，就中国大模型产业·文生视频发展前景，谈了一些观点和看法，今天分享出来，供大家参考。快手可灵，以及百度一键流影等国产文生视频服务，目前解决的是“有没有的问题”，而不是“从有…

丁道师 2024-07-26

近期资讯

畅想未来和AI工作的方式

人人都是产品经理 2024-12-26

OPPO明年上半年将推三种尺寸旗舰机，Find X8 Ultra有望最早登场

IT之家 2024-12-26

英国拟试用全球首个AI工具评估糖尿病风险：提前10年识别潜在患者

IT之家 2024-12-26

三星获美补贴“缩水”背后：取消先进封装产能规划，重点关注 2nm

IT之家 2024-12-26

曝V社规模小但盈利能力惊人：员工平均年收入远超Facebook和苹果

IT之家 2024-12-26

抖音2024年度趋势盘点：政策调整与业务升级助力商家成长

人人都是产品经理 2024-12-26

如何设计OTWB中的TMS系统—全流程核心功能解析

人人都是产品经理 2024-12-26

从《寂静岭》到《时间旅者：重生曙光》，恐怖游戏是怎样“吓人”的？

看不见的东西，往往比直接摆在面前的更吓人。

触乐 2024-12-26

工作生活没得怕的！HUAWEI MatePad Pro 13.2 英寸柔光版发售

IT之家 2024-12-26

瑞萨量产机器人用半导体 RZ / T2H，可同时控制 9 轴电机

IT之家 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1