当前位置：首页|资讯|Sora

媲美Sora？快手文生视频模型可灵开放测试最长可生成2分钟视频

作者：站长之家发布时间：2024-06-11

站长之家(ChinaZ.com) 6月7日消息:昨天，快手公司推出了一款名为「可灵」的全新视频生成大模型，该模型采用了与Sora相似的技术路线，并结合了快手自研的多项技术创新。这款模型不仅能够生成长达2分钟、30fps、1080p分辨率的超长视频，支持多种宽高比，还能模拟物理世界的特性，精准建模复杂运动。

亮点:

1、生成能力强大:

支持长达2分钟的30fps高清视频生成，分辨率高达1080p。

支持多种宽高比，包括竖版视频，非常适合快手的短视频生态。

2、运动和物理模拟:

准确刻画复杂、大幅度的运动，如公路上奔跑的老虎、宇航员在月球上行走等。

能够模拟物理特性，如重力、液体流动和光学反射等，生成的画面更符合真实物理规律。

3、应用场景广泛:

从娱乐到教育，可灵的应用场景广泛。

支持文本转视频、多种控制信息输入、以及丰富的内容控制能力。

「可灵」大模型够准确刻画复杂、大幅度的时空运动，如公路上高速奔跑的老虎，画面连贯，动作协调，甚至奔跑过程中躯干的抖动也得到了细致展现。它还能模拟真实物理世界的特性，比如倒牛奶时的重力规律和液面上升，以及光学上的反射规律。此外，「可灵」还能真实反映与真实物理世界的交互，如小男孩吃汉堡时齿印的变化等。

以下是官方发布的视频案例及提示词：

prompt:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

prompt:一名宇航员在月球表面奔跑，低角度镜头展现了月球的广阔背景，动作流畅且显得轻盈

一只戴着眼镜的兔子在看报纸

厨师正在切菜

一只蓝色的鹦鹉

技术特点

1、原生视频生成技术:

采用类似Sora的DiT结构，用Transformer代替传统的卷积网络U-Net。

3D VAE网络用于时空同步压缩，提高重建质量和训练性能。

3D Attention机制用于时空建模，提升复杂时空运动的建模能力。

2、高质量数据支持:

构建了完备的标签体系，对训练数据进行精细化筛选和分布调整。

专用的视频描述模型生成精确、详尽的结构化视频描述，提升模型的文本指令响应能力。

3、高效训练策略:

使用分布式训练集群和优化策略提高运算效率。

分阶段训练策略:初期低分辨率阶段侧重数量，后期高分辨率阶段侧重质量，确保模型在各阶段的优化。

实际应用

1、快影APP:

可灵大模型已在快影APP中开启邀测，当前版本支持生成720P视频，竖版视频生成能力即将开放。

2、其他应用:

“AI舞王”:上传全身照，生成人物跟随音乐跳舞的视频。

“AI唱跳”:生成跳舞并唱歌的视频。

未来还将推出图生视频功能。

快手在大模型技术方面动作迅速，与多个高校或科研机构合作发布了多项关键技术，为「可灵」大模型积累了深厚的技术沉淀。现在，快手的文生视频功能已正式亮相，期待其在短视频场景中的应用落地。

对AI视频创作感兴趣的用户，可以在快影APP中体验「可灵」大模型的功能。

体验方法：快影 APP-AI 玩法-AI 视频生成中申请。

推荐体验

相关资讯

快手“可灵”大模型可生成最长约3分钟视频

6月21日消息，快手“可灵”视频生成大模型今日宣布推出图生视频功能，支持根据不同文本内容，将静态图像转化为生动的5s视频。同时，支持对已生成的视频一键续写和连续多次续写，单次可让视频延续约5秒，最长可生成约3分钟视频。此前，快手表示“可灵”将对标Sora，目前已有约14万人申请测试。

金融界 2024-06-21

快手对标Sora发布视频生成大模型“可灵”，支持生成2分钟视频

快手6月6日宣布，“可灵”视频生成大模型官网正式上线，效果对标OpenAI旗下的视频生成大模型Sora。快手介绍称，可灵大模型为快手AI团队自研，采用与Sora相似的技术路线，结合了多项自研技术创新。该模型支持生成长达2分钟、帧率30fps的视频，分辨率可高达1080p，并支持自由的宽高比。

蓝鲸新闻 2024-06-06

可灵对标Sora 快手加入文生视频战局

可灵对标Sora 快手加入文生视频战局中国经营报2024-06-21 19:31发布于北京中国经营报官方账号本报记者李昆昆李正豪北京报道在OpenAI文生视频大模型Sora发布后，国内企业争

中国经营报 2024-06-21

对标 Sora：快手视频生成大模型“可灵”开放邀测

快手“可灵”视频生成大模型今日正式上线。官方表示，可灵大模型为快手 AI 团队自研，其采用 Sora 相似的技术路线，号称结合多项自研技术创新、效果对标 Sora。

2024-06-06

1分钟教会你，用“中国版Sora”可灵AI生成视频

在快手推出可灵之际，我接受了媒体采访，就中国大模型产业·文生视频发展前景，谈了一些观点和看法，今天分享出来，供大家参考。快手可灵，以及百度一键流影等国产文生视频服务，目前解决的是“有没有的问题”，而不是“从有…

丁道师 2024-07-26

近期资讯

铭凡发布新款主板：AMD R9 7945HX处理器支持8K显示

铭凡公司近日发布了两款全新的主板产品：BD795M和BD790iSE升级款BD795iSE主板。其中，BD795iSE是一款尺寸为170x170mm的ITX主板，搭载AMDR97945HX处理器和集成AMDRadeon610M显卡，并支持8K@60Hz或4K@120Hz双屏显示输出。

中关村在线 2024-12-27

海门南洋取得具有伸缩调节功能的轴式放线架专利，达到自动调整圆轴间距的目的

金融界2024年12月27日消息，国家知识产权局信息显示，海门南洋电工器材有限公司取得一项名为“一种具有伸缩调节功能的轴式放线架”的专利，授权公告号CN222204307U，申请日期为2024年4月。

金融界 2024-12-27

浙江飞燕化纤取得一种高效化纤丝叠丝机专利，操作更加方便快速

金融界2024年12月27日消息，国家知识产权局信息显示，浙江飞燕化纤有限公司取得一项名为“一种高效化纤丝叠丝机”的专利，授权公告号CN222204310U，申请日期为2023年12月。

金融界 2024-12-27

轻松制作PE系统U盘的详细步骤与技巧分享

制作PE系统U盘其实并不复杂，听起来可能有点吓人，但只要按部就班来，你也能轻松搞定。今天我就来给大家分享一下具体的步骤和一些小技巧，让你在制作PE系统U盘的过程中更加顺利。保存设置后退出。

新报观察 2024-12-27

京东京造JZ990 V2三模机械键盘限时优惠 280元入手超值价

京东京造JZ990V2三模机械键盘官方定价399元起，今日下单立减100元，并可领取19元优惠券，实付只需280元即可购买。该键盘采用GasketPro热插拔客制化游戏键盘设计，支持三种连接模式，兼容Windows和Mac操作系统。配备了金属音量旋钮和内置4000mAh长续航电池。

中关村在线 2024-12-27

三星手机录屏功能详解与实用技巧分享

在现代生活中，录屏已经成为了一个非常实用的功能。无论是想要记录游戏的精彩瞬间，还是想要分享一些手机操作的技巧，录屏都能帮你轻松搞定。而对于三星手机用户来说，录屏的操作其实非常简单。接下来，我就来详细讲讲三星手机怎么录屏。首先，打开你的三星手机，确保你的系统是最新版本。三星的录屏功能通常在系统更新后会有所改进，所以保持手机的更新是个好习惯。

新报观察 2024-12-27

有效截取视频的技巧与工具选择指南，助你轻松掌握视频剪辑技能

以VLCMediaPlayer为例，它是一款开源的媒体播放器，不仅可以播放视频，还可以很方便地截取视频片段。

新报观察 2024-12-27

中山爱博机器人有限公司取得电线电缆送料结构专利，实现电线电缆的稳定送料

金融界2024年12月27日消息，国家知识产权局信息显示，中山爱博机器人有限公司取得一项名为“一种电线电缆送料结构”的专利，授权公告号CN222204313U，申请日期为2024年5月。

金融界 2024-12-27

轻松找回QQ密码的方法与账号安全注意事项总结

我们可以开启QQ的安全中心，查看一下自己的安全设置，是否有需要加强的地方。同时，保护好自己的账号安全，才能更好地享受QQ带来的便利。

新报观察 2024-12-27

荣耀Magic7 Pro专业影像套装上架：售价299元

荣耀于12月23日举行的荣耀Magic7Pro保时捷设计手机发布会上，正式推出了其专业影像套装。该套装分为“摄影套装”和“滤镜套装”，并已上架荣耀亲选官网，售价为299元。

中关村在线 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1