海内外爆火的“中国版Sora”惊艳全场，真这么好用？| AI评测

作者：新榜发布时间：2024-07-05

谁能想到，现在外网最抢手的AI视频生成模型，不是Sora，也不是Runway或Pika，而是国产大模型“Kling（可灵）”。

可灵视频合集在X平台上获得数百万浏览量

由于生成视频效果惊艳，可灵在国外获得了“中国版Sora”“Sora杀手”等称号。

除了拿可灵与Sora进行比较，不少国外网友为了用上可灵，不仅以发中文、制作表情包等形式花式求号，而且由于不认识中文，获得了测试权限的AI艺术家、X博主“Dustin Hollywood”表示自己是通过辨识图标来学习操作可灵，并直呼“玩到手机发烫”。

苦等Sora许久的国外网友，还寄希望于可灵的爆火能够倒逼OpenAI开放Sora访问权限。

这款被国外网友予以重任的“中国版Sora”——可灵大模型，由快手AI团队自研，是首个Sora级面向用户开放的文生视频大模型。

据可灵官网显示，该模型不仅采用了类Sora的技术路线，还融入了多项自研技术，能够生成长达2分钟、30fps的1080p高分辨率视频，并且支持多种宽高比。

同时，与Sora一样，能够模拟真实物理世界，生成具有大幅度合理运动的视频。

官网地址：http://kling.kuaishou.com/

目前，可灵已登陆快手旗下视频剪辑工具快影App，开放邀请测试。只需下载应用，在主页找到“AI创作”点击进入，找到“AI生视频”即可申请内测。

可灵爆火出圈，有消息称已经火到排队内测人数已超5万。我们拿到测试资格后，第一时间对可灵和Sora进行了一番对比测试。

实测过程中，我们发现可灵在多种类型视频生成上相比Sora展现出显著优势。此外，测试过程中也遇到了一些问题，并通过独家渠道得到了部分问题的解答。

对标Sora，可灵有多能打？

尽管Sora目前尚未开放测试，但官方已经发布了一些测试案例，并为它们提供了相应的提示词。

基于这些信息，我们对可灵和Sora生成的视频进行了对比分析。

动物类镜头

提示词：一只猴子在公园里下棋。

可灵：

Sora：

在没有提示词要求的情况下，可灵和Sora都倾向于生成写实风格的视频。不同的是，可灵在生成视频时并未遵循文字提示中的具体动作——“下棋”，而是展现了猴子拿着一张纸的场景。

与Sora相比，可灵这轮生成的视频出现了肉眼可见的技术瑕疵。例如，视频中当猴子转头时，眼部出现了重影。

不过，令人惊喜的是，我们将Sora一个翻车视频的提示词投喂给可灵后，最终生成的视频在手机上的观看效果相当不错

提示词：一只中等体型、看上去很友善的狗狗走过工业停车场。环境多雾、多云。采用35mm胶片拍摄，色彩鲜艳。

可灵：

AI视频生成会在物理方面遇到困难，尤其是运动主体移动时的腿部动作容易“露怯”。

早前Sora生成的视频是侧面视角，所以观众可以明显地察觉到狗狗在行走时腿部的不自然交叉。而可灵生成的镜头，通过让画面主体从景深处走向镜头的方式，巧妙地避免了这一问题。

人物类镜头

提示词：一位时尚的女性走在东京的街道上，街道两旁是温暖的霓虹灯和生动的城市招牌。她穿着一件黑色皮夹克，一条长红裙，黑色靴子，并携带着一个黑色手提包。她戴着太阳镜，涂着红唇膏。她自信而随意地走着。街道是潮湿且反光的，形成了彩色灯光的镜面效果。许多行人在周围走动。

可灵：

Sora：

这条视频是Sora当时颇为出圈的一条视频。根据相同的提示词，可灵生成的女性形象基本符合要求，但明显的问题在于人物面部在动态效果中的处理有所欠缺。

超现实镜头

提示词：由树叶构成的大象在丛林中奔跑。

可灵：

Sora：

可灵这轮没有遵循提示词要求生成一只由树叶构成的大象，导致画面缺少了Sora视频中那种超现实与写实相结合的效果。与其他创作者的反馈类似，可灵在想象力方面的表现比较“中规中矩”。

风景类镜头

提示词：摄像机缓缓下降并扩大视野，展现出一幅宏伟的全景视角，俯瞰着美丽的海洋和沿海历史建筑……

可灵：

Sora：

风景类镜头上，可灵和Sora在整体表现上各有千秋，没有明显的差异。我们让GPT-4o根据静态图像，对两个视频的构图、色彩进行了专业点评：

可灵在色彩饱和度和构图上表现优异，但真实感稍有欠缺；而Sora在层次感和色调上更胜一筹，但光影效果和背景处理上有待提升。

实测下来，可灵仍然存在AI视频模型的通病，在人物行走、人物面部表情的处理上显得不够自然，以及在场景的真实感和动态连贯性方面还有提升空间。

虽然生成的视频在手机端的小屏幕观看时表现尚可，但在大屏幕（如电脑端）上观看时，人物面部表情扭曲，动作僵硬等问题会更加明显，多少还是有些“诡异”感。

但整体而言，不知道屏幕前的玩家是否有相同感受，可灵生成的视频更有“中国味儿”，且在写实风格上对真实世界还原度很高。

尤其在涉及国风元素、亚洲面孔以及现实生活场景的镜头表现上，相比海外模型，可灵能够更准确地生成富有中国文化特色的镜头。

下面这些镜头都由可灵生成，自带浓浓的“老铁味儿”，这下谁能分得清快手和可灵啊。

提示词：端午节日气氛的街道

提示词：端午节日气氛，赛龙舟

提示词：热闹氛围的春节场景，一家人吃团圆饭

需要说明的是，本文测试环节所展示的可灵镜头均为直出，并没有多次“抽卡”。而Sora的测试镜头则来源于官方发布的内容。因此，这两者之间的对比仅供读者参考，以提供一个直观的比较视角。

在测试过程中，我们和其他创作者一样也遇到一些问题。例如，据称可灵能够生成长达2分钟的1080p高清视频。经实测目前开放版本仅支持720P、5秒视频生成。

我们从快手官方获悉，目前一键生成2分钟时长的视频功能尚未对用户开放，会尽快推出。

由于可灵搭载在快影App上，整合了一系列视频创作功能。用户生成的视频可以通过点击界面右上角的“去剪辑”按钮，进行下一步视频处理，如提升分辨率、改变画幅比例等，对整个视频创作工作流来说相当丝滑。

此外，用户还可以一键将处理好的视频发布到快手平台，从创作到分享，“自产自销”形成完整闭环。

国产视频大模型加速追赶，

快手带动新一轮AI视频创作潮

Sora爆火后，国产类Sora视频大模型纷纷涌现，引发行业热烈讨论和高度关注。

从学界到业界，从大厂到初创公司，国内众多科技公司和研究机构纷纷加入到新一轮视频生成技术竞赛中，一时间谁是“中国版Sora”的竞争变得尤为激烈。

如清华大学联合生数科技发布的“Vidu”，号称是中国首个长时长、高一致性、高动态性视频大模型。近期官宣迎来新一轮技术迭代，支持一键生成32秒视频和音视频合成。

同一时期，世界模型公司“极佳科技”联合清华大学自动化系发布模型原生16秒时长、端侧可用的Sora级视频生成大模型“视界一粟 YiSu”。

快手可灵正是在这背景下推出并在海内外爆火的。

与其他模型相比，快手可灵不是预发布、也不是官方演示合集，而是直接面向公众开放测试的产品级应用。发布即上线吸引了不少创作者、AI爱好者关注试玩，由此引发的二次传播，为其海内外爆火贡献了重要力量。

可灵AI

复刻Sora短片《气球人》，来自可灵首批创作者@温维斯Wenvis

可灵AI

当动物音乐团演奏周杰伦，来自可灵首批创作者@炼丹师忠忠

可以说，可灵的出现甚至促进了海外对AI视频生成的新一轮讨论和创作热情。

为了找可灵代餐，X上不少AI圈博主收到消息称，海外即将上线一款比可灵更好的AI视频模型。

目前，该模型已经官宣，是Luma推出AI视频生成模型Dream Machine。（接下来我们将第一时间进行实测，敬请关注。）

AI视频方面，快手入局并不算早。

抖音的AI视频产品“即梦”已于2个月前正式推出。

两家公司同处短视频赛道，旗下AI视频产品如何与平台内容生态有效联动，将成为行业未来长期关注的焦点。

AI视频生成技术的发展和应用也面临多重挑战。

技术层面上，提升视频生成质量和效率、确保内容连贯性和一致性是亟待解决的关键问题。

同时，高算力需求和昂贵的推理成本也是限制其商业化的主要障碍。

在这样的背景下，AI视频模型的落地应用已经不仅仅是技术层面的较量。无论是大厂还是初创公司，都是对其内容生态构建、商业模式创新和成本控制能力的全方位考验。

近期资讯

2024年十款功能强大的图纸防泄密软件推荐：图纸加密、防泄密保护

在制造业、建筑业、工程设计等行业，图纸作为核心商业机密，其安全性直接关系到企业的竞争力。如何防止图纸泄密成为各大企业关注的重点。本篇文章将推荐十款功能强大的图纸防泄密软件，帮助您为图纸安全筑起坚不可摧的防护墙。 [图片] 1. Ping32：国产图纸防泄密先锋 Ping32 是国内领先的信息安全软件，不仅适用于文档加密，还专为图纸防泄密提供了多种功能。Ping32 能够与主流图纸设计软件（如AutoCAD、SolidWorks）无缝集成，通过实时加密、权限管理和操作追踪，全面保障图纸安全。特点与优势：

安在软件 2024-12-26

监控易 2024-12-26

案例丨衡阳科技馆正式上线，蛙色3DVR提供技术支持！

12月17日，衡阳市数字科技馆正式上线啦！科技发展日新月异，在大数据时代的融媒体环境下，衡阳市科协不断创新科普传播方式方法，接长科普手臂，拓宽科普平台，推出湖南首个地市级数字科技馆。这一举措标志着衡阳市科普工作数字化跨出了具有里程碑意义的关键一步。衡阳市数字科技馆深度整合多元线上资源，以科技为先导，以创新为驱动，不仅精心打造了功能完备的网页平台，更创新性推出3D元宇宙数字展馆。同时，将我馆的公众号、服务号以及在抖音、快手等热门短视频平台的官方账号全面囊括，编织成一张全方位、多层次的数字科普网络矩阵。

蛙哥全景看世界 2024-12-26

ai写标书的软件：让标书生成更高效省心

[图片] 在现代商务竞争中，标书的撰写是一项不可或缺却又耗时耗力的工作。企业为了提升中标率，往往需要精心准备标书，但过程中的文字撰写、内容校对、排版设计等细节让人头疼不已。随着人工智能技术的飞速发展，AI写标书工具成为了解决这一难题的有效方案。什么是AI写标书工具？ AI写标书工具是一种结合自然语言处理和深度学习技术的高效软件，能够帮助用户快速生成专业、高质量的标书内容。这些工具通常具备以下功能：自动生成内容：根据用户输入的关键词或大纲快速生成符合行业需求的标书内容。敏感词检测：实时检查标书中的敏

是土豆王子啦 2024-12-26

【计算机毕业设计选题推荐】基于web的快递物流信息查询系统的设计与实现

计算机毕设编程指导师计算机毕设编程指导师个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。大家都可点赞、收藏、关注、有问题都可留言评论交流实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！获取源码主页-->：计算机毕设编程指导师基于web的快递物流信息查询系统-研究背景一、课题背景随着互联网技术的不断发展和电子商务的普及，快递物流行业迎来了爆炸式的增长。在这个背景下，快递物流信息查询系统的需求日益迫切。用户亟需一个方便快捷的

计算机毕设编程指导师 2024-12-26

对3D心理沙盘软件内部算法感兴趣，还是要防备一下

李守龙心理沙盘日记296--对3D心理沙盘软件内部算法感兴趣，还是要防备一下经销商刘总问，3D心理沙盘软件的五大情绪法和意象分析法是什么呢？刘总对3D心理沙盘软件感兴趣，但从咨询情况看，刘总不会马上采购，他不过是来了解一下。刘总提出的这个问题，通常情况下，我们是不回复的，主要是有3个原因： 1、你没有明确的采购目标的，发个产品资料和报价，看看就好了。不少中间商的采购人员，是既不懂电子技术，也不懂心理学的。不过，这也没关系，最怕的是，连客户的具体需求都不明确，过来就开口问：多少钱，或报个价。这样的小

李守龙心理沙盘 2024-12-26

手机数据恢复秘籍：3 大绝招拯救你的数据

想象一下，你的安卓手机瞬间变成了一块 “白板”，所有珍贵的回忆和重要信息都消失得无影无踪，是不是感觉心都要碎了？别慌，今天就来教你如何让手机数据起死回生！方法一：云备份 —— 云端的救星手机云备份简直是数据的 “守护天使”。它能自动将你的重要数据上传到云端，一旦手机数据 “离家出走”，就能从云端把它们找回来。前提是你之前已经开启了这个功能哦。操作步骤如下：用备份时的账号密码登录手机云空间，找到管理云存储数据的入口。直接恢复重要数据，或者去云空间回收站里找找看，也许你要的数据正在那里 “睡大觉” 呢

bili_48169286213 2024-12-26

海内外爆火的“中国版Sora”惊艳全场，真这么好用？| AI评测

推荐体验

相关资讯

AI将迎新浪潮！海内外多厂商布局火出圈的ChatGPT为何屡遭禁用？

海内外巨头布局AIGC，美图公司大涨17％

中信建投：生成式AI海内外公司布局梳理

国信证券：豆包AI耳机发布海内外AI视频应用进展迅速

智谋纪市场前沿 | 照明界ChatGPT再度征服海内外

近期资讯

2024年十款功能强大的图纸防泄密软件推荐：图纸加密、防泄密保护

岳冉RFID技术医疗设备与物资管理应用方案

【java毕设 python毕设大数据毕设】基于java的健身房管理系统的设计与实现

内蒙某市财政局：监控易产品引领IT基础监控质的飞跃

案例丨衡阳科技馆正式上线，蛙色3DVR提供技术支持！

ai写标书的软件：让标书生成更高效省心

【计算机毕业设计选题推荐】基于web的快递物流信息查询系统的设计与实现

对3D心理沙盘软件内部算法感兴趣，还是要防备一下

手机数据恢复秘籍：3 大绝招拯救你的数据

SQL SERVER日常运维巡检系列之-实例级参数

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响