上手试了快手的视频AI，我发现它竟然有点领先。。。

作者：差评发布时间：2024-06-20

Sora

Sora 再不向大伙儿开放，就真要被同行们给“碾压”了。。。

先是前几天，快手新搞出来个文生视频的模型可灵AI，悄摸儿的在外网火了。

一出来，网友们就直接把它和Sora放在一个擂台上，让人意外的是，可灵AI竟然一点都不输，有的时候效果比Sora还要好一点。

就比如“蚂蚁在巢穴中爬行”这样的提示词，可灵生成视频的质感跟Sora差不太多，而且它还营造出了太阳光照进洞穴时的光影。

还有同样是“拉力赛车”的画面，可灵的理解比 Sora 更贴合原意一点。咱们能很明显看到， Sora 画面里的车在原地打圈，而可灵生成的赛车是真的有在赛道上飙。

它也能像 Sora 一样生成两分钟所有的视频，像这个“小男孩在花园里骑自行车经历秋冬春夏四季变换”的视频，画面稳定性、光影变化啥的，跟 Sora 那段经典视频有得一拼。

相较于Sora，可灵AI还会更适合咱们中国宝宝体质一些，像大熊猫这类的中国元素，它也能迅速 get 到。

甚至已经有老外为了玩上快手的AI，“求”着让国内网友帮他生成一些视频。。。

而就在世超琢磨可灵AI的时候，网上又突然蹦出来一个新的视频模型Luma AI，同样能生成长达两分钟的高清视频。而且官网示例的效果，也是直逼 Sora 。

像是它生成人在潜水时的瞬间，脸部周围气泡变化跟真的一样，在整个大幅度运动过程中，脸部也没出现啥畸变。

还有房间爆炸时，镜头推进的画面，整得人都有种看好莱坞大片的错觉了。

看到这儿，不知道差友们什么感受，反正世超已经有点儿坐不住了，立马托朋友从快手那要来了个内测资格，也顺便登上了Luma的试用界面，准备亲自上手试试这两个AI，看看它们到底有没有传说中的这么厉害。

据它们俩的宣传，可灵 AI 和 Luma 算是都有各自擅长的领域。可灵这块儿，网友们都说它生成吃播视频是一绝，而Luma官网上宣传的则是“电影感”，还能通过图片+提示词生成视频。

那咱也不废话了，直接在它俩各自的地盘上开测。

首先咱们来到的比试地点，是快手比较擅长的“吃播”，让它们同时生成一段“一个男人在吃意大利面”的视频。

有一说一，可灵AI除了嗦面的时候有点不稳定，其他画面说是从快手的吃播视频里截取的，估计都有忽悠到不少人。

到了 Luma 这儿，画风就突然变得诡异了，男嘉宾就跟有超能力一样，啥餐具都不用就开吃了，而且嘴巴动得也非常不自然。

既然生成吃播的视频 Luma 不太行，那接下来咱就试试它比较擅长的“电影感”。

本以为Luma要大施拳脚了，没想到它一上来就拉了坨大的。

让它生成一段“外星人大战机器人”的画面，还是那个老毛病，同一个人物，一会儿变成机器人，一会儿变成怪兽，全程都没看到打斗的痕迹。

同样的提示词喂给可灵，它倒是把战斗的场面给整出来了，就是有点经不起细看，手里拿的刀都是软的。。。

好在之后的表现还行，让它们同时生成“顶级富豪在别墅开派对”的视频，都挺有模有样，唯一的缺点就是面部表情都不太稳定。

各自擅长的领域比完了，那紧接着来第二回合，考验下这俩AI对物理世界的理解程度。

让它们生成一段“猫咪和正在睡觉的主人互动”的视频，先是 Luma 这边，它一上来就直接摆烂，只生成了一段黑色猫咪的视频，连人的影子都没看到。。。

要不说全靠同行衬托，对比之下可灵 AI 的效果就强多了。有猫，有睡觉的人，硬要扣缺点的话，就是没怎么看到猫和主人之间的互动。

后面世超又试了好一些，发现在一些简短的提示词跟前，快手可灵的表现都还不错，比如玩偶熊在瀑布前弹吉他，小样骑自行车等等。

Luma这边就跟使唤久了，想罢工一样，各种Bug都出来了，小熊弹个吉他都能弹出幻影来。

还把羊自个儿变成了自行车。。。

更抽象的是，因为 Luma 有图片输入，在试的时候总能整出来不少乐子。比如让它给猪猪侠的表情包整个后续，搞到一半就给整成惊悚片了。。

还有经典的“外国老头 nice ”梗图，他喝可乐是这样子的，多少有的鬼畜。

甚至还有网友给各种梗图，都脑补上了后续。

总之，整体体验下来，世超觉得，要论效果，快手可灵 AI 的效果还是会更稳定、更好一点。最起码和其他能用到的视频 AI 比，它已经是相当不错了。

而把模型训练成这样，快手是摸着 Sora 这块石头过河，也到用了 DiT 架构。把 transformer 融合进扩散模型里，这样一来，通过堆参数、堆训练数据等等就能提升模型性能，而在视频数据这块儿，快手自然是不缺的。

不过现在除了效果外，视频AI还有另外一个不得不重视的问题，商业化。

不知道大伙们有没有注意到，虽说 Sora 之后，类似的 AI 是一个接一个，连字节、阿里这样的大厂们，都抢着上这个赛道。

但大部分厂商在宣布自己也有这种模型后，几乎就很少有进一步的动作了。

像是 Sora ，已经好几个月没更新过他们的案例库，其他有向大伙们开放的视频 AI ，也只更新到 5s 的视频长度就没再继续了。。。

而搞成这样子，说白了还是做视频 AI 太花钱，又找不到啥赚钱的路子。

像是学图片AI一样收会员费，根本就cover不掉它的成本，据调查机构Factorial Funds称，以Sora为例，它30亿参数（主流猜测）的训练成本，比1.8万亿参数的 GPT-4 还要多。

这还只是训练，实际用时的推理成本更多，国内有AI企业做过一个折算，差不多两分钟的视频要花掉180块钱，看这数据，也难怪 AI 厂商们都不敢公开进度。。。

但话说回来，世超还是挺看好快手做这种 AI 的，毕竟它本身就有个视频平台在。说不定之后可灵也能像因为黏土滤镜爆火的 Remini 一样，靠“发帖助手”的定位摸索出一个赚钱的路子来。

这不，世超立马就想到了一个点子，不如学一学这次的Luma，玩玩抽象，指不定流量就来了。（狗头)

撰文：松鼠

编辑：面线

美编：萱萱

图片、资料来源：

快手可灵 AI、Luma AI、X@WojtekKardys

虎嗅，抖音快手战火烧到AI

上手试了快手的视频AI，我发现它竟然有点领先。。。

推荐体验

相关资讯

上手ChatGPT威力加强版后，我发现它很强，但也有点拉。。。

图书馆小姐姐，竟然有点可爱，心动了可咋办？AI绘画

竟然有ChatGPT搞不定的？！？

GPT-4来了：它竟然有了幽默感

我让chatGPT分析现在的广州楼市，它竟然说……

近期资讯

江苏博和精密取得多功能冲压治具专利，实现自动冲压同时自动上下料

科瑞森取得用于滚弧机的板材保护支撑板专利，可有效保护板材且提高安全性

江苏恒捷电气取得一种电力铁附件定型装置专利，使装置能够适用于不同规格的单槽夹板

博莱诺（昆山）新能源科技有限公司取得料带送件机构专利，更加方便地调节支座对料带进行限位

东莞市铭伟电子科技取得用于气动接头的冲孔设备专利，提高了生产的效率

安徽省全佳智能科技取得一种铝单板折弯设备专利，提高铝单板加工移动时的稳定性

青岛三诚众合取得模压桥架单张板带料设备专利，解决相关技术中冲压产品图案或花纹易变形问题

青岛宥锝台机设备取得一种柔性折弯机的上料定位装置专利，保证加工质量

山东恒远利废申请用赤泥与金尾矿协同制备仿玄武岩新材料方法专利，减少仿玄武岩材料对人体肺部造成的危害

龙工（江西）机械有限公司取得一种销轴校正夹紧夹具专利，能够快速夹紧校正焊接后变形的销轴板

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响