当前位置:首页|资讯|Sora

Sora热度背后,真正值得学习的是什么?

作者:申悦发布时间:2024-02-29

Sora发布有半个多月了,行业内讨论热度似乎有增无减。我自己也不间断地贡献了2篇文章,还在36氪做了直播分享:

还频繁在我的「AI见识群」里分享关于Sora的各种资料、文档。

但随着对这款“产品”(现在应该还不算是产品)的思考越深,对它背后的原理了解的越透,越在思考一个反常识——Sora真值得我们普通人花大量时间“学习”么?

当下围绕着Sora的所谓“学习资料”,主要集中在几个维度:

第一是技术层面,探讨背后的实现原理。但无论技术届大神、学术领域博士、还是科技圈自媒体,聊来聊去基本都围绕着:“Diffusion Transformer + 时空自编码器 + SpaceTime patches + Scaling Law”这几点展开。说浅了遭内行鄙视,说深了又没人看。关键是了解了这些原理,然后呢?

第二是哲学层面,探讨世界模型是否已实现、现实世界是否会颠覆、我们离AGI时代是否又更近了一步?但这种开放式话题讨论是没边的,几方各执一词相互辩论,吃瓜群众围观看热闹,又然后呢?

第三是蹭流量层面,教你怎么用Sora搞钱,哪里找Sora视频,怎么借关键词引流,怎么写Sora提示词,怎么申请Sora内测资格。还有就是借Sora话题制造焦虑卖课、搞社群。但看了一圈,除了本来就会搞钱的“操盘手”,也没听过谁真正通过学Sora受益。

这篇文章讨论的,并不是这些现象的对错,我自己也在搞AI,同样也蹭到了这个话题的热度。但除此之外,我更想聊聊Sora热点之外的视角,即:

以终为始地看,AI爆发的大趋势下,普通人真正该学的是什么?

我觉得有三点:讲故事的能力、结构化思考力和内容专业力

讲故事的能力

以文生视频为例,先不说Sora,很多人连Pika、Runway都用不利索。

用文字描述一件事、一个观点、一个诉求并不难,但描述一段画面、一个场景、一则完整故事,对绝大多数人是极高的门槛。

很多人会担心未来影视行业会被颠覆,任何人用Sora都能生成一部大片,于我是不信的。

做过多年内容产品经理的我,深信创作一部好作品,是要在写作、绘画、表达上进行反复学习和大量训练的,想用好AI,先把《英雄之旅》、《救猫咪》熟读于心,拉几十部经典片子才算入门。推荐看看我之前的文章:悦读681.学学怎么讲故事《救猫咪》读后

Sora不会让影视行业失业,正相反,如果视频生成的AI技术持续普及,会让真正会写故事的人发挥才能,而不是受限于影视行业的潜规则而灰心放弃。

结构化思考力

很多写Sora的文章,都在讲它在模型算法、算力涌现、物理模拟上的创新。对我而言,会更惊讶它在训练视频数据时,以一种结构化提示词方法,解决了视频标注问题:

“We first train a highly descriptive captioner model and then use it to produce text captions for all videos in our training set” 

本质上看,无论是B端训练数据,还是C端和大模型对话,都用到了结构化表达能力。包括那些所谓“Sora培训”,其实教你的也是怎么写好提示词。举个例子,对这样的场景:

该怎么描述呢?一个在沉思的老爷爷?一个戴眼镜的老爷爷?一个在咖啡厅发呆的老爷爷?可能大部分人想到这儿就结束了。但更加结构化的描述可以是:

主体人物::一位 60 多岁留着胡须的白发老人

镜头景别:脸部特写

背景环境:巴黎的一家咖啡馆

人物状态:注视着窗外行走的人们,一动不动陷入沉思,后又抿嘴微微一笑

人物细节:穿着一件羊毛大衣和一件纽扣衬衫、头戴棕色贝雷帽,戴着眼镜,像是个教授

环境细节:金色的灯光和背景中的巴黎街道和城市

镜头技术:景深、35 毫米电影胶片,有电影感

具备写出上述提示词的能力,才能真正发挥多模态技术的价值。这背后蕴含着的,就是结构化总结和思考能力日思396.如何提升总结能力?

有句话很形象,写提示词就像客户讲brief,能把需求说清楚,就离正确答案不远了。

内容专业力

这点又说回到创作者本身,我比较喜欢杨远骋老师(「躺岛」和「新世相」联合创始人)在文章《Sora 喧嚣过后,理性浮现 | 我问出了这 5 位顶级创作者的真实想法》中的观点:

最大的影响会是出现新的创作者,会出现完全不在人们视野里的新的内容偶像,他们有非常好的品位、思维方式和世界观,但受限于表达技术,在过去却连基本的视频制作能力都不具备。 

是的,除了上文提到的讲故事能力。如果你具备对“好内容”的理解力,懂得怎样更合理地设计脚本、做分镜、上特效、画故事板、运镜、调度、选角、布景、调光、配音、后期等等,AI就是你发挥想象力最好的帮手。能用好 AI 的人,一定能做出更好作品、获得更多收入。

因此我坚定地认为,这波AI趋势,对高潜力的作家、画手、设计师、编剧等创作者,是绝对的利好。如果你也想从中获益,先把“创作一部好内容”作为目标学起来吧。

总的来讲,我认为围着Sora去追新闻没啥必要。能跳出对Sora本身铺天盖地的宣传,去思考这背后该真正掌握的技能是什么。用结构化思维去训练讲故事的能力,成为一名优秀创作者,才是值得为此付出时间的。

我是申悦,前大厂产品专家,现AI领域的创业者、观察家,希望有机会和你交流。

本文来自微信公众号“互联网悦读笔记”(ID:pmboxs),作者:申悦,36氪经授权发布。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1