想清楚“不是为了AI,而是为了创作”后,创作者们的AI焦虑逐渐消解了
文|徐文璞
编辑|刘以秦
2024年2月16日,AI创业公司OpenAI推出视频模型Sora,目前并未对外开放。但在OpenAI公布的演示中,Sora可自动生成长达60秒,且基本符合物理运动逻辑的视频。一些业内人士认为“效果惊艳”,AI视频生成技术将进入新阶段。
OpenAI公布的Sora生成视频,来源:OpenAI
广告设计师郑茗友最近在实验AI创作。他用一个月时间制作了一个5分钟的AI短片后,在尝试做一个20多分钟的AI微电影。在制作过程中,他以传统影视作品的高制作标准为标杆。他想充分了解AI视频的极限在哪里。
实验进行到一半,他告诉《财经》,“Sora也许会更好。但有一些问题,Sora也不一定能解决。”
AI生成视频是继AI生成文字、图片后,大模型技术落地的最新进展。通过输入语言、图片或视频片段,模型可以自动生成视频。这一技术在2023年由Runway、Pika、Stability AI等初创公司推动。受制于模型能力,这些公司的模型一次只能生成3秒—5秒的动图,且自带“失真风格”——画面变化幅度小、细节不连贯,因此人物僵硬、细节模糊,物体运动不符合物理世界规则。
Pika用同一关键词生成的AI视频,来源:Pika
Sora大大拉高了公众对AI视频的预期。甚至有人认为,Sora不是生成视频的模型,而是生成世界的模型——在数字世界中复刻现实,甚至可以按照现实世界的规则持续演进。
目前OpenAI并没有明确Sora的上线时间,且持续发布的演示效果显示,Sora虽然大致可以理解真实世界,但偶尔生成明显错误的内容。比如,“正常人有6根手指”“猫在和主人互动中突然长出第五条腿”。
再比如,在特定场景中带有一定内涵的动作,AI还不能理解。所以生成的画面“有形无神”。这时候,创作者需要通过镜头剪辑、配乐烘托等其他路径去改善观看体验。这考验的是影视创作的基本功。
而且,影视导演们不一定有耐心接触AI新工具。郑茗友认为,这是因为AI的制作流程跟以往完全不一样。如果没有充分掌握AI工具,它的效率可能还不如传统软件。
公众的高预期与“内行人”的谨慎形成了鲜明对比。影视、广告、时尚等行业从业者普遍认为,现阶段AI视频还不足以达到传统视频制作的效果。
他们一度因为AI而焦虑。但他们在尝试AI视频后发现,AI并非无所不能而且存在很多局限,需要影视创作专业能力来弥补。
传统影视工业体系的核心创作岗位的从业者们认为,AI技术快速发展的时候,更应该回归影视创作基本功。创作者需要在原创故事、镜头语言、叙事节奏等专业领域倾注更多精力。
很多人在想清楚“不是为了AI,而是为了创作”后,他们的技术焦虑逐渐消解了。
创作者冷静了
Sora的公共讨论热度还在持续。然而,一线视频创作者对于Sora态度反而更冷静了——他们中的很多人早就在尝试AI视频创作,并且实现商业变现。这个新兴市场始于2023年中。
大多数创作者目前的商业化路径是,在社交媒体上发布AI视频作品,展现自己的艺术审美和技术能力。借此获得行业影响和市场关注,进而为客户提供商业项目的AI视频。
AI视频创作的圈子并不大。这些创作者主要精力仍在影视、设计等本职工作。他们用AI创作视频更多是尝鲜心态。随着探索逐渐深入,创作者们发现了AI一些难以解决的硬伤。
王大伟(化名)是编导专业出身,曾跑过几年剧组,有很多传统影视人朋友。他告诉《财经》,Sora热度起来后,此前关注过AI视频但没有真正投入的人开始行动了。但是此前不关心的人依然不为所动。
这其中的因素有很多,包括Sora还没有上线,大家并不知道Sora实际能力有多强等。《宇宙探索编辑部》的副导演吕启洋在Sora发布后的直播分享中提到,如果AI生成视频技术不能更好的帮助自己创作落地,他倾向于先观望。
事实上,现在AI视频生成技术的价值更多在于降低影视业的门槛。AI创作者只需要支付每月几十美元的软件订阅费,就可以完成需要编剧、导演、摄影师、演员、后期等整个制作班底才能做的事。这让很多有创作欲和表达欲的人,可以低成本进入视频生产领域。
但影视创作的天花板并没有因此降低。这个天花板被每个制作环节专业人员的业务能力相叠加而推高。单靠一位或几位AI视频创作者无法达到这样的高度。
这让一些深度参与专业化分工的影视从业者对AI敬而远之。但也让另一些人看到了更大的创作自由,不过他们认同,AI工具迭代只是辅助,影视创作专业能力才是核心。
“Sora(演示的)效果确实好,但它本身不重要。它只是大时代变迁中的阶段性产物。就像电脑发明出来了,微软、惠普、苹果都推电脑产品,每个具体的产品都只是大时代下的一个切面表象。”动画导演、兔斯基作者王卯卯告诉《财经》,“重要的是创作者要学会用这个工具,来表达好自己的创意和想法。”
客户谨慎买单
AI创作者的参与,将AI视频推到了更多人面前,这其中也包括潜在客户。
王大伟变得更忙碌了。Sora出现后,更多人知道了AI生成视频,也有更多买家前来咨询下单。接受《财经》采访前一天,他刚和同伴赶完一个AI宣传片。他的声音透着明显的疲惫。“比之前机会多一些,但交付难度依然很大,主要是甲方对它的误解很深。”
王大伟说,在Sora出现之前,客户们以为AI频制作快、成本低,所以经常派一些急活,还要借此压低创作者报价。Sora出现后,他们又高估了AI视频的能力,认为创作者应该做出和实拍效果齐平的AI视频。
愿意下单的客户多是看重AI的独特艺术风格和降本增效能力。2023年以来,一些时尚杂志、广告品牌主、动画工作室和音乐工作室就在尝试商用AI视频。
张皓宸是国内第一批将AI视频落地时尚杂志的商业摄影师。2022年底他知道了AI生成图片的存在,随后便尝试用Midjourney生成的背景元素和模特实拍结合,落地了一组创意大片。Midjourney是美国旧金山Midjourney实验室2022年推出的AI图片生成工具。
这个创意在张皓宸脑中已存在了几年。但过去需要3D软件来实现,人工费就要几万元,所以迟迟没有推进。如今一个Midjournry的专业版会员一个月只要60美元。在用AI工具的过程中,张皓宸发现AI不光创意多,能够激发自己的灵感,而且几分钟就能出图看效果。这省掉了过去在3D软件上建模,或实拍堪景置景的过程,能大幅节省创作成本和时间。
他将作品发在社交平台,很快吸引来《时尚芭莎》等时尚媒体的邀请。2023年5月,他成为国内第一批把生成式AI引入奢侈品牌、名人模特和时尚杂志合作的创作者。
因为用AI生成画面背景,这期概念视觉大片和创意短片帮杂志节省了美术置景的费用。一般情况下,这笔费用的预算在几千元到十几万元间。
2023年下半年开始,生成式AI在时尚界和广告界掀起了一股热潮。国内主要的时尚杂志以及知名品牌如耐克、京东、联想、兰蔻等,都纷纷采购了AI视频宣传片。
然而,随着AI风格在时尚界和广告界中流行,它也遭遇了部分观众的抵触,“人物动作太假”“AI感太浓”。
生成明显错误内容更是AI视频的硬伤。“视频中的人居然有六根手指”,一些观众不满AI创作内容失实。这背后的核心原因是,AI视频模型控制错误生成的能力暂时不足。
AI生成视频中的男子,左手有六根手指
时尚界、广告界的审美如水一般流动。AI在去年是流行热点,它被贴上了“风格前卫”的标签。然而,随着AI视频泛滥,AI视频不再是一种前卫的风格。它的僵硬、模糊和生成错误内容甚至会影响品牌形象。很快,一些时尚、广告客户尝试AI视频的积极性降低了。
张皓宸的创作重心已回归创意本身,不再围绕AI。他认为,想要需求再次爆发,可能要等更先进的视频模型出现。
广告公司负责人高鹏飞在2023年底曾对《财经》表示,除了追求AI生成风潮的品牌,大多数甲方本来就不能接受AI视频内容制作的不确定性和改稿时的低可控性。
尽管有意将生意版图扩充到AI广告,Sora出现后咨询的客户也增多了,但他至今还没有客户下单。
一个显著的进展是,中国一些电视台在Sora发布后纷纷加大了AI投入。2024年二月下旬以来,中央广播电视总台、上海广播电视台、成都市广播电视台、中山广播电视台陆续跟进。一位省级电视台晚会节目舞台编导告诉《财经》,他在春节后的内部会议上,了解到了AI视频落地的相关规划。
《财经》了解到,目前部分电视台的管理层期望通过自上而下的方式引导员工尝试用AI模型制作视频。不过,电视媒体要求内容可控,没有价值观的AI视频模型更需要符合内容监管需求。这意味着未来在技术环节需要更多相应的解决方案。
AI工具能力仍待提升
影响创作者、买单者决策的核心因素是AI工具的能力。过去大半年,AI视频领域每个月都有能引发全行业讨论的技术论文,每周都有重要工具的更新。去年很长一段时间,王卯卯一周要学3个—4个AI工具,常常因为没有赶上用最新的工具和做出最酷的视觉效果而焦虑得掉头发。
AI工具还在加速更新。OpenAI公布Sora后的半个月内,字节跳动的Boximator视频模型和阿里的EMO(Emote Portrait Alive)视频模型相继官宣。2024年3月12日, AI生成工具Midjourney再度更新,发布生成角色一致性的功能。
王卯卯时常感叹,AI生成视频工具发展太快,这周做的视频下周就落后了。因此在去年底想清楚自己的核心竞争力在于故事和创意后,她现在用心打磨创意和剧本,等更好的技术来实现。
Sora与之前的技术相比,模型能力有重大突破。与一些创业公司的小步快跑相比,Sora是踩着高跷在大步前进。
Sora让一些曾因尝鲜AI视频获得甜头的创作者深陷焦虑。他们认为,从OpenAI发布的技术报告和演示视频来看,Sora会抹平很多AI视频创作者过去1年积攒的有限经验。比如,现在的视频模型生成的画面稳定性不足,有经验的创作者可以通过提示词工程来掩盖或修正问题。但Sora在模型层就改善了生成内容稳定性不足的问题。Sora可以让刚入门的人轻易生成更高质量的视频画面。
即便如此,AI也不会简单替代传统影视制作的工作流程,Sora的出现只是加快了AI与传统工作流程的融合。
多位AI视频创作者对《财经》直言,Sora比较成熟的落地应用场景是烘托氛围的空镜头。如果要进一步推动AI视频的商业化,落地更复杂的场景,Sora还要解决AI生成视频共通的稳定性和控制性缺陷。好在,Sora看起来让这些问题减轻了很多。
如果将AI视频模型与大语言模型GPT的发展相对应,OpenAI研究员Jason Wei公开表示,Sora只相当于2018年时的GPT-2(GPT-2于2019年2月发布)。“在保持长时间的内容一致性,实现近乎完美的现实感,创造有深度的故事线等方面,Sora还有显著提升的空间。”
但是Sora的出现加快了AI视频模型的升级进度。除了OpenAI的Sora,Meta、谷歌也在尝试其他具有潜力的AI视频生成技术路线。国内科技企业如字节跳动、阿里巴巴也在加速突破AI视频模型。
AI营销企业奥创光年研发负责人张红春告诉《财经》,未来3个—6个月AI视频模型会迎来一波发布潮。“届时Sora可能会上线。开源社区应该也会上线基于Sora技术体系的模型。谷歌和Meta也会有新进展。”
在很多创作者看来,即使强如Sora,也只是过渡期的模型。它的能力很难替代影视专业制作中的核心创作环节。可以预见的是,AI模型生成视频的能力会越来越好。但决定创作者核心竞争力的,并非掌握了多少AI工具,而是影视创作专业能力。
责编 | 田洁
题图 | 视觉中国