AIGC 潮水已来。或快或慢,它都将到达每个人身边。AIGC 会取代我们的工作吗?中文版 ChatGPT 什么时候会出现?技术、资本博弈暗流涌动的背后,有哪些值得关注的入局者和前线故事?
知乎联合多家优秀媒体、个人作者,共创“AIGC 入局者”栏目,与你一起,关注那些卷入 AIGC 潮水的人。
本文独家发布于知乎“AIGC 入局者”栏目。
作者丨李祥
如果一个应用,能将一篇文章瞬间生成一段符合逻辑的视频,将给视频行业带来多大的冲击?
新壹科技推出的AIGC产品一帧秒创,正应文生视频的需求而生。功能上,用户只需要在一帧秒创输入文案,就能一键生成相关视频。比如,输入一段关于宇宙起源的文章,就会生成一段3分钟左右的科普视频,里面涉及宇宙起源、宇宙演化、星系诞生等元素,还会由系统自动配音讲解,语言风格类似抖音上最火的解说类短视频。
当前,视频内容几乎是网民的刚需,但还有大量有表达能力的创作者不会制作视频,这制约了很多创意落地。AI大模型技术的进步,让机器能更好地理解人类语言。一帧秒创等工具的问世,让文字创作者可以通过文字指令让AI大模型快速匹配视频资源,并自动完成剪辑任务,从而成为视频创作者。
除文字生成视频功能外,一帧秒创还能为创作者提供多模态生成服务,包括文字扩写、文字转语音、文生图、图文转视频等系列创作服务,通过对文案、素材、AI语音、字幕等要素智能分析、解构,辅助创作者快速成片,实现零门槛产出视频。
近日,知乎联合铅笔道,专访新壹科技CEO雷涛。他认为,从去年末兴起的AIGC技术浪潮,会让内容行业或主动或被动地完成重新洗牌。在不久的将来,AI会让内容数量指数级上升,届时创意才是内容行业竞争的关键,而大厂也未必能在应用端保持制霸。尽管现阶段文生视频的质量仍不尽如人意,但未来已经近在眼前。
以下是对话精华。
一、AIGC将颠覆现有视频行业格局
铅笔道:ChatGPT出现,对内容生产类产品产生了哪些影响?
雷涛:过去十多年,移动互联网行业基本是在一些很成熟的东西上修修补补。ChatGPT所代表的大模型技术跨越式发展,让每一个具体应用都看到了跟人工智能结合的机会,这种结合可能带来整个领域的洗牌。
在视频领域,虽然目前来讲,文字直接生成视频的效果并不算好,案例远没有达到能够商用的水平。但大语言模型、文字生成图片等技术进步,已经有比较成熟的应用了,(图片和语言)作为视频的组件,客观上促进了AIGC在视频行业的发展。
铅笔道:你认为AIGC的能力会给视频行业带来哪些颠覆性变革?
雷涛:早在2016年,视频在整个互联网中作为主要传播形态的地位就确立了。可以说视频是一种刚需,但与此同时,具备视频剪辑能力的人毕竟是少数。很多用户根本不知道Premiere(注:Adobe公司开发的视频编辑软件)。
这就像原先只有电视台能通过视频的方式制作内容,后来随着秒拍、小咖秀再到抖音等产品出现,用户可以通过自拍的方式发布内容,让视频内容数量呈几何式上升,最终引爆短视频行业。
而AI赋能视频生产,则是进一步降低了视频生产门槛,用户可以更方便快捷地生产更高质量的视频,视频行业的格局也可能由此再度改变。
铅笔道:你提到文字直接生成视频的效果并不理想,那现阶段AI辅助视频生产的思路是什么?
雷涛:整体而言还是用AI辅助GC(生产内容)。目前我们的AI内容生成平台产品一帧秒创,基本逻辑是通过AI加速文案与素材的匹配。
以往创作者写完文案和脚本后,还需要花大量时间寻找、拼接合适的视频资源。比如我想制作一个“细说李白”的短视频,那我在写完文案后,还需要在全网筛选关于李白的图片、形象、作品等素材,再把这些素材剪辑到一起,这些重复的搜索和筛选,本质上全都是低效能的劳动。再加上现如今互联网资源的丰富程度,同类型视频动辄上万条,人力也很难匹配到最合适的。
通过AI大模型,只要两三分钟就能完成素材收集和整理工作。无论从产能还是素材匹配度上,都能将过去几个人几天的工作量,变成现在一个人几分钟的工作。
铅笔道:内容行业有声音质疑AIGC会产生版权问题,一帧秒创如何在保证内容产量的同时避免版权问题?
雷涛:这个问题的确很棘手,有很多独家视频素材是无法商用的。所以我们采取的是“自有资源+外部资源”合作的方式。
首先新壹科技是一下科技(研发了秒拍、小咖秀)在元宇宙VR及人工智能领域探索的实体,而通过秒拍产品多年的积累,我们的视频素材已经积累了将近10亿规模,我们将这些自有资源库开放给了一帧秒创的用户,免除他们的一些顾虑。
其次我们也在和一些版权素材库协商,想将更多素材接入一帧秒创,届时用户可以付费购买素材的使用权,而价格会比在原素材平台上购买更加优惠。当然,AIGC的版权资源会是一个长期问题,我们也希望找到更多版权方合作。
二、人工智能会不会“杀死”创造力?
铅笔道:如果AIGC能让内容数量爆发性增长,你认为未来内容行业的核心竞争点是什么?
雷涛:未来的核心竞争点肯定还是创造力。这就像传统媒体和自媒体的竞争,原先只有纸媒才可以在公众渠道发声,后来有了像微博、公众号等平台后,任何个人都可以注册自媒体公司,然后内容创作。但你可以很明显感觉到,公众号文章的质量天差地别,这就是创造力的区别。
AI大模型可以通过进一步降低生产门槛,让更多人参与视频创作,从而进一步释放创造力。
铅笔道:也有人担心AI会杀死创造力,毕竟有大模型了,很多工作都可以交给它。
雷涛:我更愿意把创造力分为两个部分,一部分是创意形成的过程,就是你脑中突然有了一个天马行空的idea;另一部分则是将创意落地,最终创作出内容的过程。
就像你写科技评论文章,你应该花更多时间在输出观点、输出干货,而不是花大量时间在寻找文章配图或短视频,这是一种本末倒置。而在视频生产中,恰恰是文案脚本容易写,视频素材整理很困难。所以一帧秒创实际上解决的是将创意落地的过程,帮助视频创作者减少低效能的劳动,将自己的创意更快变成具体产品。
关于创造力,我认为即便AIGC完全普及,能真正做好内容创作的还是少数人。
以国外做AI文生图的头部企业Midjourney为例,他们的文生图技术已经相对成熟,最近做的那组“中国情侣”图片,几乎可以以假乱真,但真正能产出那么精美图片的又有几个?
铅笔道:不同风格的视频对工具需求不尽相同,如何平衡用户对产品通用性和个性化的需求?
雷涛:通用性和个性化需求反映在大模型上,其实就是数据的泛化程度和匹配精准度。
所以首先我们尽可能多地在一帧秒创中加入更多素材量,秒拍将近10亿级别的视频素材是底子,然后对一些比较成熟的视频创作者,以往就有私有素材库,基本是几个T量级的常用资源放在硬盘里。一帧秒创支持创作者导入私有素材库,然后依托AI大模型完成结构化分析,可以更加方便创作者调用。
如果以往没有任何素材积累的创作者,大概率就是纯小白用户,对个性化需求会更低。一帧秒创是基于OpenAI及其它几个开源大模型进行了垂直训练,基本能保证现阶段用户的个性化需求。
铅笔道:现在Open AI已经推出GPT-4了,如何让产品跟上技术迭代的速度?
雷涛:就像我之前提到的,一帧秒创是从21年末开始研发的产品,谁都想象不到GPT-4会在一年多后就推出。
随着更先进的开源模型推出,我们自己的模型也在进化,技术是可以迭代的。而且相对于国内其他产品来讲,首先一帧秒创的语言模型并不会比他们差。第二,在视频这个垂直领域,我们甚至还有很多优势。某种层面上,我们跟百度的差别要远小于百度跟OpenAI差别。
铅笔道:让大模型匹配用户视频剪辑需求的难点主要有什么?
雷涛:主要还是语义的理解。因为做文字转视频首先需要理解文字,比如用户输入一篇公众号文章,一帧秒创就要理解这篇文章在讲什么,是什么类型。然后分段,找出每一段的关键词,并匹配合适的视频素材。
但如果用户随便下个指令“我今天心情很好”,这句话没有合理的关键词,也没有上下文,AI大模型就很难匹配合适的素材。这其实和真人摄影师类似,如果导演的指令不清晰、没有逻辑性,视频质量怎么可能高?
当然,当我们付出大量人工学习的成本后,通过大量标注,可以让机器更好地理解人类语言背后的意思。这也是本轮AI大模型最让人兴奋的地方。但要实现完全不用人工参与的AIGC,还需要假以时日。
三、大厂训练大模型,小厂打磨应用
铅笔道:国内外大厂都在尝试将AGI(通用人工智能)与内容生产结合,像新壹科技这样的创业公司如何留在牌桌?
雷涛:先说结论,我并不认为AI大模型会是一个赢家通吃的赛道,大厂也不一定能制霸应用端。
首先,大厂肯定要抓住行业颠覆性机会。无论是微软、谷歌、Meta,还是国内的百度、阿里、腾讯、字节,他们的主战场都在培训大模型,这是最烧钱,也最能形成技术壁垒的地方,大厂肯定要铺大量资金、技术、人才到大模型上。
然后在应用端,大厂一是不一定有那么强的动力去做,二是对应用端的理解不一定有创业公司深。比如新壹科技之所以能率先推出AI辅助视频生产工具,是因为我们提早观察到了用户的痛点,很多小白用户希望进一步降低视频制作门槛。因此我们从21年年底就开始尝试将AIGC的能力融入产品,比这波AI大模型风潮要早不少。
铅笔道:那你认为AIGC创业公司与大厂相比,有哪些竞争优势呢?
雷涛:我觉得我们和大厂大概率不是竞争关系,而是合作关系。因为大厂肯定是要研发大模型的,如果大模型技术停滞不前,那么应用端的迭代也无从谈起。当然,就目前的技术态势来看,大模型技术肯定还会继续进步。而且我认为,这波AGI浪潮中应用端的机会不比大模型小。
这就体现了创业公司的灵活性。我们可以自由选择跟哪家的大模型合作,可以从技术匹配度、市场人群、价格等多个因素综合考虑,选出最优解。但是举个例子,假如A大厂要尝试应用端,那他肯定只能用自家大模型,而不会用B大厂的大模型,这也算大公司的难处吧。
铅笔道:目前有在和国内大模型厂商探讨合作吗?
雷涛:有的,虽然目前国内大模型还处于混战状态,但大模型终归是要落地到应用端。作为一款较为成熟的AI文生视频产品,一帧秒创需要积极地跟用户,跟C端市场产生连接。所以无论最后是百度,还是阿里、腾讯、字节等的大模型能跑出来,从应用角度来讲,我们都可以积极接入。
因为应用端产品,更关注就是用户端的反馈,谁能更好地服务用户,谁就是真正有价值的。
铅笔道:国外大厂Meta宣称会将AIGC与元宇宙结合,似乎和新壹科技的业务有些相似?
雷涛:广义上看,AIGC会是元宇宙的一个组成部分,因为按元宇宙的世界观,里面不管是3D场景还是消费的内容,乃至NPC(非玩家角色),都肯定要通过AIGC的方式生产。因为内容量太大了,通过人工生产肯定无法完成。
但现阶段,狭义的元宇宙还只是一个概念,不管是NFT还是VR,目前都还有很强的局限性,甚至根本没有落地场景。而AIGC已经从一个概念,真正走向了广泛应用。基于AI大模型,文生文、文生图、文生视频的产品,国内外都在不断出现,所以AIGC的风头很快压过了元宇宙。其实从长期来看,AIGC和元宇宙还是有可能融合的。只是国内市场有一点很不好,元宇宙热的时候大家都蹭热度,一旦热度下降又唯恐避之不及。
铅笔道:相比遥远的元宇宙,现阶段一帧秒创或许更需要找到变现模式?
雷涛:确实,相比于大厂的雄厚资金,创业公司的变现压力更重。所以我们为一帧秒创制定的是“B端定制+C端付费”的变现模式。
首先在B端,我们已经观察到有两类公司可以尝试定制。一类是许多自媒体都有制作讲解类短视频的需求,但又不想专门雇一个制作视频的人,一帧秒创简单易用的产品特点正好切中他们的需求;另一类是营销类公司,比如做本地生活营销,会有大量制作短视频的需求,一帧秒创的素材库能大幅提升产量。而且我们经过计算,一帧秒创每分钟的视频制作成本对企业来说已经非常划算。
而C端付费主要是AIGC热潮兴起后,更多用户对这一块业务感兴趣,开始积极尝试,让我们看到了付费的可能。我们现在推出了免费版和用户阶梯付费版,对于一些有制作视频需求的个人视频博主来说,也是有付费意愿的。
【版权声明】本作品的著作权等知识产权归铅笔道所有,知乎享有本作品信息网络传播权,任何第三方未经授权,不得转载。