本报记者 曲忠芳 北京报道
“OpenAI推出文生视频模型Sora火热,这对我们来说是一个加分项,它还没有向公众开放,我们一直在等着试用账号。”近日,一览科技创始人、CEO罗江春在接受《中国经营报》记者采访时如是说道。
罗江春是国内视频领域的“老兵”,1997年从清华大学本科毕业后,赴美国莱斯大学攻读“人工智能与机器人”专业,2005年回国创办了视频播放平台风行网,2017年二次创业成立一览科技,探索人工智能技术在视频服务领域的落地应用,可以说见证且亲自参与了视频生产方式由PGC(专业生产内容)、UGC(用户生成内容)、RGC(机器生产内容)等到如今的AIGC(指通过AI技术生成内容)的进阶历程。
截至2024年3月15日,OpenAI推出的视频生成模型Sora刚好面市一个月,在这一个月里,罗江春向记者坦言,自己和许多从业者一样都经历了从震憾、兴奋、焦虑到冷静思考的历程。在采访过程中,罗江春分享了他和一览科技对于以OpenAI为代表的大模型技术路线、国内AI工具普及应用,以及视频生产力跃进等方面的思考。
采访期间,罗江春还特地强调:“Sora并没有开放,只允许申请内测资格,因此提醒大众警惕那些说已用过Sora或者打着新技术旗号兜售各类产品的现象,避免上当受骗。”事实上,Sora核心团队在接受美国媒体采访时表示,Sora在“可预见的未来”不会被发布,目前仍处于一个研究及获取反馈的阶段,它还不是一个产品。
《中国经营报》:Sora为什么能引发如此高的关注度?
罗江春:Sora刚发布时,大部分从业者的感受还是很震憾的。OpenAI对Sora的定位表述是“世界模拟器”(world simulators),实际上不太准确,我认为应该是视觉模拟器。在Sora出现之前,以Pika、Runway为代表生成视频是通过1秒钟24张图片连贯实现的,Sora生成的视频时长更长,生成的视频素材除了图片,还有镜头,也用到了仿真(simulation)的技术。Sora的技术框架是Transformer和Diffusion,模拟的是视觉,如高速的转弯、小狗往前跑的场景转换等。类似的技术在游戏已经得到了应用,但是Sora的算力显然更多,生成视频的速度更快,效果也很逼真。
OpenAI走的路线一直是“大力出奇迹”,此前在大语言模型ChatGPT的处理经验复制应用到图片、视频的生成,将图像画面训练的数据形成Patch(图像块),类似于大语言模型训练中的token,把模型去“做大”,遵循Scaling Law(规模法则)从而生产出质量远胜于竞品的视频内容。
当然,它现在还有很多物理的问题没有解决,生成的视频也存在一些明显的错误,但相信之后的迭代升级会很快解决。
《中国经营报》:你觉得这一轮生成式AI技术会给视频行业带来什么影响?
罗江春:近两年AI大模型技术的突破,可能每个行业都会受到影响,只是影响的程度和速度会有所差异,由此带来社会生产力的跃进与生产关系的变革。那么,对于视频行业而言,毫无疑问,它的底层技术解放了内容生产力,AIGC将产生深远的影响。一方面,视频内容质量将大幅提升,从业人数也会增加,但与此同时赚到钱的人则会变少。另一方面,新的内容和分发渠道也将出现,包括虚拟现实的无缝多模态切换。此外,新的内容消费场景也将出现,游戏和电影之间的边界将变得更加模糊。
AI的介入会使内容制作更加智能化,使得创作者能够以更高的效率进行创作。例如,可以通过AI技术自动生成脚本、自动分镜、自动调整光影等,这些都能极大提升创作效率,让创作者有更多的时间去关注更为重要的创意部分。
《中国经营报》: 在视频行业生产力变革的当口,一览科技的定位或者说能解决的问题是什么?
罗江春:一览科技一直在探索的就是人工智能技术在视频服务领域的落地应用,此前我们提出的模式是VaaS(Video as a Service),即视频作为服务,在这个平台上,任何企业、组织和个人都可以获得海量、正版、优质的视频服务。行业正在从对AI技术的探索阶段,转向深入理解如何将这些技术有效融入具体的业务流程和服务中。面对这种变化,关键在于找到并掌握真实的应用场景、即时有效的数据反馈体系、有效的技术应用开发能力以及相对完整的产业链支持。AI大模型技术能够在视频工作流的每个环节中都有应用的空间。
生成式AI爆发之后,2023年年初我们结合自身业务,迅速推出了集“AI编剧、AI绘图、AI数字人”于一体的视频AIGC全域工作流,搭载于旗下创作者工具“一览运营宝”,运营宝由此全面升级为从创作到变现一站式的视频工具。面向的用户主要是影视及短视频行业人群,帮助他们提升视频内容的创作效率与品质,从而为客户创造出更加多样化和高质量的视频内容。简单说,它解决的是视频内容供给端的痛点,其实国内并没有太重视创作端的工具,一览运营宝解决的就是帮助他们从创作到变现的全流程。
《中国经营报》:一览运营宝既然是服务内容创作者的工具,那它跟抖音的剪映、快手的快影等短视频平台的剪辑工具是竞争关系吗?
罗江春:其实并不是。一览运营宝是独立于所有平台之外的第三方工具,当创作者不论用哪一个工具生产出内容后,可以通过一览运营宝进行创作、编辑,然后再在订单广场上进行售卖,从而满足各种各样的来自B端客户的内容需求,并实现收益。
《中国经营报》:你在美国有过学习与工作的经历,从你的观察来看,国内人工智能的发展与美国市场相比在哪些方面还有差距?
罗江春:OpenAI这样的公司、ChatGPT这类产品没有出现在中国,还是令业界有些难过的。去年国内出现了各式各样的大模型,已向公众开放的有20个,国内所有做大模型、做应用的公司,不论是大厂也好还是创业公司也好,虽然都在奋起追赶,但跟美国比还是存在不小差距。
我想重点说一点,便是关于AI工具的使用及普及,这里大家可以回顾下在生成式AI火热的这一年里,我们每天真正使用AI的时间有多少?事实上,现在市面上好用的、能用的AI工具还很匮乏,AI真正赋能工作、生活中的价值仍比较有限。作为AI行业的创业者,我们首先就应当摒弃过于功利化的心态,积极主动承担普及AI的责任,沉下心去打磨好产品,提供更多更好的普惠性AI产品让用户使用,为人工智能的普及尽一份力。AI对于各行各业的重构已是势不可当,对于内容产业尤其是视频领域来说,我们每个人都应该积极地拥抱与善用AI,加大在AI方面的投入,这样才会构建起自己的竞争优势。
(编辑:吴清 校对:颜京宁)