经济观察网 记者 郑晨烨 2月19日是A股市场进入龙年后的首个交易日,市场表现较为强势:上证指数以2910.54点收盘,涨幅1.56%;国证A指涨幅1.43%,沪深300涨幅1.16%。
盘面上看,当日沪深京三市最活跃的题材无疑是AI应用方向,包括宣亚国际(300612.SZ)、当虹科技(688039.SH)、易点天下(301171.SZ)在内的相关概念股批量涨停。中证人工智能产业指数大涨6.14%,同花顺Sora概念(文生视频)指数涨幅更是高达16.17%!
但值得注意的是,自去年12月以来,A股投资者对AI概念的热衷程度实际上已有所减退,曾经股价持续走高的相关个股纷纷陷入“回调”。
例如,2月19日走出一字涨停的宣亚国际,在2023年12月12日至2024年2月8日的短短42个交易日中,股价曾暴跌51.14%,中证人工智能产业指数亦在同一区间内跌去18.99%。
AI概念股春节前后的强烈反弹,部分得益于外围利好消息,特别是OpenAI于2月16日发布的全球首个文生视频大模型——Sora,为市场注入了一剂“强心剂”。
从OpenAI官方的演示材料来看,Sora可以基于用户输入的简短指令生成最长达一分钟的视频,轻松地将用户想象中的场景转化为各类高清视频呈现,这种能力再一次大幅拓展了生成式AI的应用场景,展示了AI在理解和创造复杂场景方面的巨大进步,这使得Sora成为全球科技圈讨论的焦点。
“Sora意味着AGI(通用人工智能)的实现将从十年缩短到两三年。”2月16日当天,360集团创始人、董事长周鸿祎在微博上如是点评Sora模型的发布。
许多业内人士认为,Sora的出现将为内容创作、娱乐和教育等行业带来革命性变化,因为这意味着个人或小团队创作者可突破传统资源、资金和技术的限制,创作出更加多元和丰富的内容。同时,亦有短视频行业的从业者强调,Sora作为一种初步的生产力工具,预示着效率革命的到来,但不会是简单地颠覆或取代视频行业现有体系。
Sora的真实感
“一位时尚的女士穿着黑色皮夹克、长红裙和黑靴,在充满霓虹灯和动感城市标志的东京街头行走。她佩戴太阳镜和红色口红,手提一只黑色手袋,自信而随意地走着。街道潮湿而有反光,色彩斑斓的灯光在地面上形成镜像效果。许多行人在街上来往。”这是OpenAI官网上,展示的一则让Sora生成视频所使用的Prompt(提示词)。
(依据上述Prompt Sora输出的视频截图)
从生成结果来看,Sora准确地还原了Prompt所描述的场景,同时Sora还给视频增加了相当多的细节,不管是对日文霓虹灯牌的还原、熙熙攘攘的行人,还是多彩灯光在潮湿街道上所形成的镜像效果,这些细节都进一步增加了场景的沉浸感。
而在OpenAI官网上,类似这样的演示案例还有48个,这些提示词及生成内容五花八门,有远古生物猛犸象漫步在雪山之中,也有越野吉普穿越在崇山峻岭之间。
记者在浏览Sora所生成视频时,一个最大的感受便是“真实”。
在该模型所创作视频中,可以实现人物和关键场景元素在三维空间中保持连贯运动,且基本符合物理规律,同时,能够确保一个主题即使暂时离开视野也能保持外观不变。
“持续扩展视频模型的规模是一个有前景的方向,有助于开发出高效能的物理和数字世界模拟器,以及其中活动的物体、动物和人类。”OpenAI在Sora官方的技术文档中指出。
“现在所有的文生图、文生视频都是在 2D 平面上对图形元素进行操作,并没有适用物理定律。但Sora产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。所以我理解这次OpenAl利用它的大语言模型优势,把LLM(大型语言模型)和Diffusion(扩散模型)结合起来训练,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出 2D 的范围模拟真实的物理世界。这都是大模型的功劳。”周鸿祎分析称。
“AI大模型之前有个很大的问题就是对物体持续性认知不足,理解不了现实世界里各种对象和元素间的关系,理解不了三维世界里的物理规律,比如水面应该反光,人受重力影响应该站在地上等等,所以经常会出现‘牛头不对马嘴’的生成结果。从演示来看,Sora似乎已经解决了这一问题,但还是有些瑕疵。”杭州一位AIGC领域从业者陈雨向记者表示。
记者亦注意到,在OpenAI演示的实例中,还是出现了部分不符合现实世界依赖关系认知的滑稽内容,例如,在一个提示词为:“一个人奔跑的逐帧打印场景,以35毫米电影胶片拍摄的电影镜头”的生成视频中,视频中的人物在跑步机上出现了倒着奔跑的情形。
“Sora有时会创造出物理上不合理的动作。”OpenAI官方也在该实例下方点评称。
除了文生视频,从Sora官方的技术文档来看,该模型还支持在两个输入视频之间逐渐插值(插入其他视频),在具有完全不同主题和场景构图的视频之间创建无缝过渡,同时,Sora还具备将视频在时间线上向前或向后扩展的能力。
“我们正在让人工智能掌握对运动中的物理世界的理解和模拟,旨在培养出能辅助人们解决需要与真实世界互动问题的模型。”OpenAI官方如是定义Sora模型的价值。
目前,OpenAI官方只向部分视频行业从业者开放了Sora的试用,该模型尚未正式面向普通用户推出。
2月17日,OpenAI的工程师大卫·施努尔还在X平台上发布了一条推文称,OpenAI正在为Sora项目寻找对大规模视频基础架构(如视频传输、处理、上传等)有经验的人才。
兴奋的从业者
“Sora的发布我还是很兴奋的,心里肯定是希望早点用上类似的工具,这样以后我可以创作出更多、更好的课程,但我现在很烦网上那些贩卖焦虑的人,OpenAI自己都还没让Sora正式上市呢,一群人就开始说我们短视频博主要下岗。”谈及Sora发布后的感受,小红书上的一位博主王涛告诉记者。
王涛平常会在B站、小红书、知乎、抖音等平台上上传一些英语口语教育类的短视频内容,在她眼中,如果未来有一天类似Sora的产品上市,其必将争取成为首批用户,因为对于她而言,视频剪辑并不应该是其核心工作。
“每次我录一期小课程小分享之类的,都要花很多心思去做视频剪辑,要配字幕,要配一些动效,要配bgm,我也不是专业做视频剪辑的,很耗费精力,如果Sora可以一键生成,那我就能花更多心思在内容创作上。”王涛说。
记者也注意到,谈及Sora的发布,相较于取代论,视频行业的从业者更喜欢用工具论来看待。
陈雨就认为:“Sora的出现对小团队或个人创作者而言是极大的利好,哪怕是一些全网知名的自媒体平台博主,尤其是知识类博主,为了专注内容创作,都会把视频剪辑外包给专业团队,Sora的意义,就是让个人或小团队创作者能够超越以往在创作资源、资金实力和技术能力上的限制,产出内容。”
2月16日,西瓜视频创始人之一的宋健亦公开发文称要给“给Sora泼点冷水”。
宋健指出,从平台角度看,抖快视频号本质上还是以视频为载体的“社交平台”,特效甚至视频化本身只是个形式,而从技术角度看,生成式视频的信息量不如真实拍摄大,一个真实拍摄远远不是视频本身。
“一个30岁的男人和一个20岁的女人对话,表达、语气、表情的背后都是他们积累了50年的数据的总和。这些是生成式AI当前无法替代的。而且用户对这些细节很敏感。”宋健表示。
在他看来,希望通过借助Sora这种视频生成式技术,干掉人拍的视频,把视频行业变成一个 “人纯粹消费机器工业化内容”的局面,是“没戏的”。 但如果说,希望通过借助新技术,让人和人之间产生新的连接,激活新的创作产能,宋健觉得是“有戏的”。
“尊重行业规律,日拱一卒地去通过“技术”迭代“生态”,而不是直接把技术强怼给用户。”宋健强调。
不过,部分业内人士谨慎乐观的态度,已经架不住行业内焦虑情绪的蔓延。在小红书、B站、知乎等自媒体平台上,不少培训机构已开始乘上Sora风口兜售AI相关资料与培训课程。
“说到底还是一个工具,以后我做视频,可能会从PR进化到Sora,所以我很反感现在贩卖焦虑的说法,然后到处都是卖课的,说你不学AI就彻底被淘汰了,如果AI真的那么神奇,讲句话它就懂,为什么我还要专门学怎么用呢?”王涛评论说。
驱动AI产业新一轮景气度
据记者梳理,目前在A股中,虽然尚未有相关公司推出成熟的文生视频模型,但已有不少上市公司开始布局。
2月19日,数字创意软件龙头万兴科技(300624.SZ)“20CM”涨停。从公开信息来看,该公司核心产品万兴播爆,是目前市场中较为流行的数字人短视频营销内容创作工具,此外,该公司在去年还曾与微软签署合作协议,引入OpenAI商用服务,将大模型能力落地至多款海外产品。
在2月19日,同样“20CM涨停”的还有当虹科技和因赛集团。
据当虹科技披露,该公司拥有自研的AIGC工具集,于2023年上半年发布了以静态照片生成三维体积视频的方案,支持6DOF(六自由度)视角自由移动,并且通过点云模型转换及压缩算法实现高达800倍的视觉无损压缩,实现不同模态之间相互切换。同时,公司自研的AIGC视频内容智能生成系统融合了大模型技术,包括语言、视觉、音乐等,以及公司在视频技术领域的诸多创新技术,如超高清编码、AI超分插帧等,能助力用户在新闻传播、商业推广、教育教学、视频内容创作等多项领域中创作出优质视频内容。
“公司的文生视频技术已取得一定进展,但从技术到商业应用是一个逐步落地的过程,投资者需理性看待。”2月19日,记者以投资者身份致电当虹科技,其相关负责人如是回复。
值得注意的是,作为一家以营销传播代理为主营业务的企业,因赛集团亦正积极融入AIGC的浪潮当中,为了推动大模型研发,该公司在2023年7月还通过了定增预案,计划募资6.45亿元,用于构建营销AIGC大模型研发与应用项目,而因赛集团2023年前三季度总营收也不过3.87亿元。
“公司自研的InsightGPT属于营销行业应用层垂类模型,与Sora这类底层通用大模型并不属于直接竞争关系,反而可以结合Sora等通用大模型丰富自身视频素材库以及提升视频生成效率和品质;随着未来视频生成相关技术水平被逐步拉齐,愈加普及的视频创作型工具唯有通过内容、创意、创新等方面的能力制胜,而公司在营销行业具有二十余年的积淀,内容创意生产能力位居行业头部,有助于InsightGPT在创意和洞察环节形成差异化优势并在市场竞争中脱颖而出,尤其是面向大型品牌客户。”在投资者问及Sora发布对公司带来的影响后,2月19日,因赛集团在互动易上如是表示。
2月17日,国盛证券在相关研报中分析指出,随着 AIGC 技术在影视剧集、宣传视频、自媒体、游戏等领域逐步渗透,视频创作效率或迎来显著提升,同时视频模型相对于文字、图像模型的交互数据量级将有巨大提升,或对应算力需求的高速扩张。
“Sora 的横空出世,有望进一步激发市场对 AI 产业持续创新能力的期待。从去年的 LLM,到文生图,再到文生视频,AI 大模型在对真实世界的理解和模拟方面能力持续且快速提升,向 AGI 迈进的速度也超出了大家的预料。此次 Sora 的推出,有望带动产业新一轮的景气度上升。”国投证券则在2月19日发表的一份研报中强调。
撷艺录 2024-12-18
俞洁讲武堂 2024-12-18