文 / 本刊记者 艾渺
近日,AI新锐巨头Open AI推出文生视频模型Sora——一段简短文字即可生成电影级逼真场景。虽然Sora还没有向公众开放,但由于在AI生成视频时长上取得了显著进展,能够生成长达一分钟的内容,再加上公开演示视频的高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色等高质量内容呈现,Sora的出现立刻引起了轰动。
Sora给AI打开了新的想象空间后,产业和资本也在加速拥抱AI产业。
加码AI产业
在Sora面世后的短短数日,就有多家巨头公司表态要加码AI(人工智能)产业。
2月20日,微软总裁布拉德·史密斯在社交媒体平台X上发文称,将在未来两年内投资21亿美元扩大微软在西班牙的人工智能和云基础设施。此前,微软已宣布,未来两年在德国投资32亿欧元(约合34.5亿美元),重点落在人工智能领域。
2月19日,工业机器人巨头ABB宣布收购了一家瑞典初创公司Sevensense,其目的是通过人工智能解决方案来推进向物流业、制造业转型。资料显示,Sevensense成立于2018年,是AMR人工智能的3D视觉导航技术提供商。
最新消息显示,Meta计划在今年将资本开支提高到300亿美元至370亿美元,以加强其在人工智能领域的研究和产品开发。Meta还表示,未来人工智能模型的训练和操作将更加需要算力。
乘着Sora的东风,部分一级市场项目获得知名PE青睐。日前有报道称,大语言模型初创公司月之暗面(Moonshot AI)近期或已完成新一轮10亿美元的融资,投资方包括老股东红杉中国,以及美团、阿里、小红书等互联网背景战投,这也是自ChatGPT面世以来,国内大模型初创公司获得的最大一笔融资。
国产人工智能大模型持续迭代升级
人工智能是模拟、延伸和拓展人的智能技术。简单来说,就是让机器学习人类的智慧,能够像人一样做出智能化的反应。人工智能是引领未来的战略性技术,是新一轮科技革命和产业变革的核心驱动力,被认为是发展新质生产力的主要阵地。
过去的2023年,生成式人工智能无疑是最耀眼的“科技明星”。国产人工智能大模型持续迭代升级,其自然语言交互与多场景内容的生成能力逼近人类。近十年,我国人工智能相关企业注册量也呈持续正增长态势。
数据显示,我国现存人工智能相关企业160.87万家。2020年,我国新增人工智能相关企业19.59万家,同比增长167.21%,达近十年增速峰值。2021—2023年,我国人工智能相关企业年注册量呈高速增长态势,分别新增36.5万家、42.82万家、53.27万家,同比增长86.29%、17.31%、24.41%。
从区域来看,广东现存23.11万家人工智能相关企业,位居第一。山东、江苏分别现存12.73万家、12.55万家人工智能相关企业,位居前三。此后是浙江、北京、海南等地。
赛迪在2024年1月举办的“2024年IT趋势发布会”上指出,我国人工智能产业将在未来10年至15年取得长足发展,多项产业要素全球领先。预计到2035年,中国人工智能产业规模将达1.73万亿元,全球占比达到30.6%。
多家上市公司已经布局
2月19日,国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会,强调中央企业要把发展人工智能放在全局工作中统筹谋划,深入推进产业焕新,加快布局和发展智能产业,包括加快建设一批智能算力中心,开展AI+专项行动等。
随着Sora面世带来的革命性机遇,一些在AI产业链有前沿技术布局的上市公司已具备先发优势。
拓维信息作为中国领先的国产软硬一体产品及服务提供商,在算力底座搭建上已初具成果。公司董秘邢霓虹介绍:“公司在3年前便提前卡位‘东数西算’国家级算力枢纽节点,布局了贵州、甘肃、重庆等地,兆瀚智能计算硬件产品也参与了三大运营商的全国一体化算力网络建设。今年公司在山东、江西、重庆等地进行了新的战略落点,未来将持续依托算力、数据和算法积累,以‘大算力+大模型’卡位AI赛道,构建基于AI的差异化竞争优势。”
景嘉微专注于国产GPU芯片的研发与产业化,在AI芯片赛道处于领先地位,公司相关负责人介绍:“目前,公司已成功研发以JM5系列、JM7系列和JM9系列为代表的三代国产GPU芯片,第一代JM5系列、第二代JM7系列主要聚焦在图形渲染领域,第三代JM9系列芯片除了在传统图形渲染领域继续耕耘外,开始涉足计算领域,支持包括目标识别等在内的部分人工智能应用需求。”
万兴科技作为国内AIGC(生成式人工智能)行业龙头,在今年1月份发布了国内首个音视频多媒体大模型——万兴“天幕”,并宣布大模型研发中心正式落户马栏山,深入赋能音视频文创生态。万兴科技董事长吴太兵在发布会上表示,天幕大模型实现了从多模态向多媒体、从通用向垂直解决方案、从全球向本土化的三大转变,将打造基于大模型架构的AIGC应用基础底座,全链路赋能全球创作者。
面对Sora带来的广阔市场空间,AI产业链上市公司应如何深化布局?对此,中国信息协会常务理事朱克力建议:“一方面公司应紧跟先进AI模型的技术趋势,加大在AI芯片、算力等领域的研发投入,力争在关键技术和产品上取得突破;另一方面,公司还应积极寻找与Sora等AI模型相契合的应用场景,通过与各行业领先企业的深度合作,共同推动AI技术在各领域的广泛应用和落地。”
中央财经大学数字经济融合创新发展中心主任陈端表示:“Sora作为内容导流入口与各类消费场景、研发设计场景的结合,想象空间很大。在早期,游戏、影视、数字营销领域可能作为容错度较高的产业级落点,长期来看,随着其精度提升将激活更广泛的产业级应用,如创意素材库的搭建生成乃至反向定制、音视频版权的交易服务等,将延展为更多精深型内容服务价值网,并促进更多商业模式创新。”
延伸阅读:Sora的发布有望对AI产业带来再一轮爆发式的增长
尽管Sora并非首个文生视频大模型,但其诞生仍被认为具有里程碑意义。
据不完全统计,截至去年年底,全球能实现文本生成视频的大模型包括Runway、Pika、Stable Video Diffusion等20多个产品。而Sora的特别之处在于:超长生成时间。
IDC中国研究总监卢言霞在接受媒体采访时指出,尽管目前Sora尚未正式对外开放使用,也无法了解到更多技术细节,但可以确定的是这一波技术迭代将为AI行业参与者带来可观的机遇。她预测,其有可能最先应用于短视频、广告、互娱、影视、媒体等领域,在这些领域采用多模态大模型能力,辅助人类员工生成视频,既可以提高生产速度又可以提高生产数量,还可以创造全新的视觉感受,能够帮助企业真正实现降本增效、提升用户体验。
“大语言模型为AI产业带来新的生机,然而语言模型的应用场景有限。要全面打开生成式AI的想象力,还是要依托多模态大模型。Sora的发布以及后续科技巨头的跟进,有望对AI产业带来再一轮爆发式的增长。”卢言霞表示。
此外,多模态大模型也将带来更严峻的安全方面的挑战。卢言霞认为,一方面多模态大模型将读取更多的图像、视频类数据,这些图像视频数据是否合规是否安全,需要得到保障;另一方面,生成的视频与真实世界之间的差异,是否会影响到人身安全、社会稳定、企业安全等,也需要注意。另外,多模态大模型对算力的消耗更高,算力的可获取性以及成本将是挑战之一。顶尖的大模型研发人才,也是行业发展的稀缺资源。在多模态大模型领域,有数据资源的企业可以考虑如何将这些数据开发成可供模型训练的数据产品,缺乏数据资源的企业也需要尽早收集能够获取到的数据源。