当前位置:首页|资讯|ChatGPT

【汇正财经】Pika 1.0 再掀 AI 视频热潮,多模态技术路径仍有探索空间

作者:汇正财经发布时间:2024-01-16

原标题:【汇正财经】Pika 1.0 再掀 AI 视频热潮,多模态技术路径仍有探索空间

事件:AI 文生视频软件 Pika 1.0版本发布,热度迅速席卷全网。Pika 成立于今年 7 月,Pika 1.0 是其第一个正式推出的版本,能够根据文字自动生成和编辑 3D 动画、动漫、卡通和电影,还能够支持对于视频的实时编辑和修改。

近期 AI+视频方向更新频发。

11 月以来,海外在 AI 生成视频领域的动作进展较快。11 月 3 日,Runway 发布 Gen-2 模型更新,把生成的视频清晰度提升到了 4K 精度,改进了结果的保真度和一致性。并随后在 11 月 20 日上线了运动笔刷功能,只需对着图像任意位置一刷,就能让静止的一切物体动起来;11 月16 日,Meta 发布了 Emu Video,能够基于文本和图像输入生成视频剪辑;11 月 18 日,字节跳动发布 PixelDance,在生成视频的动态性上得到了显著提升;11 月 21 日,Stability AI发布了自家的生成视频模型 Stable Video Diffusion,支持文本到视频、图像到视频生成,并且还支持物体从单一视角到多视角的转化,也就是 3D 合成。

▍文生视频 Pika 1.0 发布,AI 影像热潮再起。

11 月 29 日,AI 文生视频软件 Pika 1.0版本发布,热度迅速席卷全网。Pika 成立于今年 7 月,Pika 1.0 是其第一个正式推出的版本,能够根据文字自动生成和编辑 3D 动画、动漫、卡通和电影,还能够支持对于视频的实时编辑和修改。 Pika 的创始人是两位斯坦福大学人工智能实验室的前博士生郭文景和 Chenlin Meng,目前 Pika 已融资 3 轮,估值超过 2 亿美元。到现在为止 Pika 已经有了 50 万用户。

大语言模型技术路径已收敛,而视频生成模型仍处于探索期。在 OpenAI 的技术方向引领下,目前语言模型的技术路径基本就是 GPT 这一条路。而多模态技术方面,目前没有一家公司处于绝对领先地位,技术路径仍存在探索的可能。AI 视频的生成面临流畅性、帧生成逻辑、协调性等等问题,模型需要生成每一帧发生的事情,而用户的 prompt 往往非常简略,无法像图像生成一样为每一帧提供详细的描述,种种原因都导致了目前 AI 视频生成技术仍无法做到非常完美,技术路线也多种多样。

语言模型是对物理世界的抽象描述,多模态数据能够更真实反映物理世界属性,能感知真实物理世界的多模态模型应用前景更加广阔。

语言作为一种精炼的表述载体,可以对物理世界进行抽象描述,例如文生图和文生视频中,用户都可以用简短的一句话或者几句话来对想要生成的图像或视频进行描述。但是从承载的信息量来讲,语言所能承载的信息是远远不及图像和视频的。而多模态的数据例如图像、视频、音频、振动等信息,则更加能反映出物理世界的真实属性,是真正对于物理世界状态的感知,与人类感知世界的方式更加接近。我们认为,未来的多模态模型将能够真正实现对世界状态的完整感知,也因此能具备更多的应用场景。

多模态是生成式 AI 下一步重点方向,百花齐放的应用场景有望探索。

现阶段大语言模型的竞争已经非常激烈,从技术突破的角度来看,我们认为,下一阶段的重点攻克方向必然会是多模态技术。能够真正处理和应用好多模态 AI 能力,才能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互。因此,基于多模态的应用场景仍需不断探索,AI 视频生成仅仅是多模态技术路径中的一个小方向,多模态领域的 ChatGPT 时刻还未到来。

投资策略及建议:

建议关注海康威视(002415,买入)(电子组覆盖)、大华股份(002236,买入)(电子组覆盖)、萤石网络(688475,未评级)(电子组覆盖)、中科创达(300496,买入)、虹软科技(688088,未评级)、科大讯飞(002230,买入)、万兴科技(300624,未评级)等公司

参考资料: 东方证券《计算机行业Pika 1.0 再掀 AI 视频热潮,多模态技术路径仍有探索空间》

市场有风险,投资需谨慎。本文仅为投资者教育使用,不构成任何投资建议,投资者据此操作,风险自担。力求本文所涉信息准确可靠,但并不对其准确性、完整性和及时性做出任何保证,对投资者据此进行投资所造成的一切损失不承担任何责任。

免责声明

本文由汇正财经的投资顾问:顾晨浩(登记编号:A0070620080002)进行编辑,仅供参考,请自主决策,风险自担。投资有风险,入市需谨慎!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1