文生视频大模型Sora的发布引发热议,人工智能将如何影响世界?那些趋势值得关注?本期我们邀请到国金证券计算机首席分析师孟灿,一起解读相关热点话题。
1.最先看到Sora生成视频的感受如何?如何看待Sora在文生视频领域取得的突破?
看完感觉到惊艳的有两点:第一点是整个生成的视频时长有明显提升,像之前Runway,Pika都是3-4秒钟(升级之后到18秒),但是Sora可以直接生成60秒视频内容。第二点是尽管对物理世界规律的理解上可能还存在小偏差,但总体上呈现出较好的前后一致性。这应该是多种技术的结合,起到了比较好的效果,所以目前还是蛮不错的状态,相信未来在内测版本基础上进一步的改善和提升,会呈现出更惊艳的效果。
2.如何看待Sora背后有限的能力给各行业带来的影响。如果从投资的角度来看,您觉得可能会存在哪些商业机会和投资机会?
首先从商业角度,在广告,短视频,游戏,影视等维度都有很多可以结合的点,这是从落地应用的角度观察到的一些机会。第二点是AI落地的过程会带动上游投资,比如芯片、光模块等等,这也是资本市场比较关注的范畴。第三点是跟硬件的结合,这与中国的商业环境和能力有关,我们拥有工程师红利,比较擅长大规模制造,有效率和良率优势、规模效益、成本优势等,在以前AI落地的过程中也有与视频感知类设备等硬件的共振,目前主流手机厂商、PC 厂商也积极地拥抱AI浪潮,主推AI iPhone、AI PC产品。
所以从上游的芯片,光模块等关键元器件,再到中游环节的类似的国产模型的跟进,再到下游落地应用环节与广告,游戏,影视等场景的结合,以及另外与科技硬件制造的结合,这些方面都存在一些机会。
3.从近期A股市场的表现来看,Sora概念股的表现十分亮眼,有十余家上市公司对此进行了回应,如何看待国内外企业在文生视频领域的布局和目前的一些差异?
从几个维度来讲,第一,上游的芯片、模型等维度我们还是有差距的,包括本身技术投入和时差上的问题,也有大国之间竞争受到门槛和约束的问题。第二,我们本身处在跟随和跟进的状态,需要观察以美国为代表的前沿动态,一级市场、创业公司、行业巨头的动作,再相应做跟进。同时因为监管和审核的问题,可能会形成一些时差。第三,在应用和结合落地的过程中间有很多Know how调优、改善和提升的过程。所以从这几个维度综合来看,差距是不可避免存在的。可能会阶段性呈现出我们比上不足,比下有余的状态,全球基本只有中美两国能形成比较完善的产业链支持、人才和资金的投入、强烈的关注度来形成合力,所以从这个角度,不必过度悲观,还是有生存空间的,而且人工智能的结合跟很多场景、高质量数据等各种因素有关,会有解决应用落地过程中间的一些问题,在这一方面我们还是有相应的优势。
从上市公司的维度上讲,有一些公司具备相应能力建设,当然也不是说跟Sora完全直接可比。比如万兴科技,在22年底就已经把文生图甚至文生视频的能力结合到了产品中,还进行了提价,因为它本身是面向中小网红或者工作室做视频编辑软件,收入八九成来自于海外,有得天独厚的条件。国内像虹软科技,宇视的“梧桐”大模型,其实也有一些类似于商拍性质的一些产品在推出,在电商、文旅的场景都有一些落地的探索。所以从个案的角度来看,国内有企业在推进并且落地。当然还有一些企业可能具备一定的技术能力或者进行了一定的内部探索和尝试,不过从落地案例的角度可能再稍微靠后一点。
4.从文生文到文生图到文生视频,如何看待本轮AI应用端的一个发展实践?
第一点,我觉得本身它是一个层层递进的关系,就比如从PC时代的互联网,到手机时代的互联网,再到移动互联网,实际上也是从文字到图片到视频逐步演进的过程。像早期的门户网站,到后来的视频网站,再到抖音、快手APP,也是遵循这个过程,由简到难,或者说是由普通到复杂。第二点,随着能力的改善和提升,它与应用落地结合变现的价值也是在提升的。第三点在于能力的优化,AI与MR等结合会有比较多的使用空间。不管是面向B端的数字孪生还是面向C端的虚拟现实游戏,通过AI去生成一些内容,然后进行训练和优化提升等等。另外,在现实世界中与具身智能、智能驾驶的结合会有很多可以让大家期待的点。以上是从文本到图片到视频的进化过程可以带来的更多空间。
5.除了open AI此次发布的文生视频大模型Sora,谷歌也在同时期发布了最新的多模态大模型jimmy1.5,包括英伟达也公布了自己的本地聊天机器人chat with RTX。如何看待当前AI产业的发展,为什么sora能够从这些应用中脱颖而出?
第一,我觉得是因为Sora更贴近C端,跟普通用户日常的结合点会更多,并且展现形式比较直观,以视频形式将内容呈现,有沉浸和代入感。第二,Sora潜在的落地应用比较好去变现,同时所呈现出的效果与去年同时期产品相比有比较惊艳的表现。
6.如何看待Sora给我们普通人带来的机遇和挑战,作为专业人士可否给到一些建议?
第一,技术的进步本身也代表着产业的升级和变迁,像早期蒸汽机和火车的发明替代了马车夫和纺织工,实际上并没有形成大面积失业和社会困难,因为一些传统行业的从业人员可能进入到其他领域。技术之所以能够大规模商业化变现,长期推动社会的进步发展,是因为它能从重复、普通的基础工作中解放我们的时间和脑力去做更有意义的工作。假设现在人工智能的发展取代了一些相对标准化的工作,就可能把其中一些人的聪明才智和时间释放出来去进行更高环节的工作,比如医药行业,人们可以专注于发现更多可以治疗某些疾病的新靶点,而不是重复一万次实验寻找可能治理这个病种的方案。用AI进行药物合成的筛选,这已经是在进行落地的案例了。总之,AI会带来时间、精力和脑力的释放。
第二,AI带来的是产业结构的变化和升级,所以对经济体来说是正面的,对个体来说需要去学习和进化。我们要顺应技术浪潮和历史潮流而动,不能失去学习能力。我们应该回避掉一些简单重复劳动,去更多地开发一些偏思维、难以被技术和机器简单替代的工作。另外,随着人工智能的发展,又会衍生出很多新的工作机会,从这个视角上讲,我们应该怀有拥抱变化的心态,不断进化自己,可能是相对更加合理的一个态度。
7.对于人工智能当前发展或者是未来发展中面临的一些问题,有没有一些个人比较关注的,包括您是否有一些建议可以分享?
之前我们也写过这方面的研究报告,关于AI对安全领域的正面作用和负面风险。从正面的角度上来讲,它促进了攻防能力的升级,可以进行攻防两端的赋能,提升主动化、智能化、自动化的能力,然后完善攻防方案,提升防护能力。另外,对网络安全行业有降本增效的支撑。从风险不确定的角度,模型算法本身可能不可靠、不安全、可解释性不足,或者鲁棒性比较差。另外,还有数据安全的问题,海量数据的生成,采集,存储和使用的过程中间存在一些数据安全、隐私保护问题。另外AI技术滥用可能会提升不法分子网络安全攻击能力,通过生成视频去进行AI欺诈。前一阵子泰勒斯威夫特被生成内容不合法的视频传播,最终引起了美国政府的关注。现在国内的一些上市公司,像美亚柏科(国投智能),也有相应的解决方案,进行AI生成内容的鉴别,识别它存在欺诈的可能性,所以也是一个矛和盾的关系。
8.展望一下2024年您如何看待国内外AI产业的发展,会有哪些发展趋势值得我们持续关注。
2024年还是围绕着几个关键环节。第一是上游芯片、光模块这些关键环节会有更多升级和进步。最近很多人关注新的芯片架构对GPU带来的影响,说明了对于上游的需求迫切度和对于成本的关切。第二个方面是模型本身的升级。经过去年持续的迭代,大家一方面希望看到主流的大模型有更多惊艳的表现,另外在功能性领域比如Sora,尤其是多模态大模型的环节会不会有新的发展和进步。第三,从投资上讲,会关注落地应用的过程。根据过去一年中用户数据排名靠前的2000多个应用来看,如果使用通用的数据,马太效应比较明显,即后来者去做颠覆和赶超有一定难度,但是在垂类的领域,领先和落后公司之间用户数据差异不大,所以还存在一些变数。像前面我们讲到的,要结合各个国家自己的特点、数据、行业场景、Know-How去进行落地,所以垂类的机会会比较丰富。我倾向于会有类似于各个领域专家大模型去结合落地,而不是一个通用的模型去包打天下。另外, AI Agent的发展、具身智能、各种形态机器人的落地,智能驾驶等等,甚至与硬件的结合,像AI iPhone、AI PC,应该也是比较重要的视角和方向。
计算机团队最新研究成果
1. 《信息技术双周报:AI持续迭代,看好AI落地带来的投资机会》
2. 《计算机行业周报:本周加密货币市值持续上涨,交易额同比增长36.1%》
3. 《信息技术产业行业周报:Open AI文生视频Sora惊艳亮相,看好Ai受益产业链》
4. 《计算机深度研究:Sora开启创意领域iPhone时刻,关注文生图/视频投资机会》
5. 《计算机行业深度研究:AI应用落地的商业模式探索》