随着科技的飞速发展,人工智能(AI)已经成为了当今世界最为热门的话题之一。紧随ChatGPT之后,OpenAI又推出了视频生成模型Sora,该模型更是将AI技术推到了一个全新的视觉维度。
据悉,Sora建立在过去对DALL·E和GPT模型的研究之上,核心技术是DiT的扩散变压器模型。Sora的发布再一次证明了变压器技术作为一项人工智能的基础技术,在多模态大模型包括视频技术中同样重要。
Sora模型能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景。该模型不仅能理解用户在提示中所要求的内容,还能理解这些事物在现实世界中的存在方式。OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。
Sora的诞生意味着AIGC的时代或许已经来临,Sora这类工具也或许将深远地颠覆未来的内容创作与商业格局。随着文生视频模型Sora的热度持续,资本市场关注度亦水涨船高。业界普遍认为,Sora的面世将对AI产业链带来历史性的变革机遇。
多家上市公司展开布局
苹果将开辟AI新天地
当地时间 2 月 28 日,苹果公司召开了年度股东大会,在会上,苹果公司首席执行官蒂姆-库克再次对苹果公司的人工智能计划发表了看法。
库克表示,公司将于 2024 年在生成式人工智能领域「开辟新天地"」:「我们相信,它将为我们的用户带来变革性的机遇。」
近几个月来,库克多次就苹果公司的人工智能雄心发表愿景。多个传言称,苹果将在 iOS 18 中添加新的生成式人工智能功能,并计划利用人工智能提升许多内置 iOS 应用程序的功能。
微美全息掘金AIGC多模态市场
随着Sora面世带来新的机遇,一些在AI产业链有前沿技术布局的上市公司已具备先发优势。资料显示,上市企业微美全息高度重视各类AI技术的研发和应用,对以Sora为代表的新兴AI文生视频技术平台保持密切关注。
实际上,长期以来微美全息已经组建了AIGC创新应用团队,研发将AIGC技术广泛应用于直播运营、广告投放、语音互动、视频剪辑、内容生产等多种业务场景。微美全息积极探索自身品牌优势、内容优势与前沿科技深度融合,努力实现技术+产业的创新融合。
如今,视频生成模型Sora发布,为AI产业链带来广大机遇和发展,自然成为微美全息广泛关注的焦点。现在微美全息已经布局多模态大模型对AI视频相关研发阶段,包括视觉、语音、文本等多模态信号的融合训练及处理,将实现对视频、3D、游戏、家居等下游应用场景的渗透。
随着AI在多模态视频生成领域陆续实现飞跃式发展,展望未来,微美全息将积极探索视频生成等新兴AI技术在产业领域的落地应用与业态创新,带来更加丰富和多样化的应用场景和更加成熟的商业化模式。
结语
往全球来看,AI改变人类社会的历史进程才刚刚开始,也注定将出现更大的突破,预计2024年以AI为核心的众多相关产业有望被带动。在AI技术高歌猛进之际,如何在AIGC时代保持业务核心竞争力,已成为一众科技公司的灵魂拷问。在这个过程中,拥抱AI技术、搭上AIGC的时代列车已成为行业共识。
总之,可以预见在不久的将来,人工智能将无处不在,推动信息化技能从数字化、网络化,全面进入到智能化时代。因而,未来基于AI的应用场景仍需不断探索,AI视频生成仅仅是多模态技术路径中的一个小方向,多模态领域的ChatGPT时刻还未到来。