当前位置:首页|资讯|Sora

AI 应用专题: Sora、Kimi 等模型产品力快速跃升,AI 大应用时代已来

作者:勇敢的鹏子发布时间:2024-04-03

原标题:AI 应用专题: Sora、Kimi 等模型产品力快速跃升,AI 大应用时代已来

今天分享的是AI系列深度研究报告:《AI 应用专题: Sora、Kimi 等模型产品力快速跃升,AI 大应用时代已来》。

(报告出品方:兴业证券

报告共计: 12

海量/完整电子版/报告下载方式:公众号《人工智能学派》

全球 AI 大模型加速演进,商业变现路径已现

作为本轮 AI 浪潮的大模型领军者,GPT 模型在输出和性能方面表现出色,GPT-4.5 有望年中重磅发布。同时,由于 AI 大模型依赖庞大的算力资源、优秀的 AI 人才、丰富的数据等条件,海外逐渐形成了以微软/OpenAI、谷歌、Meta、AWS 等科 技巨头为代表的竞争格局,Gemini、LLaMA 等模型各有所长,为 AI 应用 搭建基础。此外,GPT Store 的推出和繁荣,降低了应用搭建门槛,AI 平 台变现路径已现。

2024 年以来,SoraKimiPixverse 等爆款产品持续见证了 AI 应用产品力的显著提升

在多模态层面,Sora 驱动多模态大模型进入新阶段,可以直接输出长达 60 秒的视频,不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。Sora 取得的惊艳效果意味着 AI 多模态取得了巨大的进步,将于今年晚些时候正式向公众发布,未来视频、游戏等创作效率有望得到大幅提升。

在输入上下文长度层面,Kimi、 通义千问创造记录。高速增长的长文档处理功能,意味着 AI 模型能够解锁海量的超长任务、复杂任务,快速学习大模型推理、挖掘长篇故事情节中的深层次信息,未来有望更高效地赋能内容创作。

植根庞大内容消费场景,国内 AI 应用端潜力巨大

我国人口基数庞大, 影视、游戏等内容消费场景极为丰富,预计随着国内外基础大模型不断升级优化,围绕 AI 大模型构建 AI 生态应用有望成为未来核心。

影视行业 高度依赖创意和故事讲述,重视原创性和艺术性,AI 可以协助进行内容创作和编辑、提供文案建议,不仅可以提高内容的质量,还能使工作者专注于创意的构思,近期中央广播电视总台密集推出《千秋诗颂》《中国神话》等生成式 AI 作品。

游戏行业也在不断探索和利用 AI 技术辅助进行游戏制作和创作,网易《逆水寒》手游官方发布全新的 AI 影片生成工具 【剧组模式】,只需要打字输入任意角色形象、动作、台词,就可以通过 AI 在游戏内实时生成相应内容,拍摄成片;谷歌 DeepMind 宣布推出 SIMA,一个适用于各种 3D 虚拟环境的通用 AI Agent,可根据自然语言指令在各种视频游戏环境中执行任务,是 AI 游戏领域的一个新里程碑。

爆款产品加速迭代,看好 AI 应用星辰大海

政策端,《政府工作报告》在部署 2024 年工作任务中强调“大力推进现代化产业体系建设,加快发展新质生产力”,并提出“深化大数据、人工智能等研发应用,开展‘人工智能+’ 行动”。

产品端,大模型、多模态等 AI 应用不断突破,自 2023 年 12 月 PIKA 出圈以来,Gemma、Genie、Sora、Stable Diffusion 3 等模型/产品已陆续涌现,见证了 AI 产品力的不断提升与产业链生态的持续丰富。我们坚定地认为,随着 AIGC 技术的持续迭代,未来将会有更多 AI 爆款产品的出现,并持续驱动传媒行情增长。

全球 AI 大模型加速演进,商业变现路径已现

作为本轮 AI 浪潮的大模型领军者,GPT 模型在输出和性能方面表现出色,GPT4.5 有望年中重磅发布。随着基于 Transformer 的大型语言模型(LLM)的兴起, 自然语言处理领域正在快速发展,GPT 模型也是基于这一架构构建的语言模型。 自第一个模型发布以来,OpenAI 一直在多个方面不断改进这个模型。在五年的时间里,模型的大小经历了显著的扩展,从 GPT-1 到 GPT-4 大约扩大了 8500 倍。 训练数据规模、数据质量、数据来源、训练技术和参数数量等方面的持续改进, 使模型在各种任务上表现出色方面起到了关键作用。从 GPT-3.5 开始 GPT 模型从只能输出文本到能输出图片,而 GPT-4 已经迭代至多模态模型。2024 年 3 月 12 日,在搜索引擎 Bing 和 DuckDuckGo 上,已经可以搜到 GPT-4.5 Turbo 的产品页面,页面摘要显示 GPT-4.5 Turbo 将“在速度、准确性和可扩展性方面超越 GPT-4 Turbo”,支持 25.6 万 tokens 的上下文窗口,并拥有截至 2024 年 6 月的最新知识, 表明 GPT-4.5 Turbo 或将在今年 6 月发布。

科技巨头快速迭代 AI 大模型,结合主业各有所长,多模态持续升级

由于 AI 大 模型依赖庞大的算力资源、优秀的 AI 人才、丰富的数据等条件,海外逐渐形成了以微软/OpenAI、谷歌、Meta、AWS 等科技巨头为代表的竞争格局。

与 OpenAI 深度合作的微软正在将 OpenAI 最新大模型 GPT-4 Turbo 集成到自身产品中,在多模态、长文档、知识库等方面全新升级,持续引领行业。

2023 年 12 月 6 日,谷歌正式发布全新原生多模态大模型 Gemini1.0,在大型 语言模型研发被广泛使用的 32 个学术基准测试集中,在其中 30 个测试集的性能超过当前 SOTA 结果,同时在大规模多任务语言理解数据集中得分率高达 90%,首次超越人类专家。谷歌将在其相关产品中全面集成 Gemini 的能力,包括搜索、广告、Chrome、DuetAI 等。

Meta 则押注开源大模型,LLaMA2 已成为最优秀的开源模型之一,改变大模型市场格局,并衍生出过多个应用和项目,但仍与 OpenAI、谷歌 PaLM2 大 模型仍有差距。

亚马逊在 AI 大模型领域起步较晚,当前仍在努力追赶,除了花 40 亿美元投资 Anthropic,还全新自研大模型,内部代号“Olympus”,新模型参数规模或达 2 万亿参数,超过 GPT-4 的参数规模,亚马逊计划接入在线零售商店、Echo 等设备上的 Alexa 语音助手,并为 AWS 平台提供新的功能。

大模型筑基、应用搭建门槛降低,AI 平台变现路径已现

2024 年初,OpenAI 正 式上线 GPT Store,开发者在 ChatGPT 内进入 GPT Store,点击右上角“+Creat”则进入创作界面。创建 GPT 机器人过程非常简洁轻松,只用文字表达,不用任何专业编程技能,普通人均能够完成软件的开发。仅仅两个月的时间,GPT Store 上已经诞生了超 300 万个 GPTs。为激励更多普通用户开发属于自己的 GPT 机器人, OpenAI 表示将推出 GPT 创建者收入计划,应用创建者将根据用户与 GPT 的互动程度获得报酬,标志着 OpenAI 从人工智能模型提供商向平台演变迈出的一大步。

报告共计:12页

海量/完整电子版/报告下载方式:公众号《人工智能学派》


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1