当前位置:首页|资讯|OpenAI|百度|Sora|文心大模型

AI专题:AI行业正发生哪些新变化?(附下载)

作者:烟树晚雁发布时间:2024-03-02

原标题:AI专题:AI行业正发生哪些新变化?(附下载)

今天分享的是AI系列深度研究报告:《AI专题:AI行业正发生哪些新变化?》。

(报告出品方:兴业证券

报告共计:20

海量/完整电子版/报告下载方式:公众号《人工智能学派》

行业周观点

核心观点:政策及技术红利加持,AI续力板块预期提摄。

板块迎政策及技术红利加持,继续把握做多窗口。本周,政策与技术红利持续释放。在政策端,国资委召开央企 AI赋能推进会,国家数据局等联合发布《关于开展全国数据资源调查通知》;在技术端,OpenAI发布的 Sora 大模型等进一步推动全球 AI产业景气度提升。当前,板块估值性价比仍然较高,继续建议积极布局。

AI全产业链景气加速,把握海内外共振投资机会。AI产业链进一步景气加速:1)Sora 大模型横空出世,代表了文生视频领域的重大突破,同时掀开了对算力需求的进一步抬升;2)英伟达 202304 财报继续高增长,显著高于公司前期指引。受 AI产业链全球共振影响,国内AI产业链的市场预期有望持续提升。

本文第二章,对全球AI产业的最新进展做了深度跟踪分析。

AI 行业正发生哪些新变化?

2.1 算法:Sora 横空出世,多款大模型陆续发布。

Sora:文生视频功能强大,AIGC 步入“世界模型”新纪元。

2024 年 2 月 16 日,OpenAI 发布文生视频模型 Sora,视频时长可达 60S,较此前 发布的 Pika、Runway 等,视频时长、效果有明显提升。

1)模型能力:①视频生成:生成多种尺寸视频,适配各类设备;②视频合成:时 间延伸、场景替换及无缝连接;③图片生成:分辨率最高可达 2048x2048。此外, 随着规模效应逐渐显现,以构建“世界模型”为目标的 Sora 有望涌现出物理世界拟 真能力,该过程与 GPT-3 展现出的类比推断能力相似。

2)核心技术:①视频压缩网络技术,将视频数据压缩,以提升训练的速度和质量。 ②利用 ViT 处理,将数据再次分解为携带时空信息的 Patches,并引入 NaViT 架构 以适应多种分辨率、持续时间与纵横比。③通过 DiT 模型从“随机噪声”开始逐步 “消噪”,最终生成与文本提示接近的视频内容。④此外,引入入 DaLL-E 与 GPT 模型框架,提升模型的理解能力。

Meta:开源视频预测模型 V-JEPA,目标“以人类的方式”理解世界

2024 年 2 月 16 日,Meta 推出全新的视频预测模型 V-JEPA。这是继 2023 年 6 月 Meta 开源图像预测模型 I-JEPA 后、基于“世界模型”概念的模型。Meta 称其能够 以人类的理解方式看世界,认为这是通向先进机器智能的关键一步。V-JEPA 基于 Transformer 和 LeCun 提出的联合嵌入预测架构(JEPA),采用自监督的学习方式, 完全依靠未标记的数据进行预训练,无需微调,以此构建了理解世界运行的能力。 此外,该模型还结合了掩码策略,提升预测能力。Meta 表示下一步研究方向将包 括处理视频中的视觉、音频信息的多模态方法。V-JEPA 等世界模型有望推动具身 AI、AR 眼镜、个人助理应用的发展。

Groq:每秒输出 500 Token,Groq 自研 LPU 引发广泛关注

2024 年 2 月 19 日,硅谷初创企业 Groq 发布专为大模型设计的推理芯片 LPU,每 秒可吞吐高达 500 个 Token,引发业内广泛关注。目前在 Groq 官网基于 LPU 运 行的大模型为 Mixtral 与 Llama 2 模型,其在计算和响应速度上的表现处于业内前 列。目前 Groq 不出售单卡或芯片,而是利用从芯片到系统的完整技术栈与规模效 应,获取单位价格优势,并计划优先部署 B 端市场。

国内:大模型能力不断迭代,性能向 GPT 4 趋近

2023Q4 以来,国产 AI 大模型迎来密集升级,百度文心 4.0、智谱 GLM4 等在 SuperCLUE、OpenCompass、IDC 等评测榜单中均排名前列。评分方面,2023 年 12月国产大模型平均评分为GPT4评分的79.47%水平,明显超出GPT3.5的分数。 2023 年 10 月 17 日,百度文心大模型 4.0 发布,实现了基础模型的全面升级,在 理解、生成、逻辑和记忆能力上有明显提升。李彦宏表示文心 4.0 综合水平“与 GPT4 相比毫不逊色”。2024 年 1 月 16 日,智谱 AI、Minimax 推出新版本大模型产品。 1 月 30 日,科大讯飞发布讯飞星火 V3.5,并设立了在 2024 年上半年对标 GPT-4 的目标;万兴科技于同日发布“天幕”多模态大模型,视频生成能力持续提升。

报告共计:20页

海量/完整电子版/报告下载方式:公众号《人工智能学派》


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1