AI大模型超配 ChatGPT 取得突破性进展，2023年互联网行业专题报告讲解

作者：AIGC资源社发布时间：2023-04-27

关注公众号【幻影视界】

一起学习ChatGPT，共同探索成长。

观点来源：证券研究报告

核心观点

大模型提升机器理解能力，优化人机交互方式。

AI 大模型是实现通用人工智能（AGI）的重要方向，包含自然语言处理(NLP)、计算机视觉（CV），多模态大模型等。ChatGPT 推出两个月 MAU 突破 1 亿，是自然语言处理领域突破性的创新，大力出奇迹后出现涌现能力,更理解人类语言。大模型“预训练+ 精调”即可对下游应用赋能。我们认为大模型优化人类与机器交互方式，是效率的革命。大模型是“大数据+大算力+强算法”结合的产物，对比国内外大模型，算力储备上国内并无短板;算法上 OpenAI 有先发优势;前期数据的丰富度和量对大模型的训练至关重要。

百度文心大模型：包含 NLP、CV 等在内的系列大模型。

文心大模型包含 NLP 大模型、CV 大模型、跨模态大模型、生物计算大模型、行业大模型等。与 Bing 类似，文心一言有望优化 C 端用户搜索、创作体验；ToB 方面，百度已开放大模型 API 接口，在文案、AI 作画、开放域对话方面赋能企业。对于具体行业，百度推出文心行业大模型，以“行业知识增强”为核心特色。

阿里巴巴通义大模型：由通义-M6 模型融合语言模型和视觉模型组成，率先应用在硬件终端天猫精灵和软件通义千问。

通义大模型包括统一底座 “M6-OFA”，三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”，以及行业层面的不同垂直领域专业模型。在应用上，天猫精灵基于通义大模型推出拟声助手“鸟鸟分鸟”；对话式通义千问已经开始内测。

腾讯混元大模型：采用热启动降低训练成本，文字视频等多领域表现优异，已在广告游戏等多场景落地。

目前腾讯混元大模型已在腾讯广告、内容创作、游戏、对话式智能助手等方面实现落地，大幅提升工作效率并降低成本。

华为盘古大模型：基于 ModelArts 研发设计的系列模型，在物流、药物研发、气象预测等多领域已实现落地。

目前盘古 CV 大模型已覆盖了物流仓库监控等领域；NLP 大模型覆盖了智能文档检索、智能 ERP 和小语种大模型；科学计算大模型则应用于气象预报、海浪预测等方面。

字节跳动 AI 探索基础扎实，在语言大模型和图像大模型初步布局。

字节跳动 AIGC 大模型将从语言和图像两种模态发力，预期在今年年中推出大模型。字节跳动在算力、算法、数据方面并无短板。目前模型可用于图文、视频内容生成等，飞书将推出智能 AI 助手“My AI”。

当前，各家公司开展新一轮 AI 模型竞赛，希望借助大模型开展 “模型即服务”的范式。算力、算法、数据是大模型能否成功的重要因素，重点关注在大模型领域有技术储备的国内公司腾讯控股、阿里巴巴、百度等。风险提示：AI 技术迭代进度不及预期；AI 应用落地进度不及预期；政策风险；供应链风险等。

大模型概述：大模型提升机器理解能力，优化人机交互

AI大模型是实现通用人工智能（AGI）的重要方向AI大模型是实现通用人工智能（AGI）的重要方向。

AI大模型是基于海量多源数据打造的模型。AI大模型具备通用、可规模化复制等诸多优势，是实现AGI（通用人工智能）的重要方向。AI大模型当前包含自然语言处理(NLP)、计算机视觉（CV）等，统一整合的多模态大模型等。

ChatGPT推出两个月MAU突破1亿，是自然语言处理领域突破性的创新，进一步理解了人类语言。

大语言模型（LargeLanguageModel，LLM）是一种使用了大量数据训练的深度学习算法，构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT在2022年11月底推出后，2023年1月的月活跃用户数已达1亿，成为历史上用户增长最快的应用。ChatGPT的自然语言处理能力超越了以往的自然语言处理模型，可以应对各种自然语言处理任务，包括机器翻译、问答、文本生成等。

大模型应用：“预训练+精调”即可对下游应用赋能，优化人类与机器交互方式

大模型借助“预训练+精调”等模式，用相比较大模型更少量的数据即可对下游应用赋能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下，借助“预训练+精调”等模式，应用模型用相比较大模型更少量的数据即可进行相应微调，高水平完成细分应用的任务。

阿里巴巴通义大模型模型简述：由通义-M6模型融合语言模型和视觉模型组成

通义大模型最早发布于2022年9月2日，在阿里达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上。通义大模型实际上是由一系列模型组成，包括统一底座“M6-OFA”，三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”，以及行业层面的不同垂直领域专业模型。

腾讯混元大模型模型简述：热启动降低训练成本，文字视频等多领域表现优异

“混元”AI 大模型由 TEG 数据平台部和机器学习平台部联合主导，涵盖计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等方向。“混元”AI 大模型由腾讯 17 级研究员/杰出科学家（腾讯史上最高专业职级）张正友博士带队，2022 年 4 月公司首次披露研发进展，目前已更新至 2.0 版本。性能上看，“混元”大模型在文字、视频等多个领域表现优异。其中 HunYuan-tvr 模型在文字和视频在全球最具权威的 MSR-VTT，MSVD，LSMDC，DiDeMo 和 ActivityNet 五大跨模态视频检索数据集榜单排名第一，实现该领域的大满贯； HunYuan-NLP 1T 模型在 CLUE（中文语言理解评测集合）总榜、分类榜和阅读理解榜排名第一。

华为盘古大模型模型简述：基于 ModelArts 研发设计的系列模型，NLP、CV 等方向性能优越

“盘古”大模型由计算机视觉（CV）大模型、科学计算大模型、自然语言处理（NLP）大模型、多模态大模型组成，该模型由华为云人工智能领域首席科学家田奇带领的华为云 EI 盘古团队主导设计。“盘古”项目自 2020 年 11 月起立项，2021 年 4 月在华为开发者大会上首次正式发布，2023 年 4 月 8 日，团队介绍了盘古模型的应用进展，包括模型在物流、药物研发、气象预测等领域的落地。盘古模型基于华为一站式 AI 开发平台 ModelArts 进行研发。ModelArts 是华为开发的 AI 生产线，具备持续构建大模型训练及推理加速能力、分布式训练能力等，并提供数据处理、算法开发、模型训练、模型管理、模型部署等 AI 应用开发全流程技术能力

字节跳动大模型模型简述：AI 探索基础扎实，语言大模型和图像大模型初步布局字节跳动 AIGC 大模型将从语言和图像两种模态发力。

根据 36 氪消息，字节跳动证券研究报告在大模型上已有所布局，分别在语言和图像两种模态上发力，预期是在今年年中推出大模型。

字节跳动 AIGC 大模型尚在初期探索阶段，有一定 AI 基础。根据 36 氪，在 ChatGPT 公开前，字节跳动对大模型的投入存疑。但字节跳动在工程团队和云服务团队方面并无短板。

1）算力：字节并不缺 GPU。字节旗下的企业技术服务平台火山引擎，在 2021 年正式进军基础云市场（IaaS 层），为大模型所需的算力奠定了基础。4 月 18 日，火山引擎发布自研 DPU 等系列云产品，并推出新版机器学习平台：支持万卡级大模型训练、微秒级延迟网络，弹性计算可节省 70%算力成本。同时，火山引擎宣布与字节跳动国内业务并池，抖音等业务的空闲计算资源可极速调度给火山引擎客户使用。

2）算法：阿里巴巴 M6 大模型的原带头人杨红霞现已加入字节 AI Lab（人工智能实验室），参与语言生成大模型的研发。

模型应用：可用于图文、视频内容生成等，飞书将推出智能 AI 助手“My AI” 抖音、今日头条基于 AIGC 生成图文内容。

在 AIGC 的加持下，用户上传照片后，短时间内系统即可自动生成不同风格的图片。例如，抖音上线该“漫画脸”特效后，吸引了大量用户，据抖音平台数据显示，截至 2022 年 12 月 6 日，该特效已经超 2428 万人使用，并迅速飙升至特效潮流榜 TOP1。

最好建议

ChatGPT 的涌现能力的实现以及应用成功，使得 AI 产业发展进入新阶段。AI 大模型增强机器理解能力，可以优化人类与机器交互方式，是效率提升的革命。大模型“预训练+精调”即可对下游应用赋能。当前，各家公司开展新一轮 AI 模型竞赛，希望借助大模型能力开展“模型即服务”的范式。算力、算法、数据是大模型能否成功的重要因素，我们重点关注在大模型领域有技术储备的国内公司腾讯控股、阿里巴巴、百度等。

完成完整PDF电子版，请关注公众号【幻影视界】获取