一起学习ChatGPT,共同探索成长。
观点来源:证券研究报告
大模型提升机器理解能力,优化人机交互方式。
AI 大模型是实现通用人工智能(AGI)的重要方向,包含自然语言处理(NLP)、计算机视觉(CV),多模 态大模型等。ChatGPT 推出两个月 MAU 突破 1 亿,是自然语言处理领域突破 性的创新,大力出奇迹后出现涌现能力,更理解人类语言。大模型“预训练+ 精调”即可对下游应用赋能。我们认为大模型优化人类与机器交互方式,是 效率的革命。大模型是“大数据+大算力+强算法”结合的产物,对比国内外 大模型,算力储备上国内并无短板;算法上 OpenAI 有先发优势;前期数据的 丰富度和量对大模型的训练至关重要。
百度文心大模型:包含 NLP、CV 等在内的系列大模型。
文心大模型包含 NLP 大模型、CV 大模型、跨模态大模型、生物计算大模型、行业大模型等。与 Bing 类似,文心一言有望优化 C 端用户搜索、创作体验;ToB 方面,百度已 开放大模型 API 接口,在文案、AI 作画、开放域对话方面赋能企业。对于具 体行业,百度推出文心行业大模型,以“行业知识增强”为核心特色。
阿里巴巴通义大模型:由通义-M6 模型融合语言模型和视觉模型组成,率先 应用在硬件终端天猫精灵和软件通义千问。
通义大模型包括统一底座 “M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大 模型”,以及行业层面的不同垂直领域专业模型。在应用上,天猫精灵基于 通义大模型推出拟声助手“鸟鸟分鸟”;对话式通义千问已经开始内测。
腾讯混元大模型:采用热启动降低训练成本,文字视频等多领域表现优异, 已在广告游戏等多场景落地。
目前腾讯混元大模型已在腾讯广告、内容创作、 游戏、对话式智能助手等方面实现落地,大幅提升工作效率并降低成本。
华为盘古大模型:基于 ModelArts 研发设计的系列模型,在物流、药物研发、 气象预测等多领域已实现落地。
目前盘古 CV 大模型已覆盖了物流仓库监控 等领域;NLP 大模型覆盖了智能文档检索、智能 ERP 和小语种大模型;科学 计算大模型则应用于气象预报、海浪预测等方面。
字节跳动 AI 探索基础扎实,在语言大模型和图像大模型初步布局。
字节跳 动 AIGC 大模型将从语言和图像两种模态发力,预期在今年年中推出大模型。 字节跳动在算力、算法、数据方面并无短板。目前模型可用于图文、视频内 容生成等,飞书将推出智能 AI 助手“My AI”。
当前,各家公司开展新一轮 AI 模型竞赛,希望借助大模型开展 “模型即服务”的范式。算力、算法、数据是大模型能否成功的重要因素, 重点关注在大模型领域有技术储备的国内公司腾讯控股、阿里巴巴、百度等。 风险提示:AI 技术迭代进度不及预期;AI 应用落地进度不及预期;政策风险;供应链风险等。
AI大模型是实现通用人工智能(AGI)的重要方向AI大模型是实现通用人工智能(AGI)的重要方向。
AI大模型是基于海量多源数据打造的模型。AI大模型具备通用、可规模化复制等诸多优势,是实现AGI(通用人工智能)的重要方向。AI大模型当前包含自然语言处理(NLP)、计算机视觉(CV)等,统一整合的多模态大模型等。
ChatGPT推出两个月MAU突破1亿,是自然语言处理领域突破性的创新,进一步理解了人类语言。
大语言模型(LargeLanguageModel,LLM)是一种使用了大量数据训练的深度学习算法,构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT在2022年11月底推出后,2023年1月的月活跃用户数已达1亿,成为历史上用户增长最快的应用。ChatGPT的自然语言处理能力超越了以往的自然语言处理模型,可以应对各种自然语言处理任务,包括机器翻译、问答、文本生成等。
大模型借助“预训练+精调”等模式,用相比较大模型更少量的数据即可对下游应用赋 能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下,借助“预 训练+精调”等模式,应用模型用相比较大模型更少量的数据即可进行相应微调,高水 平完成细分应用的任务。
通义大模型最早发布于2022年9月2日,在阿里达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上。通义大模型实际上是由一系列模型组成,包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。
“混元”AI 大模型由 TEG 数据平台部和机器学习平台部联合主导,涵盖计算机视 觉、自然语言处理、多模态内容理解、文案生成、文生视频等方向。“混元”AI 大模型由腾讯 17 级研究员/杰出科学家(腾讯史上最高专业职级)张正友博士带 队,2022 年 4 月公司首次披露研发进展,目前已更新至 2.0 版本。 性能上看,“混元”大模型在文字、视频等多个领域表现优异。其中 HunYuan-tvr 模型 在文字 和视频在全球 最具权威的 MSR-VTT,MSVD,LSMDC,DiDeMo 和 ActivityNet 五大跨模态视频检索数据集榜单排名第一,实现该领域的大满贯; HunYuan-NLP 1T 模型在 CLUE(中文语言理解评测集合)总榜、分类榜和阅读理解 榜排名第一。
华为盘古大模型 模型简述:基于 ModelArts 研发设计的系列模型,NLP、CV 等方 向性能优越
“盘古”大模型由计算机视觉(CV)大模型、科学计算大模型、自然语言处理(NLP) 大模型、多模态大模型组成,该模型由华为云人工智能领域首席科学家田奇带领 的华为云 EI 盘古团队主导设计。“盘古”项目自 2020 年 11 月起立项,2021 年 4 月在华为开发者大会上首次正式发布,2023 年 4 月 8 日,团队介绍了盘古模型的 应用进展,包括模型在物流、药物研发、气象预测等领域的落地。 盘古模型基于华为一站式 AI 开发平台 ModelArts 进行研发。ModelArts 是华为开 发的 AI 生产线,具备持续构建大模型训练及推理加速能力、分布式训练能力等, 并提供数据处理、算法开发、模型训练、模型管理、模型部署等 AI 应用开发全流 程技术能力
根据 36 氪消息,字节跳动证券研究报告 在大模型上已有所布局,分别在语言和图像两种模态上发力,预期是在今年年中 推出大模型。
字节跳动 AIGC 大模型尚在初期探索阶段,有一定 AI 基础。根据 36 氪,在 ChatGPT 公开前,字节跳动对大模型的投入存疑。但字节跳动在工程团队和云服务团队方 面并无短板。
1)算力:字节并不缺 GPU。字节旗下的企业技术服务平台火山引擎,在 2021 年 正式进军基础云市场(IaaS 层),为大模型所需的算力奠定了基础。4 月 18 日, 火山引擎发布自研 DPU 等系列云产品,并推出新版机器学习平台:支持万卡级大 模型训练、微秒级延迟网络,弹性计算可节省 70%算力成本。同时,火山引擎宣 布与字节跳动国内业务并池,抖音等业务的空闲计算资源可极速调度给火山引擎 客户使用。
2)算法:阿里巴巴 M6 大模型的原带头人杨红霞现已加入字节 AI Lab(人工智 能实验室),参与语言生成大模型的研发。
模型应用:可用于图文、视频内容生成等,飞书将推出智能 AI 助手“My AI” 抖音、今日头条基于 AIGC 生成图文内容。
在 AIGC 的加持下,用户上传照片后, 短时间内系统即可自动生成不同风格的图片。例如,抖音上线该“漫画脸”特效 后,吸引了大量用户,据抖音平台数据显示,截至 2022 年 12 月 6 日,该特效已 经超 2428 万人使用,并迅速飙升至特效潮流榜 TOP1。
ChatGPT 的涌现能力的实现以及应用成功,使得 AI 产业发展进入新阶段。AI 大模 型增强机器理解能力,可以优化人类与机器交互方式,是效率提升的革命。大模 型“预训练+精调”即可对下游应用赋能。当前,各家公司开展新一轮 AI 模型竞 赛,希望借助大模型能力开展“模型即服务”的范式。算力、算法、数据是大模 型能否成功的重要因素,我们重点关注在大模型领域有技术储备的国内公司腾讯 控股、阿里巴巴、百度等。
一起学习ChatGPT,共同探索成长。