当前位置:首页|资讯|AI大模型|ChatGPT|百度|阿里巴巴|腾讯

AI大模型超配 ChatGPT 取得突破性进展,2023年互联网行业专题报告讲解

作者:AIGC资源社发布时间:2023-04-27

原标题:AI大模型超配 ChatGPT 取得突破性进展,2023年互联网行业专题报告讲解

关注公众号【幻影视界】

一起学习ChatGPT,共同探索成长。
观点来源:证券研究报告

核心观点

大模型提升机器理解能力,优化人机交互方式。

AI 大模型是实现通用人工智能(AGI)的重要方向,包含自然语言处理(NLP)、计算机视觉(CV),多模 态大模型等。ChatGPT 推出两个月 MAU 突破 1 亿,是自然语言处理领域突破 性的创新,大力出奇迹后出现涌现能力,更理解人类语言。大模型“预训练+ 精调”即可对下游应用赋能。我们认为大模型优化人类与机器交互方式,是 效率的革命。大模型是“大数据+大算力+强算法”结合的产物,对比国内外 大模型,算力储备上国内并无短板;算法上 OpenAI 有先发优势;前期数据的 丰富度和量对大模型的训练至关重要。

百度文心大模型:包含 NLP、CV 等在内的系列大模型。

文心大模型包含 NLP 大模型、CV 大模型、跨模态大模型、生物计算大模型、行业大模型等。与 Bing 类似,文心一言有望优化 C 端用户搜索、创作体验;ToB 方面,百度已 开放大模型 API 接口,在文案、AI 作画、开放域对话方面赋能企业。对于具 体行业,百度推出文心行业大模型,以“行业知识增强”为核心特色。

阿里巴巴通义大模型:由通义-M6 模型融合语言模型和视觉模型组成,率先 应用在硬件终端天猫精灵和软件通义千问。

通义大模型包括统一底座 “M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大 模型”,以及行业层面的不同垂直领域专业模型。在应用上,天猫精灵基于 通义大模型推出拟声助手“鸟鸟分鸟”;对话式通义千问已经开始内测。

腾讯混元大模型:采用热启动降低训练成本,文字视频等多领域表现优异, 已在广告游戏等多场景落地。

目前腾讯混元大模型已在腾讯广告、内容创作、 游戏、对话式智能助手等方面实现落地,大幅提升工作效率并降低成本。

华为盘古大模型:基于 ModelArts 研发设计的系列模型,在物流、药物研发、 气象预测等多领域已实现落地。

目前盘古 CV 大模型已覆盖了物流仓库监控 等领域;NLP 大模型覆盖了智能文档检索、智能 ERP 和小语种大模型;科学 计算大模型则应用于气象预报、海浪预测等方面。

字节跳动 AI 探索基础扎实,在语言大模型和图像大模型初步布局。

字节跳 动 AIGC 大模型将从语言和图像两种模态发力,预期在今年年中推出大模型。 字节跳动在算力、算法、数据方面并无短板。目前模型可用于图文、视频内 容生成等,飞书将推出智能 AI 助手“My AI”。

当前,各家公司开展新一轮 AI 模型竞赛,希望借助大模型开展 “模型即服务”的范式。算力、算法、数据是大模型能否成功的重要因素, 重点关注在大模型领域有技术储备的国内公司腾讯控股、阿里巴巴、百度等。 风险提示:AI 技术迭代进度不及预期;AI 应用落地进度不及预期;政策风险;供应链风险等。

大模型概述:大模型提升机器理解能力,优化人机交互

AI大模型是实现通用人工智能(AGI)的重要方向AI大模型是实现通用人工智能(AGI)的重要方向。

AI大模型是基于海量多源数据打造的模型。AI大模型具备通用、可规模化复制等诸多优势,是实现AGI(通用人工智能)的重要方向。AI大模型当前包含自然语言处理(NLP)、计算机视觉(CV)等,统一整合的多模态大模型等。

ChatGPT推出两个月MAU突破1亿,是自然语言处理领域突破性的创新,进一步理解了人类语言。

大语言模型(LargeLanguageModel,LLM)是一种使用了大量数据训练的深度学习算法,构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT在2022年11月底推出后,2023年1月的月活跃用户数已达1亿,成为历史上用户增长最快的应用。ChatGPT的自然语言处理能力超越了以往的自然语言处理模型,可以应对各种自然语言处理任务,包括机器翻译、问答、文本生成等。

大模型应用:“预训练+精调”即可对下游应用赋能,优化人类与 机器交互方式

大模型借助“预训练+精调”等模式,用相比较大模型更少量的数据即可对下游应用赋 能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下,借助“预 训练+精调”等模式,应用模型用相比较大模型更少量的数据即可进行相应微调,高水 平完成细分应用的任务。

阿里巴巴通义大模型模型简述:由通义-M6模型融合语言模型和视觉模型组成

通义大模型最早发布于2022年9月2日,在阿里达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上。通义大模型实际上是由一系列模型组成,包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。

腾讯混元大模型 模型简述:热启动降低训练成本,文字视频等多领域表现优异

“混元”AI 大模型由 TEG 数据平台部和机器学习平台部联合主导,涵盖计算机视 觉、自然语言处理、多模态内容理解、文案生成、文生视频等方向。“混元”AI 大模型由腾讯 17 级研究员/杰出科学家(腾讯史上最高专业职级)张正友博士带 队,2022 年 4 月公司首次披露研发进展,目前已更新至 2.0 版本。 性能上看,“混元”大模型在文字、视频等多个领域表现优异。其中 HunYuan-tvr 模型 在文字 和视频在全球 最具权威的 MSR-VTT,MSVD,LSMDC,DiDeMo 和 ActivityNet 五大跨模态视频检索数据集榜单排名第一,实现该领域的大满贯; HunYuan-NLP 1T 模型在 CLUE(中文语言理解评测集合)总榜、分类榜和阅读理解 榜排名第一。

华为盘古大模型 模型简述:基于 ModelArts 研发设计的系列模型,NLP、CV 等方 向性能优越

“盘古”大模型由计算机视觉(CV)大模型、科学计算大模型、自然语言处理(NLP) 大模型、多模态大模型组成,该模型由华为云人工智能领域首席科学家田奇带领 的华为云 EI 盘古团队主导设计。“盘古”项目自 2020 年 11 月起立项,2021 年 4 月在华为开发者大会上首次正式发布,2023 年 4 月 8 日,团队介绍了盘古模型的 应用进展,包括模型在物流、药物研发、气象预测等领域的落地。 盘古模型基于华为一站式 AI 开发平台 ModelArts 进行研发。ModelArts 是华为开 发的 AI 生产线,具备持续构建大模型训练及推理加速能力、分布式训练能力等, 并提供数据处理、算法开发、模型训练、模型管理、模型部署等 AI 应用开发全流 程技术能力

字节跳动大模型 模型简述:AI 探索基础扎实,语言大模型和图像大模型初步布局 字节跳动 AIGC 大模型将从语言和图像两种模态发力。

根据 36 氪消息,字节跳动证券研究报告 在大模型上已有所布局,分别在语言和图像两种模态上发力,预期是在今年年中 推出大模型。

字节跳动 AIGC 大模型尚在初期探索阶段,有一定 AI 基础。根据 36 氪,在 ChatGPT 公开前,字节跳动对大模型的投入存疑。但字节跳动在工程团队和云服务团队方 面并无短板。

1)算力:字节并不缺 GPU。字节旗下的企业技术服务平台火山引擎,在 2021 年 正式进军基础云市场(IaaS 层),为大模型所需的算力奠定了基础。4 月 18 日, 火山引擎发布自研 DPU 等系列云产品,并推出新版机器学习平台:支持万卡级大 模型训练、微秒级延迟网络,弹性计算可节省 70%算力成本。同时,火山引擎宣 布与字节跳动国内业务并池,抖音等业务的空闲计算资源可极速调度给火山引擎 客户使用。

2)算法:阿里巴巴 M6 大模型的原带头人杨红霞现已加入字节 AI Lab(人工智 能实验室),参与语言生成大模型的研发。

模型应用:可用于图文、视频内容生成等,飞书将推出智能 AI 助手“My AI” 抖音、今日头条基于 AIGC 生成图文内容。

在 AIGC 的加持下,用户上传照片后, 短时间内系统即可自动生成不同风格的图片。例如,抖音上线该“漫画脸”特效 后,吸引了大量用户,据抖音平台数据显示,截至 2022 年 12 月 6 日,该特效已 经超 2428 万人使用,并迅速飙升至特效潮流榜 TOP1。

最好建议

ChatGPT 的涌现能力的实现以及应用成功,使得 AI 产业发展进入新阶段。AI 大模 型增强机器理解能力,可以优化人类与机器交互方式,是效率提升的革命。大模 型“预训练+精调”即可对下游应用赋能。当前,各家公司开展新一轮 AI 模型竞 赛,希望借助大模型能力开展“模型即服务”的范式。算力、算法、数据是大模 型能否成功的重要因素,我们重点关注在大模型领域有技术储备的国内公司腾讯 控股、阿里巴巴、百度等。

完成完整PDF电子版,请关注公众号【幻影视界】获取

一起学习ChatGPT,共同探索成长。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1