今天分享的是人工智能AIGC研究报告:《AIGC势头强劲,算力、数据、算法、应用端需求空间广阔》。(报告出品方:开源证券)
AIGC势头强劲,算力、数据、算法、应用端需求空间广阔
2022 年以来,以 ChatGPT 为代表的 AIGC 技术热度持续提升。AIGC 技术持续取得突破离不开算力、数据、算法三大核心要素。
算力方面,随着大模型持续推出及升级迭代,AI 算力需求持续增长,带动 AI 服务器、AI 芯片、数据中心等硬件需求增长。根据 IDC 的数据,我国智能算力市场规模预计将从 2019 年的 31.7EFLOPS 增长至 2026 年的 1271.4EFLOPS,CAGR 高达 69.4%。
数据方面,大模型复杂化需要更大规模的训练数据支持。同时数据标注是大部分 AI 算法有效运行的关键,尤其是自动标注技术的兴起,推动数据服务行业持续扩容。根据艾瑞咨询的数据,我国 AI 基础数据服务行业市场规模预计将从 2018 年的 25.9 亿元增长至 2025 年的 101.1 亿元,CAGR 为 21.5%。
算法方面,预训练模型引发 AIGC技术的质变,Open AI、百度等国内外厂商纷纷推出大模型并持续进行升级迭代。
应用方面,AIGC 生成文本、图像、视频等的能力持续提升,在自动驾驶、智慧工业、电商、文娱等领域将得到广泛应用。根据头豹研究院的数据,我国 AI 市场规模预计将从 2021 年的 2607 亿元增长至 2027 年的 15732 亿元,CAGR 达34.9%,其中自动驾驶是 AI 最大应用领域,同时数字人在 AIGC 推动下发展迅速。
AIGC 势头强劲,算力、数据、算法、应用端需求空间广阔
2022 年以来,以 ChatGPT 为代表的 AIGC 技术热度持续提升。AIGC 作为人工智能的子领域,目的在于开发与人类智慧相媲美的技术,能够通过学习大量的数据内容生成全新的数据。AIGC 核心技术包括深度变分自编码、生成对抗神经网络、扩散模型、Transformer 等基础模型以及计算机视觉、自然语言处理、多模态等预训练大模型,而模型的训练需要大量的数据支持,并且需要强大的算力作为支撑。同时,在预训练模型的基础上,需要进一步通过专门的调试和训练形成垂直化、场景化、个性化的小模型和应用工具层,以满足特定领域的需求。此外,应用层面,利用 AI 技术生成文本、图像、音频、视频等内容以及由此构成的多模态内容是 AIGC 的重要应用场景,可广泛应用于游戏、电商、政务、金融等诸多领域,大幅提高创作效率。
算力、数据、算法构成 AIGC 领域重要支撑,需求随大模型持续推出及升级迭代快速增长
算力、数据、算法是 AIGC 领域的三大核心要素,推动 AIGC 技术持续取得突破。其中算力刻画数据处理能力,主要关联技术包括数据中心、分布式计算、边缘计算、高性能计算等。数据指以数字、文字、图像等形式表现的用于模型训练的素材,其相关技术包括数据挖掘、数据仓库、数据可视化、数据安全和隐私保护等。算法代表用系统的方法描述解决问题的策略机制,其关联技术包括机器学习、深度学习、自然语言处理、计算机视觉、推荐系统等。
AI 大模型训练需要强大的数据处理能力,推动算力需求持续增长。
AI 大模型训练需要强大的数据处理能力。随着大模型持续推出及升级迭代,AI 算力需求持续增长。
根据 IDC 的数据,我国智能算力市场规模预计将从 2019 年的 31.7 EFLOPS 增长至2026 年的 1271.4EFLOPS,CAGR 高达 69.4%。具体而言,算力基础设施主要包括AI 服务器、AI 芯片、数据中心等。
AI 服务器领域,目前 AI 服务器以 CPU+GPU 形式为主,可支持大规模的深度神经网络模型训练并提高训练的精度,具有明显的计算效率优势,因此需求有望持续增长。根据 TrendForce 的预测,全球 AI 服务器(包含搭载 GPU、FPGA、ASIC 等)出货量预计将从 2022 年的 85.5 万台增长至 2026年的 236.9 万台,CAGR 为 29.0%。
AI 芯片领域,AI 芯片是核心算力硬件,除 CPU外,还包括高效支持 AI 应用的 GPU、FPGA 等通用芯片以及专门为特定的 AI 产品设计的 ASIC 芯片等,主要用于辅助 CPU 进行加速计算。AI 芯片占据 AI 服务器的主要成本,根据 IDC 的数据,芯片成本在基础型服务器中约占 32%,在更高性能的服务器中,芯片相关成本占比高达 50%-83%。在算力需求激增的背景下,AI 芯片需求有望持续增长。根据 Gartner、甲子光年的数据,全球 AI 芯片市场规模预计将从2018 年的 43 亿美元增长至 2025 年的 726 亿美元,2020-2025 年 CAGR 达 48.4%,而我国AI芯片市场规模预计将从2018年的61亿元增长至2023年的557亿元,CAGR达 55.4%。
数据中心领域,数据中心作为算力的重要载体之一,需求将随着大模型算力需求增长而增长。根据科智咨询的数据,我国数据中心市场规模预计将从 2014年的 372 亿元增长至 2024 年的 6123 亿元,CAGR 达 32.3%。
大模型复杂化需要大规模训练数据支持,数据标注是大部分 AI 算法有效运行的关键。
数据是算法的素材,大模型复杂化需要更大规模的训练数据支持。根据长江存储系统解决方案公众号的数据,ChatGPT 的算法模型已经达到 1750 亿参数,用于预训练的数据量达到 45TB,并且随着 ChatGPT 的持续迭代,模型参数和数据量也在加速增长。
受益大模型训练需求持续增长以及升级迭代,叠加数据产权保护加强,数据市场规模有望持续增长。同时,数据本身的质量会影响模型训练的效果,因此数据标注成为大部分 Al 算法有效运行的关键。数据标注指将原始数据进行处理,使其适用于机器学习和 AI 算法的学习和分析。尤其是自动化数据标注技术能够通过深度学习和计算机视觉等技术,减少人工标注需求,提高数据标注的效率和准确性,进一步推动数据服务行业发展。根据艾瑞咨询的数据,我国 AI 基础数据服务行业市场规模预计将从 2018 年的 25.9 亿元增长至 2025 年的 101.1 亿元,CAGR 为 21.5%。
预训练模型引发 AIGC 技术的质变,国内外厂商积极纷纷推出大模型。
预训练模型引发 AIGC 技术的质变,有效推进 AIGC 在应用端的落地。具体而言,预训练模型可分为:(1)自然语言处理(NLP)预训练模型,包括谷歌的 LaMDA 和 PaLM、Facebook的 OPT-175B 和 M2M-100、Open Al 的 GPT 系列等;(2)计算机视觉(CV)预训练模型,包括微软的 Florence 等;(3)多模态预训练模型,即融合文字、图片、音频、视频等多种内容形式的预训练模型,包括谷歌的 Imagen 和 Parti、Deep Mind 的 Gato、Open Al的 CLIP&DALL-E 等。
我国企业也在不断推出自己的大模型。根据中国移动研究院,科技大厂在算力层、平台层、模型层、应用层进行四位一体的全面布局,如百度的“昆仑芯+飞桨平台+文心大模型+行业应用”、阿里的“含光 800 芯片+M6-OFA 底座+通义大模型+行业应用”、华为“昇腾芯片+MindSpore 框架+盘古大模型+行业应用”,有望提升模型训练的效率及行业的可用性。
AIGC 赋能千行百业,应用端发展前景广阔
AIGC 生成文本、代码、图像、视频等内容的能力持续提升,应用端发展前景广阔。大模型技术水平日益精进,感知并理解海量数据的能力持续提升,推动 AIGC 在文本、代码、图像、视频等内容的自动生成方面不断取得突破。在 AIGC 的加持下,内容生成领域在自动生成、提高丰富度和准确性、降低制作门槛及生产成本方面成效显著。同时,多模态大模型的出现使得多领域融合成为可能,提升 AIGC 的可用范围。因此,AIGC 在自动驾驶、智慧工业、电商、游戏、文娱、金融、工业、政务、医疗越来越多的领域得到广泛应用。应用领域持续开拓推动人工智能行业持续扩容。
根据太原大数据官微公众号引用的头豹研究院数据,我国人工智能市场规模预计将从 2021 年的 2607 亿元增长至 2027 年的 15732 亿元,CAGR 达 34.9%,其中自动驾驶是人工智能的最大应用领域,市场份额预计将从 2022 年的 38%提升至 2027 年的52%。
人工智能在自动驾驶领域意义非凡,大模型推动自动驾驶进一步发展人工智能在自动驾驶领域意义非凡,大模型推动自动驾驶进一步发展。
人工智能技术在自动驾驶领域有极重要的意义。深度学习技术可以帮助车辆精准感知和理解外部环境;深度学习技术是 SLAM 系统中的一项关键技术,可以实现地图创建等多项任务;深度学习技术能帮助自动驾驶汽车学习和适应周围环境,帮助其提高决策能力,提升驾驶效率及安全性。同时,大模型在自动驾驶中应用趋势明确。
根据九章智驾公众号,在云端,可以发挥大模型参数量增加带来的容量优势,用于自动驾驶数据自动标注、数据挖掘、通过蒸馏方式训练小模型等;在车端,大模型可用于合并用于不同检测任务的小模型等方面,节省车端计算环节所需的推理时间,增加自动驾驶安全性。因此,在大模型技术的推动下,自动驾驶将迎来更广阔的发展空间。根据艾媒咨询的数据,我国无人驾驶汽车行业规模预计将从 2015 年的 30.5 亿元增长至 2025 年的 267.6 亿元,CAGR 为 24.3%。
AIGC 推动数字人更智能化、拟人化,推动数字人在众多产业得到广泛应用。
AI 技术在文本、音频生成、图像、视频、3D 模型生成及多模态交互等方面全面赋能数字人。具体而言,AI 技术逐渐渗透到数字人建模、渲染、生成、驱动等全部环节,并使其制作成本降低、周期缩短、门槛降低,并且拟人化程度更高。根据艾媒咨询的调查数据,虚拟人被认为是 2023 年受 AIGC 技术推动作用最为明显的产业。在 AIGC技术的支撑下,数字人将在短视频、教育、影视、政务、文创、直播等众多领域得到广泛应用,推动相关产业持续扩容。根据艾媒咨询的数据,我国虚拟人核心市场规模预计将从 2017 年的 8.1 亿元增长至 2025 年的 480.6 亿元,CAGR 高达 66.6%;同时,虚拟人所带动的市场规模预计将从 2017 年的 80.9 亿元增长至 2025 年的 6402.7亿元,CAGR 高达 72.7%。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
本报告共计:40页。受篇幅限制,仅列举部分内容。
精选报告来源公众:【幻影视界】,回复关键字“202306”,获取完整PDF电子版