AI大模型架构与产业链浅析（一）

作者：人人都是产品经理发布时间：2024-10-08

本文的核心思想，基于人工智能架构，识别AI大模型架构，从AI大模型架构的组成部分，思考AI大模型产业链，并做浅析。

本篇章将开启AI大模型系列分析。

一、人工智能架构

人工智能架构目前有众多分类方法，虽然架构分层有些许切分上的差异，但总体来看，包括应用层、技术层，基础层。

其中应用层，按按照服务的对象和功能进行分类，包括解决方案和应用平台。

解决方案层可从产品端分析分为软件/硬件，从用户对象属性，分为b端和c端，从用户行业，细分为行业场景。

技术层可以从感知层、认知层、平台层分类，其中感知层主要是通用技术，例如语音识别等，认知层包括推理、逻辑、学习判断等。

对于技术层分类也可以从通用技术层、算法层、框架层进行分类。

平台层包括技术开放平台和基础开源框架等。

基础层包括数据和算力。

数据层负责数据的收集、存储与处理，确保数据质量。

技术能力层提供强大的计算资源和算法支持，包括高性能计算、云计算及硬件加速设备，为AI系统的稳定运行和高效性能奠定坚实基础。

应用层：解决方案+应用平台

解决方案层：智能客服、智能助理、无人车、机器人和自动写作等场景应用。这些解决方案直接面向市场和用户需求，提供定制化的服务。解决方案层的分析维度，可以从行业、软件/硬件产品、业务方向（营销、生产、人力）等角度分类。
应用平台层：这类平台负责整合和管理AI解决方案，能被更广泛的用户群体所使用。

技术层：感知层+认知层+平台层

感知层：语音识别(ASR)、语音合成(TTS)、计算机视觉(CV)、自然语言处理(NLP)、即时定位与地图构建(SLAM)等。
认知层：机器学习、深度学习和增强学习等算法，这些算法是AI模型的“大脑”，用于指导模型进行学习和推理。
平台层：提供了一系列用于构建AI系统的工具和平台。常见框架：TensorFlow、Caffe、Theano、Torch、DMTK、DTPAR 和 ROS等，这些框架简化了开发流程，让开发者可以更容易地实现复杂的AI应用。

基础层：数据+计算算力

数据层：数据层是AI系统的基础，负责数据的收集、存储、预处理和标注。它包括数据管理、安全、治理和访问，确保数据质量，支持模型训练和系统运行。
计算能力层：计算能力层提供了运行AI所需的强大算力：覆盖了云计算、GPU/FPGA等硬件加速以及专门的神经网络芯片。这些资源使得大规模的数据处理和复杂的模型训练成为可能。云计算：提供可扩展的计算资源。GPU/FPGA：提供硬件加速，用于并行处理大量数据。神经网络芯片：专门为AI计算设计的芯片，如TPU。

二、AI大模型架构

AI大模型架构在人工智能架构的基础上，对数据层和计算能力层提出了更高的要求，以适应大模型的复杂性和规模。同时，它在应用层和技术层也进行了扩展，以适应更广泛的行业应用和更高级的AI功能。

例如，在应用层，AI大模型更侧重于行业特定的解决方案，需要更多行业数据进行定制化训练，同时平台层趋向于发展更高级的AI agent能力；在技术层，AI大模型更加集中于深度学习算法和大型模型专用框架，以支持复杂的模型训练和推理；在基础层，AI大模型需要处理更大量的数据，并且要求更强大的计算能力来支持大模型的训练和部署。

应用层：当前AI大模型的行业应用呈现两种趋势，包括通用大模型和垂类行业大模型

解决方案层：更贴近垂类行业大模型，需要更多行业专业知识数据进行二次训练，基于通用大模型打造垂类行业模型
应用平台层：例如通用类的ChatGPT，它是一种基于Transformer架构的大型语言模型，能够进行文本生成、对话交互等任务，并且可以通过微调来适应特定的应用场景。通用类大模型的趋势是向AIagent能力发展，即具备更强大的交互、理解和决策能力。

技术层：集感知、深度学习算法与专用框架于一体

感知层：基于计算机视觉（CV）的图像识别、视频分析，以及基于自然语言处理（NLP）的文本生成、语言理解、对话系统等。这些感知技术为AI大模型提供了丰富的输入信息。
算法认知层：作为AI大模型的核心算法，是AI大模型是大脑，深度学习算法是ALLMA架构的核心技术，深度学习使得AI大模型能够自动从数据中学习并提取特征，从而提高模型的准确性和鲁棒性。
平台层：AI大模型的框架层可能包括专门为大模型设计的框架，如TensorFlow、PyTorch等。这些框架能够处理大规模的模型训练和部署，并提供丰富的工具和库来支持开发者进行模型开发和优化。同时，AI框架层还提供了构建AI系统的其他工具和平台，如模型管理、版本控制、部署服务等。

基础层：整合多源数据，提供高性能算力，确保模型训练与运行的高效与准确

数据层：典型的数据层数据类型，包括垂类知识库、动态数据集、第三方数据集。对于AI大模型而言，数据层的重要性更加凸显，因为大模型需要大量的数据来训练。数据的质量和数量直接影响模型的性能和效果。数据层主要包括多源训练数据脱敏/清洗/平台化，以及评测数据和标准共建。
计算能力层：AI大模型的计算能力层需要更强大的算力支持，因为大模型通常参数众多，计算密集。这可能包括高性能的GPU/FPGA、云计算资源以及专门的神经网络芯片。而AI计算能力层则提供了运行AI所需的基本算力。

三、基于AI大模型架构的行业现状浅析

从前文的AI大模型架构，我们可以明确AI大模型产业链的组成部分，并浅要分析产业链的差异。部分市场参与者可能已经结合公司战略，进行类全产业链布局，部分市场参与者聚焦在部分产品及解决方案，高度占有市场份额。本文是总览浅析，后续将从应用层、技术层、基础层选取相关部分产品进行详细的分析。

应用层-解决方案：

进入门槛：进入门槛较低，大量行业数据形成模型，竞争相对激烈
短期价值&长期价值：短期价值高，长期价值受市场变化影响大，市场更新速度快，低投入，变现快
演化路径：垂直行业应用或跨行业应用

应用层-应用平台：

进入门槛：进入门槛较较高，需要有较高的行业影响力和号召力，需要构建开发者生态和用户群
短期价值&长期价值：短期价值较低，长期价值较高
演化路径：向app store的方向发展

技术层-算法&框架：

进入门槛：需要一定规模的工程团队，算法、框架及工具研发难度大
短期价值&长期价值：短期价值较高，长期价值较低，投入适中，适合中长期布局
演化路径：向算法工具平台和开发者生态发展

基础层-数据：

进入门槛：入口被拥有流量的公司占据
短期价值&长期价值：短期和长期价值天花板较高，高投入、高回报、适合长期布局
演化路径：数据资产化

基础层-计算能力：

进入门槛：大模型算力成本较高
短期价值&长期价值：短期和长期价值天花板较高，高投入、高回报、适合长期布局
演化路径：通用计算平台和计算服务生态发展趋势

本文由@Elaine.H 原创发布于人人都是产品经理，未经作者许可，禁止转载。

题图来自Unsplash，基于CC0协议。

AI大模型架构与产业链浅析（一）

推荐体验

相关资讯

AI大模型架构与产业链浅析（一）

产业链金融支持探索AI大模型

主要大模型巨头相关产业链公司梳理

AI大模型训练背后，一条数据产业链正在形成

中信证券：AI产业链有望加速升级关注产业链投资机会

近期资讯

“反向驯化”大数据上热搜，杀熟怎么就屡禁不止

可口可乐：快乐肥宅水何以成“股神”最爱？

小红书搜索量猛增，百度慌不慌？

曾缔造出上市公司的医美面膜，现在不打广告就卖不动了

浓香鼻祖泸州老窖，追逐30年输给五粮液3700亿市值

谷歌推出Android XR，为下代计算平台注入灵魂

图解支付账务系统入门

因融资失败，这款诞生仅4年、5800+元的儿童机器人即将变“砖”，家长控诉：要如何解释它的「去世」？

SaaS销售：如何加客户微信而不被拒绝？销售人员必备技巧

投资百万，做了社交产品APP，赚了72元

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响