当前位置:首页|资讯|微软|AI芯片|ChatGPT

AI算力的四个关键问题解析

作者:金融界发布时间:2023-04-21

原标题:AI算力的四个关键问题解析

近期微软自研AI芯片以及开源DeepSpeed Chat等事件引发市场关注,我们针对这几个关键事件对算力未来的市场需求以及竞争格局的影响进行了重点解析,观点如下:

问题一:微软推出自研AI芯片将对GPU产业格局的影响?

我们认为微软自研芯片的主要目的更多在于对自身AI模型训练成本以及供应链安全的考虑。

从产业格局来看,目前全球科技巨头均在加速算力侧的布局,软件厂商开始自研芯片,而硬件厂商则在搭建算力平台。

问题二:微软的DeepSpeed Chat等技术是否会大幅降低算力需求?

微软宣布开源DeepSpeed Chat,能够以更低的成本、更快的速度训练类似于ChatGPT的高质量大模型。

DeepSpeed Chat从原理来讲是针对模型训练中的RLHF过程来进行加速。

虽然DeepSpeed Chat能显著降低RLHF的算力需求,但是对通用大模型训练的总算力需求影响不大(预计5%以内)。

问题三:LLaMA 等开源模型的广泛应用是否会降低对算力的需求?

短期来看,LLaMA 会降低对训练侧的算力需求。

长期来看,LLAMA会增加对推理侧的算力需求。

问题四:未来大模型的算力需求,视觉大模型与多模态大模型对算力的需求?

短期来看,大模型的军备竞赛仍未结束,未来一段时间国内预训练大模型的数量仍在快速增加。

长期来看,视觉大模型与多模态大模型未来对于算力的需求要远大于语言模型。

相关标的:寒武纪等、海光信息、景嘉微、浪潮信息、中科曙光、龙芯中科、紫光股份、数据港、奥飞数据、光环新网、宝信软件、优刻得、青云科技、深桑达、云赛智联等。

风险提示:技术迭代不及预期、中美贸易竞争加剧、产品研发不及预期。

来源:券商研报精选


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1