当前位置:首页|资讯|华为|生成式AI

华为昇腾分析:驱动因素、框架研究、产业生态及相关公司

作者:艾威斯翔发布时间:2023-09-21

由大模型驱动的生成式AI迎来技术突破,技术革命带来产业重构。其中算力基础支撑整体技术变革发展,是重要基石。华为昇腾是我国国产算力领军企业,近年来发展稳中求进,随着技术进步带来的算力总需求提升和中美竞争带来的国产化趋势,华为凭借其综合优势,最有望在国产算力产业竞争中胜出,其产业链合作伙伴受益。

01

概述


1、昇腾计算

昇腾计算产业是基于昇腾系列处理器和基础软硬件构建的全栈AI计算基础设施、行业应用及服务。2018年10月,华为全联接大会正式发布首款采用华为自研达芬奇架构的AI训练芯片昇腾910与AI推理芯片昇腾310,并于2019年正式投入商用。2019年9月,华为推出昇腾AI计算架构,包括昇腾处理器、昇腾AI加速模块和昇腾AI开发环境,初步形成AI计算解决方案。

昇腾计算致力于完善AI计算产业生态,以自身软硬件体系为核心,联合制造、设计、集成、开发等软硬件合作伙伴与咨询、运营、人才培养等服务合作伙伴,投入各个行业应用实现生产力升级核心目标。

2、昇腾计算架构

昇腾计算架构由硬件、基础软件、应用使能与行业应用及服务四层构成。昇腾AI应用开发过程以芯片及处理器等硬件为基础,CANN(异构计算框架)承接硬件与计算框架,搭配自有开发与管理工具,联接应用使能以投入具体行业应用。目前昇腾计算产业已发展为包括昇腾系列芯片、硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具等全产业链的完整体系。

02

驱动因素


1、大模型革命,算力需求爆发

(1)新技术发展带来算力需求跃升

人工智能算法模型的突破有两个方向:新架构和更大量级的参数量。大模型诞生之前,算法的突破主要集中于算法结构与逻辑两个方面。由于算法的计算底层资源仍存缺陷,以及模型的有限性导致数据量的指数性量级变化并未带来更优的计算结果,算法发展在数年间并未取得参数量级方面的巨大突破。

大模型实现量质齐变,人工智能发展有望开启新篇章。当前时点,(1)计算芯片性能不断提升,例如英伟达A100 GPU的性能相较于上一代产品提升了20倍,首次推出世界上最快的内存带宽,可运行最大的模型和数据集;(2)信息技术发展不断成熟,加速从工业经济向数字经济转变,算力和数据均已具备迎接下一次浪潮的基础。大模型的出现,在算法结构层面实现了进一步突破,同时参数量指数级增加。

以GPT为例,根据OpenAI相关资料,训练阶段算力需求与模型参数数量、训练数据集规模等有关,且为两者乘积的6倍。考虑到实际使用过程中的算力利用中的损耗,则实际总投入的算力资源或要求更高。

(2)大模型时代,算力结构向算力集群发展

在AI训练技术发展趋势中,训练神经网络是一个迭代过程。在每次迭代中,都会通过模型的层计算一批数据中每个训练样本的输出,然后继续进行下一层,通过梯度计算每个参数。批处理的平均梯度、参数和一些每个参数的优化状态将传递给优化算法。随着训练迭代数据批次,模型会不断发展以生成越来越准确的输出。这个过程中,各种并行技术将训练过程分为不同的维度,包括:

数据并行性:在不同的GPU上运行批处理的不同子集;

流水线并行性:在不同的GPU上运行模型的不同层;

张量并行性:分解单个操作的数学运算,例如要在GPU之间拆分的矩阵乘法;

专家混合:仅按每层的一小部分处理每个示例。

随着大模型的到来,算力的概念变得更综合,更多是计算、存储、网络一体化解决方案的融合。大模型的构建是一个系统级工程,需要对服务器集群进行整体优化。由于大模型需要庞大的训练任务,需要由大量GPU服务器组成的算力集群来提供算力,并通过网络进行大规模数据交换。根据客户需求,单纯的GPU不足够,需要建立综合的解决方案,将服务器、存储和网络整合为一个完整的解决方案,以帮助用户建立大模型环境,并应用到各行业。

千亿、万亿参数规模的大模型,训练过程中通信占比可能会很大,传统低速网络的带宽远远无法支撑。同时,传统网络协议容易导致网络拥塞、高延时和丢包,最终造成算力资源的严重浪费。这也进一步说明,大模型发展是典型的木桶效应,任何一块短板,都会影响整体的性能。大带宽、高利用率、信息无损,则是AI大模型时代网络能力面临的核心挑战。

连接的传统交换机对于处理现在的生成式AI负载太慢。而且现在还处在AI革命开端,传统交换机对于普通商品云可能够用,但对于生成式AI的云负载而言,无法提供规模化所需性能。集群通信能力成为木桶效应最需要关注的一块“板”,是决定算力高低的最重要因素。在相同代际的GPU芯片场景下,网络通信能力和算力芯片本身同等重要。

2、科技博弈,国产算力为安全基石

聚焦国产算力芯片领域,以下产业趋势支撑国产芯片厂商迎来较好发展机会:

国内AI、算力发展面临卡脖子等难题。去年8月份,英伟达收到美国政府通知,限制公司未来向中国和俄罗斯出口A100、H100,且限制还包括NVIDIA未来任何峰值性能和芯片对芯片的I/O性能均等于或大于A100的阈值的产品。同年10月,美国商务部(BIS)公布了对于中国出口管制新规声明,主要针对先进芯片及芯片制造设备,其中包括应用于AI、超算等HPC领域的CPU、GPU、AI加速器等高算力芯片或含有此类芯片的计算机商品,同时对已被列入实体名单的28家中国实体进一步加强出口管制,包括多家中国CPU、GPU芯片设计公司及AI算法公司。

国家政策支持,国产算力芯片在关键领域存在保障性采购。基于供应链安全和算力保障考虑下,能够认为在我国算力基数设施发展过程中,自主算力芯片有望获得更多的政策支持,尤其是涉及到国家安全的党政军及关键基数设施领域。参考工业和信息化部印发的《新型数据中心发展三年行动计划(2021-2023)》中所指出的,要推动CPU、GPU等异构算力提升,逐步提高自主研发算力的部署比例,推进新型数据中心算力供应多元化。

推理芯片门槛相对较低,或先从低端领域实现国产化芯片市占率提升。相比于训练芯片,推理芯片技术门槛较低,未来随着大模型的成熟和商业化的广泛落地,推理需求随之上升。IDC研究发现,2021年上半年中国人工智能芯片中,GPU依然是实现数据中心加速的首选,占有90%以上的市场份额,而ASIC,FPGA,NPU等其他非GPU芯片也在各个行业和领域被越来越多地采用,整体市场份额接近10%,预计到2025年其占比将超过20%。而其中GPU芯片是以英伟达为代表的高端芯片,而其他类型芯片中国产厂商竞争差距缩小。

03

市场及趋势分析


1、算力行业高景气有望持续

根据IDC测算,国内智能算力规模正在高速增长,2021年中国智能算力规模达155.2每秒百亿亿次浮点运算(EFLOPS),2022年智能算力规模达到268.0EFLOPS,预计到2026年智能算力规模将进入每秒十万亿亿次浮点计算(ZFLOPS)级别,达到1,271.4EFLOPS。2021-2026年期间,预计中国智能算力规模年复合增长率达52.3%。

通用算力规模也正在高速增长,根据IDC测算,2021年中国通用算力规模达47.7EFLOPS,预计到2026年通用算力规模将达到111.3EFLOPS。2021-2026年期间,预计中国通用算力规模年复合增长率为18.5%。

中国智能芯片市场规模保持高速增长。随着大数据的发展和计算能力的提升,中国智能芯片市场将保持快速的增长趋势。根据寒武纪招股书预计,2022年中国人工智能芯片市场规模会达到368亿元,2024年市场规模将达到785亿元,复合增速有望达到46%。

2、内循环驱动,共同成长

在历次美国对中国制裁后,整体呈现制裁范围越来越广,受限公司越来越多趋势,其中不乏科技领域的众多领军公司,受限于芯片采购限制,也倒逼了这些公司进一步拥抱国产算力,有望实现国内市场内循环,抱团成长。

科大讯飞等国产大模型厂商积极拥抱昇腾。2023年7月6日,昇腾人工智能产业高峰论坛在上海举办。论坛现场,华为联合四家伙伴共同发布昇腾AI大模型训推一体化解决方案,加速大模型在各行业里快速落地应用。并有23家昇腾AI伙伴推出AI服务器、智能边缘与终端新品,共同为行业智能化升级提供丰富的产品与解决方案。

华为昇腾生态和客户正不断壮大。2023年7月6日,昇腾人工智能产业高峰论坛在上海举办。论坛现场,华为全新推出“昇腾伙伴网络”(简称APN)合作伙伴计划,并公布首批12家APN伙伴名单。

3、基于国产昇腾AI平台,助力人工智能普惠化

在华为伙伴暨开发者大会2022上,“中国算力网—智算网络”上线。智算网络是中国算力网一期工程的核心板块之一,标志着中国算力网计划的全面展开,是中国算力网络建设迈出的关键一步。目前多地人工智能计算中心已经上线运营,包括深圳、武汉、成都、西安、南京、杭州等城市,均基于昇腾AI基础软硬件平台建设,让城市AI算力成为新的公共资源,智能化变得更加普及。未来,各地人工智能计算中心将会相互联接,形成智算网络,这已是大势所趋。

04

昇腾AI软硬件平台


昇腾计算产业凭借着以昇腾AI处理器为核心,通过系列硬件和基础软件构建全栈AI计算基础设施,为各行各业赋能。其中硬件为Atlas系列硬件及伙伴硬件,包括模块、标卡、小站、服务器、集群等产品形态,打造面向“云、边、端”的全场景昇腾AI基础设施解决方案;在软件层面,包括异构计算架构、AI框架、应用使能、全流程开发工具链等产品。

1、硬件是AI体系的基础,提供强大计算能力

(1)昇腾AI处理器

全球首个覆盖全场景AI芯片,构建昇腾全产业链底座。昇腾系列处理器是基于华为达芬奇架构的神经网络处理器(NPU),包括昇腾310和昇腾910两款针对不同应用领域的芯片:

昇腾310处理器,本质上是人工智能片上系统,主要应用于边缘计算产品和移动端设备等低功耗的领域。该芯片采用12nm制造工艺,最大功耗仅为8W,半精度(FP16)算力可达8TFLOPS,整数精度(INT8)算力可达16TOPS,同时还集成了16通道全高清视频解码器。主要用于智能手机、智能附件等电子终端。

昇腾910处理器,该芯片计算密度大,领先全球,相比于同时代的英伟达Tesla V100 GPU还要高出一倍,其主要应用于云端,可以为深度学习的训练算法提供强大算力。在算力方面,昇腾910表现非常出色,半精度(FP16)算力可达320TFLOPS,整数精度(INT8)算力可达640TOPS,功耗只有310W,同时采用了7nm先进工艺进程,支持128通道全高清视频解码。从算力上看,昇腾910和英伟达A100性能基本上相当。主要应用于高端服务器和云计算。

量产ASIC高效低成本,独有片上系统结构保障灵活性。昇腾系列NPU属于ASIC(即专用集成电路)的一种。相较于GPU和FPGA等其他类型AI芯片,ASIC具有高度定制化特征,一次流片即定型,可编程性不足,但特定性能、规格、功耗等均显著优于前两者;初期成本高、开发周期长拉高生产进入门槛,但大产量规模可将单片成本压到极低。昇腾系列芯片采用“量产一代、研发一代、规划一代”的投产思路,保障每一代ASIC可用性的同时能够通过大规模生产。并且,昇腾AI芯片设计为SoC(片上系统)类型,即单个芯片上集成了包括数据存储、计算单元等的整个系统,功能全面且支持芯片灵活组合。

华为自研达芬奇架构形成独特竞争优势,有效提高神经网络运算效率。达芬奇架构是华为自研的面向AI神经网络卷积计算设计的架构,针对矩阵运算进行加速,算力部分由3D Cube矩阵乘法单元、Vector向量计算单元、Scalar标量计算单元三部分提供,共同组合提供并行化多样化算力。独创16*16*16的高密度3D Cube使得单个AI Core每时钟周期可进行4096个16位半精度浮点MAC计算,而4*4*4结构的英伟达Tensor Core单个AI核心仅支持64个。并且,基于其灵活可扩展的特性,达芬奇架构可以通用硬件架构实现从低端到高端的全覆盖,能够满足端边云多侧全场景算力要求。

(2)服务器

行业性能领先的服务器。昇腾AI服务器具有超强算力,适用于中心侧AI推理以及深度学习模型开发和训练场景。1)Atlas 800推理服务器(型号:3000):具有高算力和高能效特点。最大可支持8个Atlas 300I/VPro,提供强大的实时推理能力,广泛应用于中心侧AI推理场景。2)Atlas 800推理服务器(型号:3010):具有灵活配置,适配多项负载特点。最大可支持7个Atlas 300I/VPro,广泛应用于中心侧AI推理场景。3)Atlas 800训练服务器(型号:9000):具有高算力密度等特点。拥有4颗鲲鹏920芯片,广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。4)Atlas 800训练服务器(型号:9010):具有高算力密度等特点。可提供2.24PFLOPS FP16算力,广泛应用于深度学习模型开发和训练。5)Atals 800TA2训练服务器:具有高速带宽等特点。双向互联带宽达392GB/s,广泛应用于深度学习模型开发和训练。6)Atlas 500 Pro智能边缘服务器:具有易于部署维护和支持云边协同等特点。最大支持3张Atlas 300I/VPro推理卡,单卡功耗仅72W,发挥鲲鹏架构多核、低功耗优势,在边缘场景中广泛部署。

(3)标卡

华为昇腾超强算力推理+训练标卡。推理卡主要用于执行神经网络模型的推理过程,即将经过训练的模型应用于实际的数据。训练卡则专门用于进行机器学习模型的训练过程。在机器学习中,模型需要通过大量的数据进行训练,以提高其性能和准确度。训练及推理标卡融合“通用处理器、AICore、编解码”于一体,需要安装到服务器上,通过服务器提供运算和模型,为数据中心提供强劲算力。1)推理卡:包括Atlas 300V视频解析卡、Atlas 300VPro视频解析卡、Atlas 300IPro推理卡、Atlas 300IDuo推理卡。其中,Atlas 300IDuo推理卡在配置下可以输出整数精度(INT8)达到280TOPS,半精度(FP16)算力达到140TOPS。2)训练卡:主要以Atlas 300TPro训练卡(型号:9000)、Atlas 300T A2训练卡为主,可广泛应用于智慧城市、智慧交通、智慧园区、智慧金融等诸多AI行业场景。

(4)集群

性能领先的训练集群。华为昇腾面向人工智能计算中心等重算力场景,构筑性能领先的训练集群,目前主要包含Atlas 900 PoD(型号:9000)、Atlas 900A2 PoD、Atlas 900AI集群三种产品,广泛应用于深度学习模型开发和训练。1)Atlas 900 PoD(型号:9000):可提供20.4P FLOPS FP16算力,能效比最高可达20.4PFLOOPS/46kW,搭载32颗超强算力的鲲鹏920处理器,全节点100G网络互联,可实现高效加速应用。2)Atlas 900 A2 PoD:提供25.6/24PFLOPS FP16算力,最大可拓展至3.2EFLOPS,全节点200G网络互联,能效比可达25.6PFLOPS/47.5kW,具有极致算力密度、极高A级能效、极简交付部署等特点。3)Atlas 900 AI:其总算力达到256P~1024P FLOPS FP16,相当于50万台高性能PC的计算能力,让人类更高效地探索宇宙奥秘、预测天气、勘探石油,加速自动驾驶的商用进程。

(5)其他华为昇腾超高算力集成产品

1)开发者套件:Atlas 200I DKA2开发者套件开发板集成了昇腾310B处理器,半精度为4TFLOPS@FP16,整数精度可达8 TOPS@INT8,功耗为24W。可以直接为开发者提供运算和模型等,能满足视频图像分析、自然语言处理、机器人等多个领域的需求。2)智能小站:Atlas 500 AI边缘推理小站算力可达10 TFLOPS@FP16或20 TOPS@INT8,在有盘配置情况下,功耗为44.5W,无盘配置时,功耗32.3W。可独立部署,易于维护和支持云边协同。3)模块:Altas 200 AI加速模块仅有半张信用卡大小,却能提供22TOPS的INT8算力。具有在边端侧实现人脸识别、图像分类等功能,因此广泛应用于智能摄像机、机器人、无人机等边端侧AI场景。

2、软件释放硬件性能,推动AI生态繁荣

华为针对AI场景,设计了异构计算架构CANN、AI计算框架MindSpore和第三方适配以及全流程开发工具链MindStudio。

(1)异构计算架构CANN

CANN是一种异构计算架构,功能类似英伟达CUDA。CANN位于计算资源层和应用层之间,是华为针对AI场景推出的异构计算架构,对上支持多种AI框架,对下服务AI处理器与编程,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台。

CANN的完整软件平台分为四层。其中Driver层实现硬件和操作系统的适配和支持。中间一层提供基础服务,包括内存管理、算力分配和资源调度,还内置了硬件数字视觉解码器和高性能算子库。HCCL提供了板间和框间的通信能力,充分发挥了昇腾训练处理器100G的RoCE接口的宽带连接能力。最上层是图引擎,作为架构的核心模块,实现了大计算图的拆分和融合,以最大化芯片算力的利用率。CANN提供两种算子开发方式,实现了效率和性能的最佳平衡。相比业界主流的只有一种算子开发方式,TBE-DSL基于DSL的语法规则来定义算子,自动实现数据切分和调度,开发者只需关注计算表达,提升了70%的开发效率。另一种算子开发方式是TBE-TIK,需要开发者具备指令级编程和调优能力,包括数据编排和计算表达,通过人工干预,能更好地发挥芯片的极致性能。

CANN在各领域深受认可。1)在学术领域方面:2022年3月,基于CANN的AI论文PLGAN强势上榜2022CVPR,5月荣获“软件行业示范案例”,12月,在第八届中国国际“互联网+”大学生创新创业大赛中,“基于昇腾算力及CANN的创新应用”突破“互联网+”国赛金奖。2)在科研领域方面:分子动力学模拟服务在CANN的助力下成功商用,AI预测性能达到现有产品的1.5+倍,可预测规模较传统方法提升10000+倍,为光伏材料、新能源电池、半导体材料研究带来巨大的商业应用价值。此外,昇腾AI平台端到端使能蛋白质结构预测基于CANN进行多维度性能优化,使得AI预测效率较Baseline提升2+倍,同时具备长序列推理能力,2022年底已支持3800+长度的蛋白质氨基酸序列,达到业界领先水平。

(2)MindSpore

MindSpore是华为推出的支持云边端灵活部署的深度学习框架。人工智能领域的发展,离不开深度学习框架。从2012年以前的Torch、OpenNN等原始深度学习框架的发布,到后面形成了TensorFlow和PyTorch双头垄断,再到现在中国国产框架有了一席之地,深度学习框架市场新品更新不断。2020年,华为研制的MindSpore正式开源,和TensorFlow、PyTorch、飞桨等框架共同为人工智能领域发力。

MindSpore帮助开发者孵化出各种AI创新算法和应用,大幅提升效率。在2018年“华为全联接大会”上提出了人工智能面临的十大挑战,其中提到长部署周期,高开发成本、高技术门槛等问题,为了应对这些问题,昇腾MindSpore专注于实现开发友好、运行高效、全场景按需协同三大目标,以有效降低开发门槛。一般而言,开发深度学习软件框架能够把程序员从烦琐细致的具体编程工作中解放出来,从而将主要精力集中在人工智能算法的调优和改进上。昇思MindSpore作为新一代全场景AI框架,亦是如此,同时具有图算融合、分布式并行、企业安全可信等功能,能够实现模型的训练-推理-全场景部署。

MindSpore易用性和性能全国领先,在全球AI框架使用率方面处于第一梯队。根据Omdia的调研数据,在社区活跃度方面,MindSpore以11%的占比,排名第四;在中国开发者心中,MindSpore在国产框架中认知度排第一,全球框架中认知度排第三。在人工智能框架使用率方面,TensorFlow、PyTorch、昇思MindSpore和飞桨合计占了86%的市场份额,其中,MindSpore以11%的占比在全球框架里排名第三,逆势进入了AI框架的第一梯队。

MindSpore在国内市场广受认可。昇思MindSpore与超过200所高校和科研机构展开了创新合作,截至2022年,获得了超过800家企业的昇思技术认证,涵盖了制造、金融、电信运营商等国家重要领域。此外,昇思MindSpore在GiteeAI开源项目中综合排名第一,软件下载速度排名第一,已经超过370万次下载总量。

(3)开发工具链MindStudio

提供全流程开发的工具链MindStudio。开发者可以利用MindStudio提供的简单易用的开发工具,高效地完成端到端开发,让开发者能够在安装部署、模型训练、模型推理、算子开发、应用开发、调试调优和应用部署全流程中一站式完成,无需切换不同的工具,从而显著降低了开发门槛。MindStudio支持训练、推理场景。1)训练场景:MindStudio(昇腾训练加速工具)利用独有的算法,使训练速度提升25%。2)推理场景:MindStudio(昇腾模型压缩工具)利用独有的智能算法,加速推理进程,可大致提速47%。

(4)应用使能层

MindX应用使能平台,“2+1+X”助力AI融入千行百业。昇腾应用使能MindX,可以支持上层的ModelArts和HiAl等应用使能服务。MindXDL是支持Atlas训练卡、推理卡的深度学习组件,提供昇腾AI处理器集群调度、昇腾AI处理器性能测试、模型保护等基础功能,给业界伙伴提供深度学习系统参考架构;MindXEdge实现将云端模型推送至边缘断部署,同时将边缘侧未识别数据上传至云端进行增量训练。ModelZoo将AI开发需要的模型提前挑优并保障精度性能后提供给开发者。SDK作为软件开发套件,凝聚了行业知识,结合AI最佳实践,可以提供给开发者行业所需的算法以及各种推理验证工作,帮助开发者提高开发效率。

05

产业生态赋能千行百业


1、打造开发者生态,提供一站式服务

数字时代,开发者是时代的弄潮儿。华为将构建开发者生态视为最重要的工作之一,从五个方面围绕开发者生态进行展开。

1)多生态、多领域能力全面开放:利用华为技术底座和开放能力,华为开发者官网集结了各种生态和领域的开发平台和工具套件,全面开放华为在人工智能、数据库、物联网、云原生、HarmonyOS、HMS、鲲鹏、昇腾等领域的技术能力。

2)旗舰赛事汇聚,赋能应用创新:精选华为各生态领域的顶级赛事,向开发者全面开放华为在各产业领域取得的技术成果,鼓励开发者探索前沿技术。

3)线上线下活动,链接生态商机:根据企业、高校、个人等不同开发者群体的需求,华为提供丰富的线上活动、线下沙龙、技能培训和产品体验等活动。凭借华为专业的产品能力和大量的学习资源,全方位赋能开发者在云上开展实际项目,帮助企业开发者链接生态商机,共同推动产业生态的发展。

4)丰富的项目促进开发者成长:华为拥有覆盖多个领域、多个生态圈的30+开发者计划,联结全球各地的开发者。针对企业、个人和高校,华为提供全方位的支持,包括在开发、推广和变现等环节给予帮助,助力全球开发者成长,加速开发者生态的成熟发展。

5)打造一站式开发者服务:围绕开放能力、学习赋能、应用构建、商业变现、服务支持等一站式的开发者服务,全新升级的开发者官网覆盖了产品、活动、program、社区、学堂和支持菜单,便于开发者从自身兴趣和目标出发,快速检索获取相关产品服务。

昇腾开发者社区是昇腾计算产业的门户网站,承担了资源中心,赋能中心和支持中心的角色。开发者可通过资源中心提供的资源,降低开发门槛,通过赋能中心的课程和实践平台快速掌握AI领域知识,通过支持中心,准确高效得到专家的回复。华为通过分层开放能力,打造昇腾开发者社区,提供最佳开发者体验,5年内发展超过100万AI开发者。

华为坚持“硬件开放、软件开源、使能伙伴、发展人才”生态战略,据华为总裁周军介绍,昇腾AI开发者已经超过180+万,合作伙伴超过1200家,行业AI解决方案认证超过2500个多。

2、昇腾五类生态伙伴,覆盖众多主流厂商

昇腾生态伙伴包含整机硬件伙伴、IHV硬件伙伴、应用软件伙伴、一体机解决方案伙伴以及生态运营伙伴五大类。其中,整机硬件伙伴有13家、IHV硬件伙伴有6家、软件伙伴大约1200家,以萨技术是其一体机解决方案伙伴,极视角科技以及中软国际是其生态运营伙伴。

1)整机硬件伙伴:在昇腾计算整机硬件的产品方面,华为通过包括宝德、华鲲振宇、神州数码等众多主流的厂商合作,内容主要涵盖服务器,共同打造适应产业发展的产品。其中部分合作伙伴已经实现鲲鹏系列服务器的量产出货,具备长期定制化服务器的生产能力。

黄河信产为例,黄河信产专注于鲲鹏系列通用计算和昇腾系列AI计算的服务器、微型计算机以及软硬一体化解决方案,并与生态伙伴紧密合作,共同推动计算生态的创新。其产品包括Huanghe OceanAI 900H训练服务器、Huanghe OceanAI 800H推理服务器、Huanghe OceanAI 500Pro智能边缘服务器等。

2)IHV硬件伙伴:根据昇腾官网对IHV合作伙伴的定义,即能够基于华为昇腾部件进行二次开发,形成自有品牌硬件产品并进行销售的硬件伙伴。凌华科技、研扬科技、研华科技、飞途、东声智能、全爱科技6大公司成为IHV硬件伙伴。该合作伙伴基于华为昇腾部件进行二次开发,形成自有品牌硬件产品并进行销售。

3)应用软件伙伴:开发、销售自有知识产权的应用程序、软件、垂直细分应用等产品,能对接昇腾产品,有能力二次开发的软件伙伴。目前来看,主要涵盖智慧城市、智慧交通、电力信息化等领域,有助于推动关键领域的硬件国产化,合作伙伴包括:华雁智科、以萨、云天励飞、格灵深瞳、云从科技、智洋创新等。

4)一体机解决方案伙伴:基于整机硬件伙伴提供的异腾部件或白牌机进行二次开发,以一体机解决方案形式对外销售的合作伙伴。以萨技术成为华为昇腾唯一的一体机解决方案伙伴,基于昇腾系列的产品,打造了以萨智慧交通和以萨智慧交通两大解决方案。

5)生态运营伙伴:具备区域运营能力,可主导运营指定区域人工智能计算中心、生态创新中心或创新实验室等的合作伙伴。华为昇腾和极视角科技以及中软国际达成合作。其中,极视角通过昇腾产品构建了“智慧城市”解决方案,具有部署方便、一键式安装、一站式管理和数据不外泄功能;而中软国际年蝉联中国软件和信息服务综合竞争力百强企业前15位,致力于昇腾算力企业合作、方案构建、算力运营等领域。

3、打造昇腾计算产业,为千行百业增砖添瓦

(1)昇腾计算产业,助力AI发展

昇腾计算产业合作伙伴生态体系包括围绕着昇腾计算技术和产品体系所开展的学术、技术、公益及商业活动,产生的知识和产品以及各种合作伙伴,同时,还包含围绕昇腾相关产品对外提供服务交付的服务类伙伴,提供培训服务的人才联盟伙伴,提供投融资和运营服务的投融资运营伙伴等,而高校和开发者成为整个昇腾生态的重要组成部分。昇腾计算产业相互配合,共同促进技术进步和产品优化,推动以AI实现客户价值的理念,达到共建共赢的效果。

昇腾万里伙伴计划是基于昇腾AI基础软硬件平台推出的一项计划,提供培训、技术、营销和市场的全面支持。从伙伴、开发者、高校、初创企业等方面,开展相应计划,进行全面激励。1)伙伴合作计划:根据伙伴的技术和市场能力,以及业绩贡献,将伙伴分为注册级、认证级、领先级、优先级,享有不同权益。2)开发人员成长计划:根据开发者在昇腾开发者社区的活动,给与不同积分,可获得相应权益。3)高校教学合作计划:与国内“双一流”建设高校合作,或校内设有AI学院或研究院、或设有独立的AI相关学科均可以加入AI人才培养计划。4)初创扶持计划:分为孵化、成长和云腾三个阶段,企业参加该计划后,获得相应的扶持,随着与Atlas AI计算解决方案的进一步深入融合和裁员,进入成长和云腾阶段,获得更高额度的扶持,并且会优先向伙伴和客户推荐销售。

(2)昇腾赋能行业,AI算力无处不在

华为基于硬软件产品,推出众多AI解决方案。在人工智能计算中心、能源、金融、交通、电信、智慧城市、制造和医疗等行业广泛应用,并且创造了行业高价值。

开放同飞,携手联合共建大模型生态。截止2023年7月,全球已发布数百个大模型,我国年内已发布80多个大模型,基于昇腾AI澎湃算力,原生研发、适配的大模型超过30个,占据中国大模型近一半数量。华为云盘古大模型3.0作为中国首个全栈自主的AI大模型,面向整个行业,包括“5+N+X”三层架构:Level0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,Level1层是N个行业大模型,Level2层则专注于具体行业应用或特定业务场景的模型服务。

为了进一步推动联合创新,华为携手26家AI、金融、运营商、互联网行业领军企业、高校及科研院所,共同启动昇腾AI大模型联合创新,促进产业数智化转型升级。其中,武汉大学基于昇腾AI推出了大模型武汉.LuoJia;中科院自动化所发布基于昇腾AI的“紫东太初”2.0全模态大模型等。

AI计算中心赋能产业集群。AI计算中心提供从底层芯片算力释放到顶层应用使能的人工智能全栈能力,重点是构建"一中心四平台",实现政府、产业、学术研究和应用场景的全方位连接和合作。通过这种方式,推动人工智能产业在区域乃至全国范围内的集聚和发展,促进"政产学研用"五位一体的协同发展。

根据客户需求和AI计算中心,华为提供三种不同规模的解决方案:全栈AI计算中心解决方案、云AI计算中心解决方案和轻量化AI计算中心解决方案。

1)全栈AI计算中心解决方案:提供多样化的算力,从L0到L3全栈交付。通过应用驱动的多样性算力融合、超高密度硬件架构创新、应用感知的存算协同以及全栈能效管理,实现倍数级的全栈优势。适用于需要构建全栈智能计算中心的客户。

2)云AI计算中心解决方案:提供Atlas硬件和华为云HCSO(ModelArts)软件,高效、可知识复用的一站式AI模型开发平台。在数据处理阶段可节省50%-80%的人力,智能标注可提升70%的标注效率,基于图像分类的AI训练性能可达到业界的4.5倍,推理性能可达到业界的1.8倍。适用于需要构建硬件和软件平台的智能计算中心的客户。

3)轻量化AI计算中心解决方案:提供基于MindXDL的具有行业属性的深度学习平台,具备web页面、一键安装部署、操作简单的特点。只需5~10步即可完成训练,非常方便快捷。适用于需要聚焦软件平台的行业。

各地兴建人工智能计算中心,昇腾芯片成为各地政府首选。人工智能计算中心作为人工智能算力基础设施,受到全球广泛重视。我国也积极推动人工智能计算中心的建设。2019年科技部印发《国家新一代人工智能创新发展试验区建设工作指引》,提出推进人工智能基础设施建设,加强计算中心等智能化基础设施建设,截至目前,我国已设立北京、上海、深圳等18个国家新一代人工智能创新发展试验区,相关城市积极建设。昇腾芯片作为国内顶尖的AI芯片,成为各地方兴建人工智能计算中心的首选,据统计,18个试点城市中已有12个城市明确披露采用昇腾AI芯片,占总数量的2/3。

携手AI拥抱创新,引领金融智能化。在金融行业,华为基于Atlas智能计算平台,形成智慧网点、金融OCR、深度学习三大解决方案,与高重科技、合合、眼神科技、依瞳科技、第四范式等企业达成合作。有效提高金融行业工作人员的效率,为该行业提供了更好的服务。

加速医疗智能化服务。面对目前医疗资源分布不均、供需不平衡、医疗数据资源存在孤岛的现象,华为合作伙伴基于Atlas AI计算解决方案开发部署智能辅助诊断方案,采用Atlas 800推理服务器搭建AI辅助诊断平台,与接院方PACS对接。在新冠疫情期间,智能辅助诊断解决方案使得识别新冠肺炎的诊断时间由传统方式的10-15分钟下降至10-15秒,准确率由90%上升到99%。

AI是智能制造规模发展的关键引擎,广大应用场景诸如质量检测、机器人视觉、人机协同、生产安全和厂区巡视,都有普遍应用需求。在半导体制造过程中,Al的运用实现了检测精度提升。合作伙伴的半导体晶圆质检解决方案通过分析专业图像采集设备获取的晶圆图片,实现晶圆缺陷检测精确率超过99%。

能源方面,在电力行业AI可用于提高勘探、调度、管理、维护等流程的效率。特别是在设备状态和周界环境的远程巡检方面,在输电线路、变电站和配电房多场景的远程巡视和自动分析,实现准确度和效率的提升。石油天然气的运输和使用,亦可通过AI增加运营、维护和管理水平。基于Atlas200Al加速模块,合作伙伴将AI算力内置到输电可视化装置中,前端智能分析仅回传告警,大幅缓解回传通信的网络压力,降低整体设备的功耗,并将监控周期从1次/小时缩短到1次/分钟,缩短隐患发现间隔和处置周期。

06

鲲鹏与昇腾有望形成体系化协同


在算力生态建设过程中,华为体系除昇腾生态外,鲲鹏生态同样已经逐步成长壮大,其与昇腾有望形成体系化协同,集团军作战综合优势凸显。

鲲鹏计算产业是基于鲲鹏处理器的基础软硬件设施、行业应用及服务,涵盖从底层硬件、基础软件到上层行业应用的全产业链条。鲲鹏计算生态强势入局国产IT替代将对整个国产IT的发展产生深远的影响,一方面凭借鲲鹏优异的性能以及华为强大的产业协调与生态支持能力,鲲鹏将加速整个国产软件生态的替代进程,此外更重要的是通过搭建新的计算平台,华为或将改变国产IT长期低附加值与高定制化的现状,重塑整个国产IT的价值分配体系。

整个鲲鹏计算生态中华为的定位更加偏向于中国Intel,主要聚焦在芯片以及云端,持续推进处理器研发与架构演进,除了整机、部件、数据库端会有少量涉及外,其它领域均交由合作伙伴承接:

硬件端:华为提供基于鲲鹏+昇腾的主板,SSD/网卡/RAID卡等部件,助力合作伙伴发展自有品牌的部件、服务器与PC。

软件端:开源数据库(GaussDB OLTP单机版)、开源操作系统(服务器操作系统Euler OS)、开源AI框架(MindSpore),助力合作伙伴开发自有品牌基础软件产品。

应用端:免费支持主流应用和软件迁移,线上社区、开发工具、编译器等产品一应俱全,推出沃土计划5年投入15亿美金支持行业发展。

一云两翼双引擎+开放生态,华为鲲鹏计算是面向未来IT需求打造的新一代计算平台,愿景是为世界提供最强算力,让云无处不在,让智能无所不及,为了实现这个目标华为提出“一云两翼、双引擎”的产业布局,构筑开放的产业生态。

一云(华为云):通过全栈创新,为开发者提供安全可靠的云服务以及开发体系。

两翼(智能计算&智能数据与存储):在智能计算领域,面向端、边、云,提供“鲲鹏+昇腾+x86+GPU”的多样性算力。在智能数据与存储领域,融合了存储、大数据、数据库、AI,围绕数据的全生命周期,让数据的每比特成本最优、让数据的每比特价值最大。

双引擎(鲲鹏+昇腾):围绕鲲鹏与昇腾两大核心基础芯片加速,构筑满足未来算力需求的异构计算架构。

开发生态:硬件开发、软件开源,使能合作伙伴,共建开放的产业生态。

07

相关公司


1、神州数码:华为老牌合作伙伴,AI服务器产品先行者

神州数码于2020年建成首个鲲鹏超算中心(厦门),旗下鲲泰系列产品契合国内企业信创需求,并完成了对国产中间件、数据库、操作系统的适配,多次中标项目彰显行业竞争力。

“鲲鹏+鲲泰”布局国产设备赛道,核心技术解决“卡脖子”问题。2020年初,公司加入华为鲲鹏生态系,加速布局和升级自有品牌“神州鲲泰”从而打造“鲲鹏+鲲泰”系列产品。借力鲲鹏,公司服务器产品计算能力以及耗能处于国产化CPU标杆水平。2022年公司发布神州鲲泰人工智能推理服务器,以“鲲鹏+昇腾”为核心,可提供128个处理核心的算力,同时最大可支持8张华为Atlas300推理卡。目前神州数码已取得各行业数字化解决方案和人工智能数字化解决方案的实践案例,在未来,其核心技术加速推动信创产品的发展。

信创产品持续中标,品牌影响力逐步提升。神州信创产品定位是:“华为鲲鹏CPU”为核心,以自身丰厚行业应用案例为辅助,构建自身信创产品生态,搭建各行业应用平台。神州数码连续赢得“国家税务总局2021年税务系统线上批量集中采购计算机设备补充入围项目”、“厦门集美区鲲鹏等信创适配服务运营”、“中国移动2021年至2022年人工智能通用计算设备集中采购”、“中国移动2021年至2022年PC服务器集中采购”项目等。

2、科大讯飞:星火一体机,讯飞星火将与昇腾AI强强联合

星火一体机可私有化部署大模型,实现专属、安全、自主可控。今年7月6日,科大讯飞公布讯飞星火将与昇腾AI强强联合,打造基于中国自主创新的通用智能新底座。此次发布会,科大讯飞与华为再度合作,联合发布星火一体机,让企业可以在国产自主创新的平台上,更方便、更自主、更安全可控地私有化部署大模型。

该设备可提供对话开发、任务编排、插件执行、知识接入、提示工程等5种定制优化模式,以及办公、代码、客服、运维、营销、采购等10种以上即开即用的丰富场景包,支持3种模型尺寸供用户选择。刘庆峰表示,有了这些能力,就可以使得每一家企业、每一个行业、每一所学校、每个医院都有机会构建自己的专属大模型。目前,讯飞星火已完成的在金融、政务、汽车等领域的9个专属大模型的数据显示,在场景任务优化和私域知识增强等方面平均效果能够提升20%。

3、润和软件:智能物联领域的昇腾AI落地

润和软件打造的危化品存储室智能安全管控解决方案借助于昇思MindSpore AI框架快速训练视觉算法模型,集成华为昇腾强大AI算力与润和智能视觉分析引擎,快速落地作业安全规范的智能化。对防护要求、作业流程等纸质化规范进行智能化改造,预防此期间可能发生的违规操作,为作业人员的安全提供坚实保障。

润和软件提供的智能安全管控解决方案,在规定的监管区域内,进行人员检测,并检查作业人员装备规范性,包括作业服、呼吸器、氧气面罩等,同时分析穿戴序列,对作业时间进行监管。目前,该方案已经实现规模化应用,在某石化企业上线后,迅速将其月均违规作业次数降为0。

4、同方股份:自主可控守门员,昇腾产品覆盖广泛

2022年4月16日,同方计算机与华为技术有限公司在京举行昇腾万里伙伴授牌仪式,同方正式成为昇腾整机硬件合作伙伴,并签署Powered by Ascend(PBA)品牌授权协议,共同推进人工智能产业繁荣发展。

从产品分布来看,训练型、推理型服务器均有涉及,搭配cpu包括鲲鹏、飞腾、英特尔系列,以2U服务器为主。此外,同方也已推出了基于鲲鹏的个人计算机、储存型服务器、通用型服务器等一系列产品,形成了完备的产品矩阵。

5、拓维信息:昇腾重要的硬件生产合作厂商

拓维实现覆盖软+硬的AI全面布局。拓维连续中标了重庆、长沙人工智能计算中心项目以及全国一体化算力网络国家(贵州)主枢纽中心;在教育、交通行业率先发布开源鸿蒙行业发行版并联合相关部委制定行业标准等。根据拓维公开调研纪要,拓维已经成为了A股唯一华为“鲲鹏/昇腾AI+开源鸿蒙”软硬一体战略合作伙伴。

华为昇腾重要的硬件生产合作厂商,积淀深厚。拓维2021年3月成为华为首批昇腾硬件生产合作厂商,2021年7月成为华为首批昇腾人工智能创新中心运营类合作伙伴,并成为华为昇腾智行ISV、昇腾智造ISV,在交通、制造等领域打造了首批基于昇腾AI的行业标杆产品与解决方案。面向AI领域,拓维基于27年行业数字化技术沉淀、大量行业自有数据以及丰富的案例应用经验,未来有望构建从自研硬件到行业大模型到AI+行业应用的全方位AI差异化产品矩阵。

打造多款AI产品,不断拓展自身能力。在AI产品方面,拓维控股子拓维湘江鲲鹏拥有华为昇腾整机伙伴授权,基于鲲鹏处理器和昇腾处理器,先后发布AI推理、AI训练、AI小站、AI集群、智能边缘等数十款兆瀚AI产品,并携手华为参与全国各地的人工智能计算中心建设。拓维拟改的兆瀚AI推理服务器是一款基于鲲鹏平台+昇腾310处理器的推理服务器,能为用户提供强大的实时推理能力,广泛应用于中心侧AI推理场景,帮助用户应对较重的计算压力。

6、软通动力:昇腾AI生态圈践行者

软通动力作为中国领先的软件与信息技术服务商,长期深耕数字创新服务+AI赛道,拥有完整的技术创新体系,并成立了专注于AI领域的人工智能研究与创新中心(AIC),为客户的AI服务体系提供支撑。同时软通动力积极融入昇腾AI生态圈。

AI领域的重点产品:软通动力打造出了具有端云协同、软硬一体、安全可信三大优势的AI端云一体化产品(昇腾版),该产品已与华为Atlas300I/VPro推理卡完成兼容性测试。此外,软通动力在多地的昇腾AI生态创新中心,均扮演多样化算力能力服务商的角色,协助生态伙伴和用户,共同完成芯片适配、系统迁移、应用创新、人才培养等工作。同时,软通动力作为首批合作企业签约入驻北京昇腾人工智能计算中心,并将参与到“人工智能安全可信护航计划”的理论研究、标准制定、评估评测等相关工作中,与昇腾一道共同推进AI规模应用与产品创新。



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1