国产AI大模型陆续上线,智能算力需求井喷。
IDC预计,国内2026年智能算力规模有望进入每秒十万亿亿次浮点计算级别,2021-2026年智能算力规模年复合增长率有望达52.3%。
算力是集信息计算力、网络运载力、数据存储力于一体的新型生产力,AI芯片是实现高算力的核心。当前主流的AI算力芯片主要包括GPU、FPGA、ASIC、NPU等,其中GPU在训练负载中具有绝对优势。
GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。目前全球GPU市场的绝对份额被英伟达和AMD占据,国内企业主要有华为海思、海光信息(688041.SH)等。
英伟达之所以能够成为GPU全球头号玩家,主要源于其在先发优势下建立的CUDA生态。CUDA架构提供了GPU编程的简易接口,大大降低了开发门槛,因此,CUDA推出后发展迅速,应用广泛。
同时,由于CUDA的闭源特性和快速迭代,后来者很难通过指令翻译等方式完美兼容,即使部分兼容也会有较大的性能损失,导致在性价比上持续落后英伟达。
业内人士认为,国产GPU在起步阶段兼容现有生态更容易发展,先求生存,但长期还是要摆脱兼容思路,站稳脚跟后再求发展自有核心技术。
海光信息的DCU属于GPU的一种,在生态、编程环境等方面与CUDA高度相似,CUDA用户可以以较低代价快速迁移至海光信息的ROCm平台。目前海光DCU主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高吞吐量的数据处理任务。海光深算二号已经发布,实现了在大数据处理、人工智能、商业计算等领域的商业化应用。
华为针对AI场景,设计了功能类似英伟达CUDA的异构计算架构CANN和帮助开发者孵化各种AI创新算法和应用的AI计算框架MindSpore,以及全流程开发工具链MindStudio。
目前华为昇腾芯片包括昇腾310和昇腾910,前者的整数精度(INT8)算力可达16TOPS,主要应用于边缘计算产品和移动端设备等低功耗领域;后者整数精度(INT8)算力可达640TOPS,性能水平接近英伟达A100。
同时,基于昇腾系列处理器和基础软件构建的全栈AI计算基础设施、行业应用及服务,华为也在打造昇腾计算产业生态,包括昇腾计算软硬件体系、合作伙伴、行业应用三层。
据了解,昇腾生态伙伴包含整机硬件伙伴、IHV硬件伙伴、应用软件伙伴、一体机解决方案伙伴以及生态运营伙伴五大类。其中,整机硬件伙伴有13家、IHV硬件伙伴有6家、软件伙伴约1200家。昇腾AI开发者已超180万,合作伙伴超过1200家,行业AI解决方案认证超过2500个。