无处不在的 AI 已遍及各种各样的关键工作负载。从核心企业应用到自动话务台系统, 经典的机器学习和深度学习正在成为企业实现业务发展的基础构建模块。生成式人工智能(AIGC)的快速发展日益对硬件算力提出了更高的要求,包括计算能力、内存带宽和容量等各个方面。为了满足日益庞大的模型算力需求,英特尔在硬件和软件领域不断进行创新。
英特尔至强处理器硬件创新
英特尔® 高级矩阵扩展 (Advanced Matrix eXtensions,AMX) 加速技术是专门为实现AI加速而设计的,它在第四代和第五代至强可扩展处理器上展现出显著的性能收益。至强Max系列的处理器除了具备AMX加速,还着重提升内存带宽,可进一步提高大规模语言模型的生成速度。
英特尔AI软件技术
除了在硬件创新方面取得的成果,英特尔还在软件领域也持续投入,不断创新。通过软件优化,英特尔充分发挥硬件优势,并将这些优化提交到开源社区,如PyTorch,同时通过插件的方式进一步增强性能。这种协同作用有助于确保硬件和软件之间的协同工作,提高整体性能。为了满足用户对大规模语言模型的推理需求以及实现低成本的部署,英特尔推出了开源的推理方案xFasterTransformer,这是一个专门针对至强服务器而设计的高效的分布式推理优化方案。
通过xFasterTransformer,用户可以发挥出至强服务器的极致性能,并通过分布式部署支持更大的模型,实现更高效、更快速的服务响应。
这些创新举措共同为用户带来更多的价值,提升用户体验,降低部署门槛,推动了生成式AI在不断拓展的应用领域中的广泛应用。
在1月17 日举办的2024年阿里云PolarDB开发者大会上,英特尔资深软件架构师周姗对此作了专题演讲,主题为《基于英特尔® 至强®处理器的生成式AI》。
对此感兴趣的小伙伴们,可以关注微信公众号英特尔开发人员专区观看视频,掌握最新的相关技术资讯!