“对使用至强 W(Xeon W)这样的处理器的设备来说,PC、工作站和服务器三者有何区别?”
作为Intel至强W处理器分享会「开场白」的一部分,英特尔工作站品类产品经理葛林向包括雷科技在内的现场媒体提出了这个,话题自然地带到了 2023 年 2 月发布的至强 W 系列身上。
可能有人会说「用酷睿的是 PC、用至强(Xeon)的是工作站和服务器」。从消费级用户的感知来看,这个说法似乎没什么问题。但这个说法却有些「射箭画靶」的的意味:PC、工作站和服务器更多的是产品形态上的的差异。PC 不会因为用上至强金牌就成为服务器,服务器也不会因为用的是酷睿而变成 PC,至强 W「放在什么形态的电脑里,就是怎样的产品」并不成立。
因此,我们要讨论的第一个问题是英特尔至强 W 为谁而生?
英特尔至强 W 为谁而生?
作为和至强同源,但专注于单路方案的处理器,第四代至强与至强 W 有不少的共同点:两者有相同的核心数量,覆盖了从 6 核到 56 核的性能区间;相同的架构也让两者支持相同的 AMX 加速器。
但作为「单路优化」型号,至强 W 将处理器中负责多路协同的 UPI 模块换成了 PCIe/DMI,获得了更好的拓展能力。此外因系统内整体核心数「降低」,至强 W 的核心主频也有所提高,在特定使用场景下可以获得更好的性能表现。而今年出现的 AIGC 浪潮,恰恰就为至强 W 提供了这样的发挥空间——从技术的角度看,市面上商用 AIGC 服务与用例大致可以简化为这样的模型:
大模型供应商用 HPC 等硬件构建、训练原始大模型。中间的行业运营商用有针对性的专项数据对开源或授权的大模型进行训练,使得训练后的大模型可以处理行业用户提出的专项运算,最后再向终端消费者提供对应 AIGC 内容服务。
图片来源:雷科技
这就这么说大家可能不太好理解,所以这里我们举一个例子:
公司 A 利用强大的计算机系统开发、训练了一个懂得很多基本的医疗知识的 AI 大模型。专门研究癌症治疗的公司 B 看到了这个 AI 模型的潜力,用大量关于癌症的详细数据对这个 AI 模型进行再训练,使其变得更擅长提供关于癌症治疗的建议。训练完成后,公司 B 利用这个医疗大模型为医院提供诊断辅助、癌症预测等服务。
不过实际情况并没有这么简单:B 公司需要用患者数据来训练自己的医疗大模型,而患者数据由有相关资质的公司 C 提供;在此过程中公司 C 也需要用另外的大模型来收集、清洗、标注、脱敏对原始数据进行处理。
对于 B、C 这样的公司来说,由于他们只需要训练一个已有的大模型,工作量和 A 公司相比显著降低,用不上 HPC 这种算力「大杀器」。但对模型进行「预处理」的算力要求也远超一般消费者家里电脑的算力,绝非一两台「AI 手机」「AI PC」就能实现。而 B、C 公司的算力需求,就是至强 W 工作站想要填补的市场空间。
AI 芯片需要更灵活的形态
刚刚提到的医疗大模型只不过是一个非常单一且简化的模型。在真正商业应用中,灵活多变的至强 W 还能随客户的实际部署场景,应用在不同的用例当中。
比如为体育赛事提供三位数据解决方案的璇米科技,就在分享会上展示了他们的「端+边缘+云服务」的三合一协同方案。因至强 W 拥有更好的 PCIe 多通道支持,多显卡渲染可以显著压缩渲染所需时间,从而提高 AI 模型的整体效率。
图片来源:雷科技
提供高性能 AIGC 云工作站方案的昱格电子也在分享会上介绍了他们基于至强 W 的产品方案:和过去采用酷睿 i9 的方案相比,最多 56 核心的至强 W 高性能服务器在虚拟化时拥有更高的灵活度。
图片来源:雷科技
而和采用至强双路的方案相比,至强 W 在主频和经济上也有更高的表现。舍弃 UPI 选择 PCIe 的特性也让至强 W 拥有惊人的 PCIe 拓展性,在全闪存 NAS 中有着近乎 100% 的性能提升。
总的来说,「三段式」的 AI 大模型产业和多样化的 AIGC 应用场景,对 AIGC 工作站提出了更灵活的部署要求。考虑到至强 W 背靠至强处理器的背景,一时间其实也不好说究竟是至强 W 「开辟」当前 AIGC工作站的市场,还是当前的 AIGC 工作站市场空缺「造就」的至强 W 现在的辉煌。
AI 大模型计算:一支独放不是春
从行业生态结构的角度来看,在原始模型上二次开发的方案可以显著降低商用大模型的开发和使用成本,对 AI 大模型技术的普及同样也有巨大的推动作用。
原始大模型能快速被行业定制和应用,这本身就加速了 AI 技术从理论到实践的转化。它促进了在特定领域(如医疗、法律、金融等)的深度应用,通过大数据和机器学习技术解决了一些长期存在的难题。
此外,这种模式也催生了新的商业模式和服务,如作为服务的AI(AIaaS)、定制化AI解决方案。这些原始模型的开发者、行业运营商和终端服务提供者之间的合作,共同构建了一个互利共赢的生态系统。
当然了,这种「可端可边」的运算能力在未来也可能改写消费级 AI 的市场格局。不同于需要平衡功耗的端侧 AI 处理器或价格高昂的HPC 产品,至强 W 这类产品的出现再一次让「家用边缘计算中枢」的大胆设想成为可能。
不可否认的是,和酷睿 Ultra 这种以 NPU为核心,运行 VNNI、DP4a 指令的 AI PC 处理器相比,以 AMX 加速为核心的至强 W 确实会从一定程度的上加大当前 AI 用例「生态割裂」情况。
图片来源:雷科技
但从深层次看,这种「生态割裂」并不完全由至强 W 和酷睿 Ultra 在硬件架构上造成。「生态割裂」的根本原因在于消费级和商用级别 AI 模型在系统复杂度、算力要求、应用场景上的差异。
我们不可能用一台轻薄的酷睿 Ultra 笔记本就带动院线级别的 AI 视效制作,短期内也不可能为国内每一位老师分配一台高性能 HPC。酷睿 Ultra 、至强 W、至强和其他 HPC 其实是 AI 产业链上不同的环节,彼此之间也可以相互协作。
比起脱离算力成本的大胆设想,针对不同场景推出不同的 AI 产品,让人人都能在工作、生活中享受到 AI 的便利,这才是最重要的。