为打破英伟达一家独大，更多大模型生态正在持续生长

作者：真梓发布时间：2023-07-14

生成式AI火了多久，关于算力的讨论就持续了多久。

在这期间，GPU头部厂商英伟达股价飙升，其A100/H100芯片一卡难求，被视作大模型生态中的最大赢家。于是，打破英伟达在AI领域的垄断地位，也被多家芯片巨头列上日程。

AMD和英特尔是其中的典型代表。北京时间6月14日，AMD发布了AI处理器MI300系列。7月11日，英特尔召开芯片发布会，针对中国市场推出高端AI处理器Gaudi 2。

近期在东升国际科技园的一场行业交流会上，36氪同样观察到，在GPU产品之外，基于不同芯片的大模型上下游角色也正在形成生态，希望彼此借力，覆盖模型部署、训练、微调和推理中的各个场景。

北京清醒异构科技有限公司（以下简称「清醒异构」）是AMD中国AI生态伙伴中的一员。清醒异构CEO马一鸣向36氪介绍，公司于2022年3月发布第一款自研的FCC并行编译器，让AMD数据中心CPU芯片释放更多算力。后续伴随着针对CPU产品的迭代，清醒异构基于AMD芯片的产品矩阵也随之扩大，延展到针对CPU+GPU异构系统，提升AI大模型能力的基础软件工具链领域。

据介绍，在产品之外，「清醒异构」联合同为清华系AI创业公司的「清昴智能」发起名为「清醒田园」的大模型生态圈。清昴智能CEO关超宇向36氪介绍，这一生态圈中不仅包括基础软件和芯片公司，服务器、数据中心、通用模型、垂直应用厂商也都逐步参与其中。当前的厂商代表还包括光环云、面壁智能、基流科技、CoCoPIE、进化智能等。

马一鸣表示，基于自身技术和生态，当前「清醒异构」结合田园生态中的首批合作伙伴，已经可以为客户提供计算系统和计算服务。前者形态为TMD80训练推理一体计算系统，标配搭载两颗AMD Genoa CPU、8张AMD MI210 GPU，以及「清醒异构」与「清昴智能」联合开发的第一代机器学习基座软件。后者是基于「光环云」上TMD80实例的云计算服务。但不论是怎样的交付形态，关超宇表示，客户都可以在这里找到大模型相关的完整服务。光环云首席战略官陈濛接着解释，计算系统和计算服务，会将服务器、芯片、编译器、优化工具、开源大模型等封装好，为客户提供便捷、统一的产品。在落地环节，马一鸣还介绍，基于A+A的TMD80的解决方案目前供货充足，客户可以在已优化的量产计算系统中获得完善体验。

在会议中，马一鸣在TMD80训练推理一体计算系统上展示了大模型应用的运行效率。在现场演示的内容生成场景中，这套系统上预部署的智谱AI ChatGLM-6B模型的实际推理运行速度达到了80 tokens/s。在演示的文生图场景中，系统上预部署的stable diffusion 模型生成对应图片的速度在1秒之内。

另外，马一鸣还特别强调，「清醒田园」的生态是完全开放的，目前还在与更多包括算力加速、国产芯片、模型优化等在内的产业链上下游合作伙伴广泛接触。整体来说，「清醒田园」的目标是，与广大AI算力供应者和使用者“牵手成长、勃勃生机；共筑智能、共同富裕”。“生成式AI的市场空间有目共睹，并不是英伟达一家就能覆盖完的。”马一鸣认为，在大模型的技术浪潮中，不同类型、不同品牌的技术提供方理论上都会找到一席之地。