当前位置:首页|资讯|英伟达|生成式AI

为打破英伟达一家独大,更多大模型生态正在持续生长

作者:真梓发布时间:2023-07-14

生成式AI火了多久,关于算力的讨论就持续了多久。

在这期间,GPU头部厂商英伟达股价飙升,其A100/H100芯片一卡难求,被视作大模型生态中的最大赢家。于是,打破英伟达在AI领域的垄断地位,也被多家芯片巨头列上日程。

AMD和英特尔是其中的典型代表。北京时间6月14日,AMD发布了AI处理器MI300系列。7月11日,英特尔召开芯片发布会,针对中国市场推出高端AI处理器Gaudi 2。

近期在东升国际科技园的一场行业交流会上,36氪同样观察到,在GPU产品之外,基于不同芯片的大模型上下游角色也正在形成生态,希望彼此借力,覆盖模型部署、训练、微调和推理中的各个场景。

北京清醒异构科技有限公司(以下简称「清醒异构」)是AMD中国AI生态伙伴中的一员。清醒异构CEO马一鸣向36氪介绍,公司于2022年3月发布第一款自研的FCC并行编译器,让AMD数据中心CPU芯片释放更多算力。后续伴随着针对CPU产品的迭代,清醒异构基于AMD芯片的产品矩阵也随之扩大,延展到针对CPU+GPU异构系统,提升AI大模型能力的基础软件工具链领域。

据介绍,在产品之外,「清醒异构」联合同为清华系AI创业公司的「清昴智能」发起名为「清醒田园」的大模型生态圈。清昴智能CEO关超宇向36氪介绍,这一生态圈中不仅包括基础软件和芯片公司,服务器、数据中心、通用模型、垂直应用厂商也都逐步参与其中。当前的厂商代表还包括光环云面壁智能、基流科技、CoCoPIE、进化智能等。

马一鸣表示,基于自身技术和生态,当前「清醒异构」结合田园生态中的首批合作伙伴,已经可以为客户提供计算系统和计算服务。前者形态为TMD80训练推理一体计算系统,标配搭载两颗AMD Genoa CPU、8张AMD MI210 GPU,以及「清醒异构」与「清昴智能」联合开发的第一代机器学习基座软件。后者是基于「光环云」上TMD80实例的云计算服务。但不论是怎样的交付形态,关超宇表示,客户都可以在这里找到大模型相关的完整服务。光环云首席战略官陈濛接着解释,计算系统和计算服务,会将服务器、芯片、编译器、优化工具、开源大模型等封装好,为客户提供便捷、统一的产品。在落地环节,马一鸣还介绍,基于A+A的TMD80的解决方案目前供货充足,客户可以在已优化的量产计算系统中获得完善体验。

在会议中,马一鸣在TMD80训练推理一体计算系统上展示了大模型应用的运行效率。在现场演示的内容生成场景中,这套系统上预部署的智谱AI ChatGLM-6B模型的实际推理运行速度达到了80 tokens/s。在演示的文生图场景中,系统上预部署的stable diffusion 模型生成对应图片的速度在1秒之内。

另外,马一鸣还特别强调,「清醒田园」的生态是完全开放的,目前还在与更多包括算力加速、国产芯片、模型优化等在内的产业链上下游合作伙伴广泛接触。整体来说,「清醒田园」的目标是,与广大AI算力供应者和使用者“牵手成长、勃勃生机;共筑智能、共同富裕”。“生成式AI的市场空间有目共睹,并不是英伟达一家就能覆盖完的。”马一鸣认为,在大模型的技术浪潮中,不同类型、不同品牌的技术提供方理论上都会找到一席之地。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1