智算中心大批投建,专家提醒警惕“AI过热”
作者/ IT时报记者 毛宇
编辑/ 郝俊慧 孙妍
2024年春节后,中国算力市场正经历深度转型与结构调整。
原本火爆的大模型赛道因高昂的投入及融资压力呈现降温趋势,不少初创公司由于难以承受大模型训练所需的巨额开销,纷纷转向更具潜力与针对性的垂直赛道,如政务模型、自动驾驶、医疗放射等细分领域。
“当前市场还是将AI炒得过热,不少中小厂商已在通用大模型的巨额投资成本门前倒下,我们需要警惕出现早些年前光伏产业产能过剩的情况,今年应该寻求一个新的突破点。”山海引擎COO彭璐向《IT时报》记者表示。
算力底座——GPU,仍是当下算力市场的关键词。
二手市场上,英伟达系列芯片算力价格近期出现明显下滑,较春节前下降约10%,显示出市场需求端的变化。进入4月以来,同花顺算力租赁概念指数连续下跌,截至4月23日发稿,跌幅超16%。
一名业内人士向《IT时报》记者表示,“这一波智算中心投建之后,市场竞争已基本充分,算力价格不会太离谱。”
小算力运营商玩不动了
尽管大型科技公司产品,如百度的文心一言、阿里的通义千问等在大模型领域仍保持较高投入,但市场普遍认为,随着算力成本飙升,只有极少数具备强大资金实力的企业能够支撑如此庞大的开支。此外,国内诸如MiniMax、月之暗面等公司的高额融资背后,折射出行业竞争加剧以及商业模式探索的压力。
公开资料显示,MiniMax、月之暗面背后均有阿里入股。前者创始人闫俊杰和周彧聪均来自商汤,又被誉为“商汤系”创业公司;后者则在今年2月完成B轮融资后成为目前国内大模型初创公司中估值最高的一家独角兽。
以英伟达为代表的算力芯片仍是市场焦点,然而,受限于美国芯片管制政策,英伟达面向中国市场推出的特供版H20芯片,在性价比和适用性方面未达市场预期,且采购需经过严格审查,在国内的出货量受到一定影响,市面上在售的英伟达芯片大多为二手芯片。
某电商平台上,《IT时报》记者搜索发现,不少服务商仍在售卖整机服务,某服务器厂商售卖搭载8卡H100、A100的服务器主机,标价在100万~300万元不等。记者咨询客服后得知,当前价格仍有优惠可谈,稍后记者拿到了更详细的报价,相较主页展示价格下调了20万~60万,并承诺可享受商家三年质保。
某二手平台和社交软件上,亦有销售英伟达或华为昇腾的卖家不断上线“吆喝”,配文称“低价可谈”、“报价有效期为一周,以最新报价为准”。
“上面商家所说的质保是商家质保,并非英伟达官方质保,所以价格好谈。”上述业内人士说道。
“目前大厂仍在重押大模型,他们有资金、舍得投入。但据我了解,不少初创公司已经退出大模型赛道。很多算力运营商皆因高昂的硬件投入与维护成本面临生存挑战,无力采买大规模算力,也没办法帮客户进行大规模部署。”彭璐认为,预计在2024年年底,国内算力赛道还将有一批中小玩家退场。
算力价格企稳
当下,国内算力市场正由去年的卖方市场向买卖平衡转变,产业链上下游均在寻求适应新市场环境的发展模式,算力的售价也在企稳。
不久前,一家名为“超算互联网”的平台打出8*A800 80GB服务器,每卡每小时2元的促销价,相较市场8~10元的价格,打了“骨折”。
“这个价格还是噱头为主,平台一共只拿出了10万元额度,最多也就9台8卡服务器用一个月。”一位业内人士告诉《IT时报》记者,这个价格并不具有普遍意义。
但与去年底市场“蹦着”涨价相比,进入阳春三月之后,算力价格的确下降了。而且由于大型互联网公司大多自建算力中心,而原先匆匆上线智算中心的IDC服务商也开始调整战略,从单纯提供裸金属或整机云服务器租赁服务,转向提供更多增值服务和PaSS服务。
“很多传统企业并不知道AI能为自己做什么?实际上,算力的真正需求还没有被激发。”清醒异构创始人余腾告诉《IT时报》记者,现在国内迫切需要的是,打通大模型落地的产业链,真正让传统企业主看到AI和算力的价值。
中国电子节能技术协会副理事长吕天文年初接受《IT时报》记者采访时表示,“两年后,国内算力市场会趋于稳定,淘汰和转型是部分公司的结局。但这不失为一件好事,千模大战和禁售政策鞭策了国产算力的进步,中小厂商也可尽快找准定位。”
自动驾驶及医疗领衔垂直赛道
中国大模型公司正探索深耕细分领域以求突破。国家数据局局长刘烈宏在3月举行的中国发展高层论坛2024年会上透露,中国10亿参数规模以上的大模型数量已超100个,行业大模型深度赋能电子信息、医疗、交通等领域,形成上百种应用模式,赋能千行百业。
“目前我们接到的自动驾驶需求较多,其次是医疗赛道,像科研机构、医学影像之类的技术科室都很适合使用智算。”彭璐透露。
当前新能源汽车中,以华为为首,小米、理想、吉利等车企均在布局加码大模型。医疗健康领域也表现出强劲发展力,此前,京东健康正式发布面向医疗健康行业的大模型“京医千询”,百度发布国内首个“产业级”医疗大模型“灵医大模型”,医联正式发布了自主研发的医疗大语言模型MedGPT等,均展现出超市场预期的发展前景。
数据标注成重要瓶颈
从追赶OpenAI转向精细化垂直应用,中国算力市场目前正进入关键阶段。
“垂直赛道上,中国大模型有一定竞争优势,因为美国受限于当地电力消耗、法律监管等问题,部分地区的规模化部署可能面临困境。”上述业内人士表示。
然而,随着国内大模型垂直赛道逐渐兴起,数据标注成为制约行业发展的重要瓶颈。传统人工智能中对于语音和图像识别的数据标注,依赖绝对精准的简单标注,并不要求标注人员掌握专业的领域知识,只需具备普通人类通识能力即可。但垂直大模型的训练效果,取决于精准的数据,并从人类反馈中强化学习(RLHF)。也就是说,需要通过利用人类对结果的反馈来指导智能系统“进化”。
图源:东方IC
提供反馈的数据标注员需具备极强的专业素养,尤其是行业知识。特别是在专业性强、需要高度精准标注的领域,如建筑设计、航空仿真模拟等,相关数据处理成本高昂且人才稀缺,领域发展受到一定影响。
需加快形成全国一体化算力体系
2024年,生成式人工智能进入加速期。Open AI连续发布多模态大模型“炸场”,美国对算力芯片的出口管制出台新政。算力设备数量不足、自主研发能力不足以及高昂成本等问题,正制约着当前国内通用大模型的发展。
上述人士认为,相较GPT-4和即将面世的GPT-5,中国大模型仍有较大提升空间,中国企业仍在全球化竞争中面临严峻挑战。
智算中心正成为支撑人工智能产业快速发展及经济增长的新动能。《算力基础设施高质量发展行动计划》提出,到2025年,算力规模超过300EFlops,智能算力占比达到35%。
国家信息中心发布的《智能计算中心创新发展指南》预测,“十四五”期间,在智算中心实现80%应用水平的情况下,城市(地区)对智算中心的投资,可带动人工智能核心产业增长约2.9至3.4倍。
时不我待,这场“国力竞赛”期待更为强劲的引擎,同时也要谨防各地建设“一窝蜂”而导致的资源浪费。据不完全统计,全国已有超过30个城市投建或准备投建智算中心,“算力卖给谁”是这些智算中心的必答题。
今年两会期间,我国《政府工作报告》首次提出,适度超前建设数字基础设施,加快形成全国一体化算力体系,培育算力产业生态。