当前位置:首页|资讯

“算力滴滴”开跑 欲将大模型推理成本“三年降千倍”

作者:IT时报发布时间:2024-09-23

“算力滴滴”开跑 欲将大模型推理成本“三年降千倍”

图片

打通AI最后一公里,PPIO全国节点已超3500  

作者/  IT时报记者  孙妍

编辑/  郝俊慧  

“一批又一批创业者站在AI时代的门槛前,正如24岁的姚欣一样,他们需要的不仅是资金和技术,更是支持和信念。”再创业的姚欣站在浦东软件园报告厅舞台上,站在他开启PPTV创业的地方。


回望20年前,华中科技大学宿舍里的几位男生正在讨论,没有电视怎么看世界杯,能不能实现“人人为我,我为人人”的P2P电视?一个想法成就了一家企业,2012年,PPTV连接了全国4.5亿台手机、PC和机顶盒,建立起一个分布式存储和传输的网络,见证了一个视频时代。


图片


2018年,姚欣从硅谷回国,从投资人转变为创业者,与“老伙伴”王闻宇再度携手,创办PPIO派欧云,并担任CEO。


当年PPTV盘活的是个人闲置的网络带宽资源,加入的人越多速度越快,因此视频处理成本只有优酷、土豆的1%。PPIO的思路与PPTV相似,只是从汇聚个人用户资源变为汇聚企业资源,将企业闲置的数据中心整合起来,形成分布式云服务。


9月4日,PPIO派欧云在上海发布全新的Serverless和模型API服务产品,其分布式云服务正式从边缘云延伸至AI基础设施,目标直指“算力界的滴滴”。

三年降本千倍

三年千倍降本,实现AI普惠。”在姚欣看来,PPIO分布式算力网络的撒手锏是将大模型的推理成本“打”下来。


大模型算力需求主要分为两类,训练算力和推理算力。顾名思义,训练算力用于训练大模型,对算力规模和GPU性能要求高,且需要专业集群、多机协作完成;推理对算力规模和GPU性能要求低,基本单机就能完成绝大部分模型推理。


PPIO派欧云CTO王闻宇对此解释称,AI训练可以类比视频制作,大模型就像制作出来的视频;AI推理则可类比为视频分发(CDN),让大模型为用户所用。因此,未来的推理算力服务更像CDN,是天然分布式的,需要部署在离用户最近的地方,且有超级巨大的用量,而中心云更适合训练。

图片

然而,推理成本高昂、效率低下也是当前困扰整个大模型行业的问题。


AI推理算力市场将呈现指数级增长,未来95%的算力可能都是推理算力。”姚欣认为,在尺度定律的影响下,AI大模型行业普遍相信“大力出奇迹”,单点算力规模越来越大,但是需要大规模训练的厂商越来越少,国外已经在收缩,下一步大模型将走向集中化,这是新应用普及的前兆。


“时光机理论”或许将再次奏效。


2008年到2023年的15年间,姚欣曾经历过视频网站“百团大战”,如今长视频平台的胜利者剩下爱优腾,短视频赛道跑出了抖音、快手,其背后是互联网带宽成本下降了99.96%,半导体芯片成本下降了99.9%。


AI真正落地,同样需要降本增效。


通过算法、系统和硬件协同创新,PPIO推出了专为AI推理场景设计的Serverless产品,该产品的自动弹性触发时延和单实例冷启动速度都达到了业界领先水平,提供模型部署、运行优化、弹性伸缩和API服务。开发者无须再管理和运维算力服务器,而是将精力集中于AI大模型等核心业务开发。

图片

同步推出的还有Model API服务产品,支持AIGC应用开发所需的全模态 API,开发者无须从底层开始研发,甚至无须精通机器学习即可快速部署和调用大模型功能。


“GPU好比毛坯房,所有软装、硬装都需自己搭建;Serverless好比简装房,开发者不用自己运维算力服务器;Model API好比精装房,开发者拎包入住,直接调取API就能实现想要的应用和功能。”王闻宇打了一个形象的比方。

将闲置算力用起来

当前,中国的算力资源存在供需区域不一致、独立重复建设、梯次利用不足等问题,约有47%的数据中心和中小企业机房闲置


我们要做拉人的滴滴,也要做拉货的货拉拉。”姚欣认为,从PPTV到PPIO,从CDN业务到AI基础设施,自己所做的一直是闲置带宽、算力的搬运者和整合者。


当前,PPIO已经成为中国节点最多的分布式云服务商,部署3500多个算力节点,遍布国内1200多个城市,整合了30多T的带宽规模。


华中科技大学教授、长江学者特聘教授、中国计算机学会副理事长金海被聘为PPIO技术委员会主席。金海教授是姚欣的大学老师、伯乐,更是中国分布式计算领域鼻祖级学者。

图片


金海在会上提到,国家东数西算、中国算力网、全国一体化算力中心等战略相当于高铁,性能高、容量大。而算力网的最后一公里,相当于高铁到了高铁站后,需要出租车、网约车等将乘客送往各个地点,PPIO边缘算力网络承担的就是“算力的最后一公里”。


“算力的最后一公里”也是摆在三大运营商面前的难题。作为全国一体化算力网建设的重要主体,中国电信、中国移动、中国联通三大运营商支撑了全国一体化算力网原型试验场的构建,要让算力像水电等基础设施一样按需调度。


中国铁塔是三大运营商背后的基础设施运维方,在其智能算力调度管理项目中,PPIO打造的分布式算力网络,可实现不同地区、不同时间、不同业务的弹性算力调度和大模型推理加速,使广泛分布的产业园、写字楼、住宅、文娱、高校等不同园区都能按需调取推理算力,满足不同应用需求,包括智能数据处理、大模型部署、AIGC生成、AI算法加速、渲染加速等。

寻找“24岁的姚欣”

当前,上海正在打造两大AI中心,西有徐汇“模速空间”,东有浦东“模力社区”。8月30日,上海浦东新区“模力社区”揭幕,坐落于张江科学城城市副中心,24家垂类模型上下游生态企业入驻“模力社区”,形成了“上下楼就是上下游”的AI新生态圈。


姚欣的第一次创业项目PPTV就从张江起步,这里是他梦开始的地方。2018年,从硅谷回国后,创业老兵姚欣仍旧选择在张江重新出发。


“我们正在对接张江科学城现有的算力平台,整合碎片化的资源。”姚欣向《IT时报》记者透露。


虽然重新回到创业赛道,但姚欣仍然有着投资人的情怀。站在AI新时代的门槛前,他想寻找24岁的姚欣,寻找下一个抖音、快手。


于是,PPIO的生态朋友圈向年轻的AI初创者抛出了4000万算力券。PPIO联合PingCAP、Zilliz、AscentStream和CSDN,共同启动“Pioneers AI初创加速计划”。该计划面向AI初创企业和开发者,提供包括分布式算力、分布式关系型数据库、分布式向量数据库、分布式消息队列等在内的全面资源和技术服务,单家初创团队最多可节省30万元应用开发成本。


这些AI初创企业很难具备从零建设算力基础设施的能力,资金、技术、支持、信念等都将助力初创团队在AI市场中抢占先机。


姚欣透露,目前已有不少长尾中小型开发者加入PPIO生态朋友圈,使用分布式算力服务,包括电商图片设计、游戏原画设计、数字人、自动化营销客服、AI音频生成等,也许24岁的姚欣就会从中出现。

排版/ 季嘉颖

图片/ 派欧云  东方IC

来源/《IT时报》公众号vittimes

E N D


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1