作为人工智能时代的新型基础设施,AI算力中心已成为人工智能产业发展的重要技术“底座”。当前,AI大模型引领着全新一轮人工智能应用的热潮。
在这一巨大机遇下,最先受益的是云厂商,这是由于云计算能够提供大模型所需的计算、存储等资源与服务,并且灵活可扩展、弹性调度,帮助企业迅速起步、降低成本,成为大模型训练、AI推理的必要基础设施。
我们可以看到,大模型正在带动云业务的发展,各家云厂商也在积极为企业训练和部署大模型提供包括AI算力在内的多元算力。其中,青云科技作为国内云厂商的中坚力量,也在不断扩展AI业务,但他们不像大厂那样“大包大揽”,而是寻求到一条最适合自身发展的路径。
企业对AI算力需求旺盛,但仍面临挑战
当下,人工智能正成为推动人类进入智能时代的决定性力量,并开始广泛应用于各行各业,展现出可观的商业价值和巨大的发展潜力。社会算力总量增长惊人,预计其中的通用算力至少要增长10倍,人工智能、高性能计算等重算力至少增长500倍。算力网络建设,必须是先抓“主要矛盾”,应优先从增量入手,从智算网络建设切入,布局未来。
青云科技总裁林源表示:“未来整个AIGC的投入占企业IT投入的占比,一定会越来越高,这是从客户市场的需求来说。客户的需求起来,对于底层算力的要求也会越来越高。”
众所周知,AI和大模型的爆发促使生产力的变革。在这个技术催生的市场变化过程当中,很多东西在发生变化,从客户的需求,从客户对于算力的要求、对应用的要求,以及对于底层架构都在发生变化。变化的好处是它会带来新的机会,新一轮的变化就是新一轮的机会,就是重新的竞争,大家又回到同一起跑线,重新争夺市场的机会。
但AI算力需求井喷的同时,企业在获取AI算力上也存在不少痛点:
第一,AI算力离不开计算、网络、存储等各种复杂底层资源和生态环境的创新与支撑。这些客观因素给企业自建数据中心,带来了非常高的技术和成本门槛。
第二,AI大模型的训练和推理,是一个复杂的技术体系,涉及多元算力统一、高效、灵活地调度和管理。而如何屏蔽底层异构基础设施的差异,按需及时获取不同的算力资源,满足不同业务场景的需求也非常关键。
第三,除了底层基础设施的支持外,强大的技术支撑团队、快速的AI需求响应能力、协助企业快速落地AI应用等方面支持,也是当下企业的全新需求。
在此背景下,面对企业对于算力和算力应用的需求,青云科技发布AI算力调度平台,该平台实现对GPU算力、CPU算力、HPC算力、多存储、多模型资源、数据资源等多元资源的统一管理,打破网络速度瓶颈和环境搭建复杂等制约,面向多业务场景,提供多租户、计量、计费等丰富的运营功能,达到“像管理本地资源一样管理AI基础设施”的目标,全面提升算力中心的运营效率与平台能力。
林源解释道:“AI算力调度平台服务的对象是现在和未来投入计算中心建设的企业,它是计算中心运营者的关键工具,帮企业建立起建设运营的闭环。”
AI算力调度平台价值为何?
财报显示,青云科技今年上半年实现AI算力服务收入2651万元,AI算力服务已经成为该公司非常重要的新增长点及公司战略级业务,这也意味着青云科技未来也将把核心重点资源向这一业务倾斜。
其实,早在三年前,青云就在布局算力领域,开始服务国家超算济南中心,这是一个多元计算中心,同时也是一个异构算力中心,其中包括HPC超算、传统云计算(以CPU为主)、智算(以GPU为主),而且还存在国产化GPU产品的兼容。在该超算中心建设方案里,几乎所有产业链上的厂商都在,但整个算力调度平台是由青云独家供应的。如今,国家超算济南中心已经成功运营并实现盈利。
青云科技产品经理苗慧认为:“国家超算济南中心成功实践的背后,是因为青云AI算力调度平台具备多区域业务资源整合、分布式调度与管理、AI训练平台、算法开发支持、灵活调度、混合组网、模型仓库(MaaS)、高速并行存储、容量推理服务平台等九大关键能力,可以做到像管理本地资源一样管理AI基础设施。”
同时,在芯片国产替代、智简运营运维和生态构建方面,青云也在持续迭代,具备了完整的平台能力。青云经过公有云积累的大量产品实践和运维运营经验,形成了成熟的产品力。
经过不断地优化,本次青云科技推出的青云AI算力调度平台进行了全新的产品升级,苗慧介绍:“我们这次推出的主要产品和主要迭代,像AI算力平台、推理平台、镜像仓库,全都是面向AIGC或整个AI领域上,专门推出业务化的产品。”
针对企业最为关注的数据安全问题,青云采用零信任机制,并将用户间的数据存储与计算 “完全隔离”,青云为每个用户的资源生成一个子网,该子网只有用户自己可见。子网既支持25G及以上的以太网,也支持IB网络,帮助用户确保数据安全。
而且,青云科技还在进行更多探索,比如帮助客户像管理本地资源一样,管理AI基础设施,提供多元、智能化的算力调度,保证算力能快速建立起来。这些都代表着青云利用自身多年在科技领域的深耕和远见,助力更多企业跟上AI时代的步伐。
基于AI,体现生态价值
在云计算发展的十年间,服务商们习惯于从底层的数据中心、硬件到软件、PaaS都自建、自投、自营,但这也造成了他们研发费用急剧增加,也使得公司的运营成本越来越高。在AI时代,做好每一层都需要更长时间积累和投入,成本还要远超此前,对于服务商来讲这些支出将是他们不可承受的。
对于客户而言,他们还是希望获得包括机房、算力、调度平台、模型驱动、模型、Model Service、上层应用等完整的解决方案。因此,服务商们另辟蹊径,告别了“单打独斗”的日子,逐渐形成一个紧密联系在一起的生态同盟。
林源解释道:“在AI领域一定会出现巨头,但不应该是一家独立的公司,而是一个小的生态,聚合起来提供包含每一层的服务,彼此开放,长期共赢。”
对于青云而言,他们只需把自己最擅长的AI算力调度平台做好,然后承接上下游生态伙伴的产品和方案,共同打造一个可以闭环运转的算力体系,目前来看,青云AI算力生态体系已初具规模:
AI算力生态包含Intel、NVIDIA、AMD、中科曙光、天数智芯、燧原科技、中科驭数、大禹智芯等国内外企业;
AI模型生态包括智谱清言、紫光太初2.0、商汤科技商量等多个大模型;
算力服务生态既包括济南超算、清华大学智算中心,也有中国电信这样的算力供应方;最上层已经有金融、交通、制造业、能源、自然资源等行业应用生态。
青云认为未来的AI时代,企业一定是通过算力服务、算法和模型、高价值的数据来实现智能化,这也是AI生态体系的价值所在。青云的积累在于云计算的十年成长,因为分布式、融合算力等发展特征都决定了,基于云的部署是算力服务升级的重要前提。
在采访最后,林源表示:“总而言之,青云希望通过开放的、成熟的、可运营的一个AI算力调度平台,通过自营、合营乃至支撑第三方运营的方式,与生态同盟一起贡献我们的AI Cloud”
可以预见,未来青云将联合更多的企业、高校、研究机构,并整合算力产业链上下游,打造算力生态,满足企业算力需求,让用户以更低廉的成本,使用更优质的算力。
写在最后
从过往的十年来看,青云科技从最早的公有云、私有云、混合云再到云原生、信创云,一次次证明了自身建立平台的能力,而下一个十年的开始,他们继续选择以平台为基础,依靠技术实力将AI算力融入至平台中,打造出一款跨时代的产品,在助力各行业进入AI时代的同时,也让青云科技向顶峰继续攀登。
可以预见,AI时代的来临,无疑会为各个企业带来全新的挑战,但同时也蕴含着巨大机遇,也许在云市场中已经开始重新洗牌。