智东西
作者 | 程茜
编辑 | 李水青
智东西3月14日报道,今天,在百度生成式AI产品“文心一言”发布前夕,智东西等媒体探访了百度阳泉智算中心。
据百度智能云方面透露,“文心一言”背后的算力基础设施均由百度智算中心支持,后续百度多个智算中心也将为“文心一言”面向产业的规模化落地提供底层支撑。在百度阳泉智算中心内部,支撑“文心一言”的机房正在全力运转、测试,全力备战“文心一言”的发布。
▲百度阳泉智算中心OCU
百度阳泉智算中心于2021年4月正式投入使用,2022年12月对外开放服务,该智算中心搭载了百度自主研发的AI基础设施“AI大底座”,作为亚洲最大单体智算中心,每秒可以完成4EFLOPS(400亿亿次浮点运算)。
从去年年底开始,百度智能云就在全面升级云服务能力。包括去年12月发布国内首个全栈自研AI基础设施“AI大底座”,今年2月升级AI研发运营一体化(MLOps)能力,今年3月百度阳泉智算中心完成升级。
参观百度阳泉智算中心后,百度智能云云计算产品解决方案和运营部总经理宋飞、昆仑芯科技战略负责人宋春晓与智东西等媒体进行了深入交流。
一、智力“涌现”背后,生成式AI产品落地有三大挑战
生成式AI热潮爆发,超大规模的预训练模型的出现能够激发出大模型的更多能力。
当模型参数达到一定量级后,大量的智能能力具备一定的泛化、推理和逻辑能力,从图表可以看出,智力表现不是随着模型参数线性增长的,而是会出现突增,也就是说当模型规模达到一定程度后,大量的智能能力才具备“涌现”的基础,预训练大语言模型就是AI走向AGI(通用人工智能)的“船帆”,大模型可以帮助企业增强使用AI落地场景的能力。
预训练大模型已经成为AI发展的新方向。大模型可以结合无监督数据去训练,不需要人工对细节场景做很多标注,同时自监督学习能力也能够大大减少基础模型训练的复杂度。研发人员再对少量任务数据做一定的迁移学习,就可以解决一定的问题。
不过,在生成式AI热潮爆发背后,云计算对于企业的价值也发生了根本质变,从提供基础设施转变为提供智能服务。
面对这种变革,生成式AI产品在产业规模化落地上对于智能算力、AI基础设施以及AI工程化水平提出了多重挑战。宋飞说:“大模型对算力需求不同,必然在基础设施打造上会有较大的升级。行业场景落地形态不一样、带宽的不同等,都相比于传统数据中心会有很大不同。”
生成式AI产品的数据量巨大,对于AI算力提出了更高要求,这也对现有计算机体系结构提出挑战;文心一言等生成式AI产品的计算场景复杂、计算架构多维,企业进行AI开发需要集芯片、框架、模型及应用为一体的全栈基础设施,端到端的智能化闭环AI开发的全流程;最后是生成式AI产品落地实践时,需要基于具体业务场景进行二次适配开发。
宋飞说:“这些潜移默化的变化使得现在企业构建一个数据中心和之前思考的问题不一样了。”企业在构建智能计算基础设施时往往面临两大痛点,分别是系统性能低和研发成本高。企业需要花费大量时间、精力去构建云基础设施,但往往这些基础设施的搭建组合不能发挥其最佳性能和效率;再加上,基础设施的运营和维护需要企业投入大量的资金。
二、助推生成式AI落地普及,百度智能云升级三大配套云服务
针对以上难点,在文心一言发布前夕,百度智能云提升了其三大配套云服务,基于其“云智一体”优势提出了解决方案。
首先是为企业提供巨量高性能智能算力。百度目前已在山西阳泉、江苏盐城等地建设了智算中心,其中,百度阳泉智算中心是亚洲最大单体智算中心,建设规模为4EFLOPSAI算力。昆仑芯科技战略负责人宋春晓透露:“昆仑芯2代已在百度文心大模型的应用中广泛落地,并为各行各业的智能化升级提供AI算力支持。”
并且,昆仑芯3代将于2024年初量产,采用XPU-R架构,通用性和性能显著提升。
大模型时代对算力需求提出了更高挑战,宋春晓谈道,昆仑芯将在架构、设计上做创新来满足算力,加强芯片本身的互联以及降低成本,来满足大模型时代的算力需求。
此外,百度数据中心在技术架构、建设管控和运维保障层面的创新可使PUE低至1.08,实现了高效节能的运行,从而降低客户的电费和运维成本。
▲百度阳泉智算中心配电站
其次,为企业提供新型AI基础设施。百度推出国内首个全栈自研的AI基础设施百度AI大底座,其核心特征为全要素、端到端优化以及极致效能。
百度AI大底座对算力、框架、模型、AI应用进行了封装,从昆仑芯、飞桨深度学习框架、文心预训练大模型到AI应用,实现了端到端智能化闭环,能够大幅降低企业开发成本,提升效率。宋飞说:“百度AI大底座可基于实际业务数据进行不断调优,使得资源利用率提升至70%,企业开发效率提升100%。”
飞桨作为产业级深度学习平台,也被称为AI时代的操作系统,连接算力和算法层,能够让开发者开发便捷的深度学习框架。
文心大模型是是全球首个知识增强千亿大模型,能够做到标注数据更少、模型效果更优、创造能力更强,并且可以灵活定制场景。
百度的沉淀的行业语料库会对预训练模型通过知识图谱进行大量格式标注,不需要人工标注,并快速将这些语料变成高质量的训练数据。未来,文心大模型将通过百度智能云更多的赋能行业。
最后,百度智能云还会为企业提供AI研发运营一体化(MLOps )能力。相关企业在接入文心一言后,可低成本、便捷地完成与业务成精的适配与二次开发。
三、城市大脑、智能制造……百度AI大底座促进AI普惠
企业通过百度AI大底座可以构建全新一代智算中心解决方案,其应用领域包括城市大脑、智能制造、自动驾驶、绿色能源和智能超算等。
此前,基于AI大底座,百度智能云和吉利打造了“1+6+N”吉利混合云平台,该平台可通过计算资源服务、存储资源服务等基础设施,使得吉利管理运维成本降低30%,资源利用效率提高20%。
在智慧城市场景中,宜昌点军区创建了百度智能云-昆仑芯智能生态中心,这一生态中心包括昆仑芯片搭建的人工智能算力中心、城市级视频中台、数据中台系统等。
基于AI中台构建的城市AI基础设施海淀城市大脑,覆盖渣土车综合治理、城市管理时间识别、路面事件检测等。
此外,国家电网与百度智能云联合打造了相应人工智能基础平台。百度智能云还与某全国性股份制商业银行,软硬一体环境投产运行已经超过一年半。
结语:升级云服务,为生成式AI普及提供助力
生成式AI热潮涌起,其引发的海量数据计算、算力需求激增都对企业提出了新的挑战。作为国内搜索引擎巨头玩家,百度在中文语料领域拥有大量的积累,在算力基础设施等层面也拥有大量优势,其技术优势对于生成式AI产业在国内的落地具有推动作用。
在百度生成式AI产品“文心一言”发布之际,百度提升了三大配套云服务,对企业快速布局、应用生成式AI产品搭载了助推器,有望看到生成式AI在更广泛的领域迸发更多的应用场景,促进AI普惠。
生成式AI的爆发,引发的海量数据等为算力需求提出了新的挑战。