“盘古大模型正在推动人工智能开发从“作坊式”到“工业化”升级。
作者 | 简春燕
编辑 | 栗子
沉寂两年之后,华为大模型又回来了。
4月8日上午,由中国人工智能学会主办的人工智能大模型技术高峰论坛在杭州萧山举办。华为云人工智能领域首席科学家田奇出席论坛,介绍了华为云盘古大模型的进展及其应用。
事实上,华为云从2019年开始研发盘古大模型,并在2021年首次发布。但发布后的盘古大模型并未引发过多关注,反而逐渐淡出大众视野。作为国内科技龙头,大家对华为寄予厚望,期待盘古大模型在当今AIGC时代中能引领潮流。
“三年磨一剑”,如今,华为盘古大模型再次亮相。
如今,人工智能已经加速进入了千行百业,预计到2026年,人工智能对行业的渗透率将会达到20%。而AI大模型是连接技术生态和商业生态的桥梁,也是科研创新走向产业应用的重要枢纽。
据田奇介绍,华为将大模型分为基础大模型L0、行业大模型L1、细分场景模型L2三个层级。
首先将基础大模型L0与行业数据相结合,进行混合训练得到行业大模型L1,最后将行业大模型L1灵活适配下游行业细分场景,在数据基础下进行微调和部署,得到场景模型L2。
基础大模型基于一站式AI开发平台ModelArts进行加速优化训练,其中包括NLP大模型、CV大模型、以及科学计算大模型。
会上,田奇主要介绍了盘古CV大模型以及科学计算大模型。而倍受关注的类GPT大模型——NLP大模型,华为此次并未提及相关细节。
盘古CV大模型在2021年发布时,为业界最大的CV预训练模型,达到30亿参数,首次兼顾判别与生成能力,并且在ImageNet上小样本学习能力达到业界第一,充分应对了当前计算机视觉面临的信息高度稀疏、域间差异较大等挑战。盘古科学计算大模型为人工智能与科学计算在模型、算法、软件、硬件四个层面的结合。
基础大模型发布后,华为云陆续发布了矿山、气象、海浪、金融OCR等系列盘古行业大模型。
盘古CV大模型可以应用于工业质检、物流仓库监控、时尚辅助设计等行业,NLP大模型应用于智能文档搜索、智能ERP、小语种大模型等领域;科学计算大模型可以应用于气象预报、海浪预测等领域。
会上,田奇介绍了华为云盘古CV大模型在矿山及铁路方面的应用案例:
与此同时,华为云发布了华为云盘古科学计算大模型在气象、药物分子以及空气质量优化三个领域的大模型应用:
田奇表示,目前,华为云盘古大模型的重心是做好行业应用,其希望形成关键技术壁垒,在煤矿、水泥、电力、金融、农业、国家云创造更多的产业价值。
同时,华为云盘古大模型希望解决传统AI开发的难题,实现低门槛AI开发,拥有更高的泛化性能和精准度,实现缺陷样本高效筛选,解决碎片化问题。
在未来,华为将基于华为云的大数据、大算力与大模型,实现“边端云协同”,为企业客户、消费者、开发者提供华为云大模型。
田奇提到,从小模型到大模型是人工智能的发展趋势。但大模型对资金、技术的门槛很高,开发和训练一次需要花费数千万美元,并且需要专业人员,拥有深度优化AI框架、并行计算能力的能力。因此未来高度定制化的小模型可能会被大模型收编,导致市场向大的研究机构和企业集中。
田奇表示,盘古大模型正在推动人工智能开发从“作坊式”到“工业化”升级。同时他认为:“展望未来,AI for Industries是人工智能新的爆发点。”