当前位置:首页|资讯|华为|AI大模型|ChatGPT

一文看懂:华为盘古系列AI大模型到底是个啥?附:盘古发布会观看地址

作者:江湖科技事务所发布时间:2023-04-13

原标题:一文看懂:华为盘古系列AI大模型到底是个啥?附:盘古发布会观看地址

注:华为将在4月8日上午11:00,发表《盘古大模型的进展及其应用》的专题演讲,主讲人是田奇(华为云人工智能首席科学家),内容非常有看点。观看地址见文后(或置顶评论)。

首先要跟大家说明的是,华为盘古AI大模型是一个系列,并不是只有一个!根据华为云官方资料,盘古系列大模型包括以下五个基础大模型(L0)

中文语言(NLP)大模型

视觉(CV)大模型

多模态大模型

科学计算大模型

图网络(Graph)大模型

盘古大模型的结构图

中文语言(NLP)大模型,是业界首个超千亿参数的中文预训练大模型,被认为是最接近人类中文理解能力的AI大模型。与ChatGPT等外国AI模型相比,华为盘古大模型更注重针对中文语言的优化。其首次使用Encoder-Decoder架构,兼顾NLP理解与生成的能力。在预训练阶段学习了超40TB文本数据,并通过行业数据的小样本调优,提升模型在场景中的应用性能。在权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046(人类水平是85.61分),多项子任务得分业界领先。

视觉(CV)大模型,是超过30亿参数的业界最大CV大模型,首次实现模型按需抽取,首次实现兼顾判别与生成能力。它可以基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地,使AI开发进入工业化模式,。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。

CV大模型的训练过程

图网络(Graph)大模型,首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用。

多模态大模型,具备图像和文本的跨模态理解、检索与生成能力。

科学计算大模型,主要解决各种科学问题,旨在用AI促进基础科学的发展。

盘古L0大模型 图片来源:浙商证券研究所

除了以上五个基础大模型(L0)以外,盘古大模型不断进化,共分为L0、L1、L2三个层级。L0指基础大模型,L1指行业大模型,L2则是指面向更加细分场景的推理模型。

盘古气象大模型

盘古小分子药物大模型

目前在L1级别的行业大模型方面,华为已经推出了盘古金融大模型、盘古矿山大模型、盘古气象大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。

L2级细分场景模型方面,华为已经推出,例如基于气象大模型的短临气象预报、台风预测等场景模型;例如基于电力大模型的无人机电力巡检、电力缺陷识别等场景模型;例如基于时尚大模型的时尚辅助设计、时尚版权保护等场景模型。此外,在物联网、智能座舱、智能驾驶等领域,华为都已推出基于盘古大模型的各种应用。

盘古大模型生态 图片来源:浙商证券研究所

生态建设方面,华为盘古大模型是基于昇腾计算产业生态。关于AI生态型产业链,华为提出“一平台双驱动”的模式。其中“一平台”指基础软件平台,包括AI处理器、服务器硬件以及芯片使能软件、AI框架。“双驱动”指平台要支撑的两大生态,一是技术生态,二是商业生态,包括ISV(独立软件开发商)、IHV(独立硬件开发商)、整机、一体机合作伙伴等。

华为盘古生态产业链

华为将在4月8日上午11:00,在《人工智能大模型技术高峰论坛》上,发表《盘古大模型的进展及其应用》的专题演讲,主讲人是田奇(华为云人工智能首席科学家),内容非常有看点。观看地址如下:

https删://weibo.删com/删7585110331/删MAtJFlO4t


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1