有消息称,华为公司将发布一款名为"盘古Chat"将直接与ChatGPT竞争。该消息指出,盘古大模型于2020年11月在华为云内部开始研发,并计划于今年7月7日在华为云开发者大会上对外发布和内测,主要面向政企端客户。
据华为公布的一份论文数据显示,华为盘古PanGu-Σ大模型的参数数量高达1.085万亿,基于华为自研的MindSpore框架开发。
整体来看,PanGu-Σ大模型在对话方面可能已接近GPT-3.5的水平。目前,AI大模型中的NLP大模型、CV大模型以及科学计算大模型(气象大模型)均已标记为即将上线状态。
这是首个拥有千亿参数的中文预训练大模型,CV大模型参数也达到了30亿。盘古CV大模型是业界最大的CV大模型,首次实现了兼顾判别和生成能力,并在ImageNet上展现出了小样本学习的领先水平。
盘古气象大模型提供秒级天气预报,并借助创新的3DEST网络结构和分层时间聚合算法,在关键要素和常用时间范围上的预测准确性均超过了当前最先进的方法,速度提升了1000倍以上。此外,盘古还是全球首个图文音三模态大模型,具备多模态处理能力。
华为内部团队确定了三个关键的核心设计原则,即大规模吸收海量数据、强网络结构以发挥模型性能、以及优秀的泛化能力适用于不同行业的工作场景。根据华为云高管的演讲PPT,华为盘古系列AI大模型包括NLP大模型、CV大模型和行业大模型等。
盘古大模型由NLP大模型、CV大模型、多模态大模型和科学计算大模型等多个大模型构成,通过模型泛化解决了传统AI开发模式下无法解决的规模化和产业化难题。它可以支持文本生成、文本分类、问答系统等多种自然语言处理任务。
具体来说,盘古NLP大模型采用了Encoder-Decoder架构,兼顾了理解能力和生成能力,保证了模型在不同系统中的灵活嵌入。在下游应用中,只需要少量样本和可学习参数即可快速微调和适配千亿规模的大模型,在智能舆论和智能营销方面表现出色,尤其对一些大公司的公关团队来说很有用处。
盘古CV大模型是业界最大的CV大模型,可以根据模型大小和运行速度的需求自适应选择不同规模的模型,实现快速应用开发。通过层次化语义对齐和语义调整算法,它在浅层特征上获得更好的可分离性,显著提升了小样本学习能力,达到了业界领先水平,在智能巡检和智慧物流方面表现出色。
盘古气象大模型提供秒级天气预报,利用创新的3DEST网络结构和分层时间聚合算法,在关键要素和常用时间范围上的预测精度都超过了当前最先进的方法,相比传统方法盘古气象大模型的位置误差降低了20%以上,是不是能解决天气预报经常不准的问题呢?而且华为的To B业务一直还做得不错,说不定有很多天气APP会找上门来合作。