当前位置:首页|资讯|AI大模型|华为

5小时到10秒,速度提升10000倍—AI大模型掀起重大变革!

作者:YINTL咨询发布时间:2023-07-12

原标题:5小时到10秒,速度提升10000倍—AI大模型掀起重大变革!

本文约1500字,阅读需5分钟。

华为云盘古气象大模型是精度超过传统数值预报方法的AI模型,突破了 AI 预报天气精度不及传统数值预报的世界性难题。

是首个精度超过传统数值预报方法的 AI 预测模型,对比传统方法预测速度提升 10000 倍,可秒级完成对全球气象的预测。

UNSW的托比教授—“让我担心的,不是聪明的AI,而是愚蠢的AI。”

7月7日,2023 华为开发者大会(HDC 2023),华为常务董事、华为云CEO张平安宣布华为云盘古大模型(以下简称“盘古大模型”)迎来重大升级。

旨在做出能让企业和用户买单的产品和服务,为行业赋能创造价值。

华为开发者大会HDC 2023后,万达、中软国际、金域医学、竹间智能等企业宣布与华为盘古大模型签订战略合作协议。

什么是AI大模型

AI大模型是一种机器学习模型,它可以学习和处理更多的信息,比如图像、文字、声音等,也可以通过训练,完成各种复杂的任务。比如智能语音助手、图像识别软件都会用到AI大模型。

AI“大数据+大算力+强算法”结合的产物,凝聚了大数据内在精华的“隐式知识库”。

包含了“预训练”和“大模型”两层含义,即模型在大规模数据集上完成了预训练后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用。

AI小模型

“小模型”:针对特定应用场景需求进行训练,能完成特定任务,但是换到另外一个应用场景中可能并不适用,需要重新训练(我们现在用的大多数模型都是这样)。

这些模型训练基本是“手工作坊式”,并且模型训练需要大规模的标注数据,如果某些应用场景的数据量少,训练出的模型精度就会不理想。

人工神经网络

人工神经网络作为AI模型的内核,在近几年来重新受到了关注,人工神经网络(Artificial Neural Network,简称ANN),是20世纪80年代以来人工能领域兴起的研究热点。

类似模拟人神经系统中神经元相互计算传递的过程,从而实现对复杂模式学习与分类,由输入层、输出层、隐藏层组成。

它从信息处理的角度对人脑神经元网络进行抽象建模,按不同的连接方式组成不同的网络,在工程与学术界也常简称为神经网络或类神经网络。

[5+N+X]三层架构

盘古大模型 3.0 是一个面向行业的大模型系列,包括「5+N+X」三层架构:

  • 「5」代表 L0 层的五个基础大模型,包括 NLP、视觉、多模态、预测、科学计算五个基础模型,提供满足行业场景中的多种技能需求。盘古 3.0 提供了 100 亿、380 亿、710 亿和 1000 亿参数等基础大模型,以匹配不同场景、时延、响应速度的行业多样化需求。
  • 「N」代表 L1 层的 N 个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练自有的专用大模型。
  • 「X」则代表 L2 层为客户提供了更多细化场景的模型,L2 层提供了更多细化场景的模型,更专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供「开箱即用」的模型服务。

为行业“而生”

“盘古为行业而生,就要为行业着想,更好地服务千行百业的客户。”张平安表示,盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。

张平安称,在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,同时预测速度也有大幅提升。

原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。

现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果;对比传统方法预测速度提升 10000 倍,可秒级完成对全球气象的预测

结语:大模型的创新不仅仅是模型自身的创新,面临自下而上自主创新的宏大命题,华为正在走出新的机遇。

YINTL经过十七年的咨询服务实践,坚持和实践“数字智慧管理”这一理念,致力于成为客户数字化转型的赋能者,以全流程数字化咨询模式,帮助企业数字化转型升级落地;

如需了解更多数字化转型、数据治理的全流程咨询方案,欢迎垂询:kf@yintl.cn/491326734@qq.com


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1