由ChatGPT掀起的大模型热潮仍在席卷,科技巨头们正摩拳擦掌争先涌入这条赛道,没有人甘愿放弃这场角逐赛。
继3月份百度推出“文心一言”、4月初阿里云达摩院开启“通义千问”外部测试之后,华为云也要下场了。
华为云官网显示,其自研的大模型“盘古”即将对外上线,但并未显示具体的上线时间。
4月8日上午,华为云人工智能领域首席科学家田奇现身《人工智能大模型技术高峰论坛》,分享了华为云盘古大模型的进展及其应用。
据悉,田奇是美国伊利诺伊大学香槟分校博士、IEEE Fellow(美国电子电气工程师学会会士),也是原德州大学圣安东尼奥分校计算机系正教授。2020年3月起,田奇加入华为云,参与了盘古大模型立项至今的研发进程。
最强大的国产ChatGPT?
事实上,盘古大模型在两年前就曾公开亮相,但未曾开放外部使用。
早在2021年4月,刚刚接任华为云CEO的余承东在HDC华为开发者大会上宣布“华为云盘古系列AI大数据模型”正式发布。彼时余承东自信表示:“这是今天最重磅的产品。”
根据公开信息,华为云从2020年9月就开始推动盘古大模型项目的立项,并在2020年11月内部立项成功。
最初发布时,该系列模型中共包括四个子模型,分别为:NLP(自然语言处理)大模型、CV(计算机视觉)大模型、多模态大模型、科学计算大模型。
其中NLP正是ChatGPT、文心一言、通义千问等近期走红的大模型所属的技术领域。盘古NLP大模型是由华为云、循环智能和鹏城实验室联合开发,被称为是业界首个千亿参数的中文预训练大模型。
在2021年4月正式亮相后,盘古系列大模型仍在持续更新。根据田奇分享,2021年9月,华为云发布了盘古药物分析大模型;2022年6月,华为云发布了盘古矿山大模型;2022年11月,盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型同期亮相。
▲(华为云盘古大模型发展历程,图源/人工智能大模型技术高峰论坛)
在4月8日上午的演讲中,田奇主要提及了盘古CV大模型、科学计算大模型等的具体应用,对盘古NLP大模型仅以寥寥数语带过:“NLP大模型来讲的话,我们去年交付了一个阿拉伯语的千亿级大模型,也在一些榜单上取得了比较好的成绩,同时去年在备案检索方面、在中国智能技术评测中也取得了第一的成绩。”
尽管仍稍显神秘,华为云的大模型已吸引了众多眼球。西南证券研报写到:“盘古大模型将是超过任何其他类似应用的最先进、最强大的自然语言处理应用。”
民生证券研报同样曾指出:“(华为云盘古大模型)是目前最接近人类理解水平的预训练模型。将通用知识与行业经验相结合,在生成与理解性能上处于领先地位。”
华为盘古,剑指AI碎片化场景应用
在分享中,田奇将华为云盘古大模型在过去一年的实践总结为:“在2022年的话,主要是做好行业应用AI和Industry(工业),希望在煤矿、水泥、电力、金融、农业创造更多的产业价值来帮助客户。”
未来,华为云盘古NLP大模型或将在智能文档搜索、智能ERP(企业资源计划)、小语种大模型等行业或领域率先落地。田奇称:“业界预计人工智能的行业渗透率持续攀升,到2026年将达到20%。而随着近期的AI大模型的爆发,接下来渗透率提升可能进一步提速。”
▲(图源/人工智能大模型技术高峰论坛)
整体而言,华为云盘古大模型强调泛化能力、重点发展方向在于细分场景的落地应用、赋能千行百业。与之对比,较早发布的百度文心一言更加强调在与用户对话互动、协助创作、信息整合等方面的应用。
行业观察者张雪峰告诉「市界」:“不同企业的大模型在应用场景、数据来源、算法模型等方面有所不同。这些模型的异同也反映了不同企业在技术积累和市场布局方面的差异。”
接下来,随着商汤科技、科大讯飞等科技企业陆续推出相应产品,大模型赛道将进一步拥挤起来。
然而,尽管许多玩家同台竞技、试图夺下一张参与全球技术浪潮迭代的“早鸟票”,市场普遍认为未来大模型市场势必将迎来新一轮的整合与洗牌。
如OpenAI(ChatGPT的发布方)创始人Sam Altman曾经预测:“将来应该会出现几个大型的基础模型,开发人员都将基于这些基础模型研发AI应用。”
田奇也在分享中提到,未来“大模型将成为应对AI领域应用碎片化的一种方式,相较于此前不同场景对应不同小模型的状况,未来大模型有可能收编高度定制化的小模型,导致市场向大公司集中”。
这场人工智能应用角逐赛才刚刚开始。
作者 | 董温淑
编辑 | 董雨晴