在沉寂两年后,华为云官网近期展示了盘古系列 AI 大模型,同时华为也做出预告,华为云人工智能领域首席科学家田奇将于 4 月 8 日 11:00-11:30 介绍“盘古大模型的进展及其应用”。
根据华为云官网显示,华为即将上线的“盘古系列 AI 大模型”分别为 NLP 大模型、CV 大模型、科学计算大模型(气象大模型)。其中 NLP 大模型是被认为最接近人类中文理解能力的 AI 大模型,而 CV 大模型首次兼顾了图像判别与生成能力。
国盛证券刘高畅等人在 3 月 26 日发布的研报中表示,盘古 NLP 大模型是业界首个千亿参数的中文预训练大模型;盘古 CV 大模型业界最大 CV 大模型、首次实现兼顾判别与生成能力、在 ImageNet 上小样本学习能力上的业界第一;盘古气象大模型提供秒级天气预报;紫东。太初是全球首个图、文、音三模态大模型。
其中最受关注的就是盘古 NLP 大模型,该模型采用了深度学习和自然语言处理技术,并使用了大量的中文语料库进行训练。该模型拥有超过 1 千亿个参数,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等等。
与 ChatGPT 等外国 AI 模型相比,盘古大模型更注重针对中文语言的优化,使用了大量的中文语料库进行训练,可以更好地理解中文语言的语法和语义。
从参数与数据堆量来看,百度参数 100 亿,数据只有 4 TB,而 GPT-4 达到了 1750 亿,数据 45 TB。华为的盘古大模型最大亮点就是数据堆量,参数达到 1000 亿,数据高达 40 TB,仅从参数角度盘古大模型已经接近 GPT 3.5 的水平。
IT之家注意到,在 3 月 23 日举行的华为春季旗舰新品发布会上,华为带来全新智慧搜图功能,基于多模态大模型技术,在手机端侧对模型进行小型化处理,这也使得华为的盘古大模型成为市场各大机构关注的焦点。
重磅消息!我们 IT之家 App 中的金币将可以兑换更多礼品,今天我们做一期调研,看看大家更想要哪些礼品。欢迎大家点击我们今日推送的第三条内容,参与我们的投票!