12月28日,百度首席技术官王海峰宣布,百度旗下的知识增强大语言模型——文心一言的用户规模已突破1亿。2023年3月,百度在国内科技公司中率先发布知识增强大语言模型,到8月末,文心一言面向公众开放后,用户规模和提问数量一路攀升,开发者数量也大幅增长。
事实上,2023年我国大模型领域不断迎来积极进展。近日,全国首个官方“大模型标准符合性测试”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试,这也意味着这些厂商的相关技术要求,通用性、智能性等维度达到国家相关标准,未来可以在更广泛的场景中应用,满足不同行业和用户的需求。
文心一言用户数量突破1亿
12月28日,在百度举办的“第十届WAVE SUMMIT深度学习开发者大会”上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰宣布,百度文心一言用户规模已突破1亿。
“自8月31日获准开放对公众提供服务以来,文心一言的用户提问量一路上扬,基本与文心大模型的效果提升同步,越来越多的用户在信任和使用文心一言。”王海峰在上述大会现场表示。
百度自2019年起布局预训练模型研发,发布了“文心大模型1.0”。经过近四年积累,2023年3月,百度在全球科技大厂中发布了知识增强大语言模型文心一言。同年8月31日,文心一言向全社会全面开放,并在短时间内用户日活跃度超过百万,登上AppStore首位。
实际上,百度年内已多次迭代旗下大模型的各项能力。2023年10月,文心一言的基础模型升级到4.0,相较于上一个版本,文心大模型4.0在理解、生成、逻辑和记忆四大人工智能基础能力得到全面提升。彼时,百度创始人李彦宏表示,文心4.0是迄今为止最强大的文心大模型,综合水平“与GPT-4相比毫不逊色”。据王海峰最新透露,自文心大模型4.0发布以来,该模型在过去2个多月整体效果又提升了32%。
据百度智能云官网最新披露,百度文心大模型调用量居国内首位,日均调用量达数千万次,每月服务企业超过1万家;截至2023年11月,文心一言用户数超过7000万,覆盖场景4300个。企业用户可通过百度智能云“千帆大模型”平台调用文心大模型,目前,千帆平台累计服务超过4万家企业用户,累计帮助企业精调近1万个大模型。
在12月28日的大会现场,王海峰还介绍了百度旗下深度学习平台——百度“飞桨”生态的最新成果:截至2023年12月底,飞桨已凝聚1070万开发者,服务23.5万家企事业单位,基于飞桨创建了86万个模型。
四家国产大模型通过官方测试
事实上,2023年以来,我国大模型领域不断取得进展,多家科技公司宣布进入大模型赛道,并陆续有各大厂商发布相关产品,并展示各自特点与优势。
在此背景下,中国电子技术标准化研究院发起“大模型标准符合性评测”,以开展模型的理解能力、生成能力、安全性等30多个维度评测,为评估大模型能力水平提供全面的测试报告。据了解,该评测对外征集了学术界、产业界几十家头部单位意见,围绕多维度展开,涵盖语言、语音、视觉等多模态领域,是基于官方大模型测试基准的权威评测。
12月22日,全国信息技术标准化技术委员会人工智能分委会全体会议公布了全国首个官方“大模型标准符合性测试”结果:百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型率先通过测试,符合《人工智能大规模预训练模型 第2部分:评测指标与方法》语言大模型的相关技术要求,通用性、智能性等维度达到国家相关标准。
通过首个官方标准的四家国产大模型各自具有自身特点和优势。
据了解,阿里云通义千问是上述四家大模型中唯一的开源大模型。据阿里云介绍,通义千问大模型在全球拥有广泛的开发者用户和企业客户,其性能表现及安全性得到了大范围的公开检验。阿里云方面称,阿里云已开源通义千问18亿、70亿、140亿、720亿参数的4款大语言模型,在多个相关评测中创下开源模型的优异成绩。
腾讯旗下的混元大模型发布时间相对较晚,据介绍,混元大模型拥有超千亿的参数规模、超2万亿tokens的预训练语料,具备强大的中文创作能力,复杂语境下的逻辑推理能力以及可靠的任务执行能力。
而360集团发布的360智脑大模型则侧重于安全性,360表示,公司自研的360智脑大模型拥有千亿级参数规模,具备生成创作、多轮对话、逻辑推理等十大核心能力,依托自身在安全领域的积累和优势,成为全国首个原生安全的大模型。
大模型商业化进程不断提速
2023年,我国语言大模型市场规模实现较快提升,在商业化进程方面也在不断提速。
据央视新闻近日报道,工业和信息化部赛迪研究院数据显示,目前,我国已有超过19个语言大模型研发厂商,其中,15家厂商的模型产品已经通过备案。预计2023年,我国语言大模型市场规模将达到132.3亿元,增长率将达到110%。
展望未来,有行业专家预测,到2027年,中国的语言大模型市场规模有望达到600亿元。此外,赛迪研究院数据显示,中国生成式人工智能市场也呈现出强劲的增长势头,今年市场规模预计将超过10万亿元。在2023年,生成式人工智能的企业采用率达到15%,市场规模约为14.4万亿元。在制造业、零售业、电信行业和医疗健康等四大行业的生成式人工智能技术的采用率均取得较快增长。
此外,中国信息通信研究院有关负责人此前曾表示,大模型作为产业智能化基座,在识别、理解、决策、生成等任务中表现出泛化性、通用性、迁移性潜力,与实体经济深度绑定,在金融、工业、能源等领域进一步落地,持续释放技术红利。
来源:券商中国