近期,国内多家科技巨头陆续推出自己的大模型产品,如百度的文心一言、阿里巴巴的通义千问和科大讯飞的星火大模型。
而今天,腾讯也正式发布了自己的通用大语言模型——“混元大模型”。
在今天举办的2023年腾讯全球数字生态大会上,腾讯宣布自主研发的“混元大模型”正式亮相。据腾讯表示,混元大模型的中文能力超过GPT3.5。
据悉,腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。
在此次大会上,蒋杰展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入腾讯混元大模型后的实际应用情况。
比如腾讯会议基于混元大模型打造了AI小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。
据实测,在指令理解、会中问答、会议摘要、会议待办事项等多个方面,混元大模型均获得较高的用户采纳率。
在多个场景下,腾讯混元大模型已经能够处理超长文本,通过位置编码优化,混元大模型的长文处理效果和性能得到了提升,同时结合指令跟随优化,产出内容更符合字数要求。
值得一提的是,混元大模型还具有识别“陷阱”的能力,即通过强化学习方法拒绝被“诱导”。例如,用户可能问出难以回答或无法回答的问题,安全诱导类问题的拒答率可以提升20%。
目前,基于该模型的多模态对话Bot产品“腾讯混元助手”微信小程序现已开放内测申请,用户可申请排队体验,审核通过将短信提醒。
据介绍,腾讯混元助手可以回答各类问题,也能处理多种任务,如:获取知识、解决数学问题、翻译、提供旅游攻略、工作建议等。
腾讯混元助手首页由聊天和灵感发现两个Tab组成,聊天功能和会话类AI产品类似。
与ChatGPT不同的是,腾讯混元助手已经集成了不少指令集,同时会在首页给你推荐一些问题。
近几个月,国内正在上演“百模大战”,据不完全统计,中国10亿以上参数规模的大模型超过80个,推出大模型主要有互联网公司,包括阿里云、字节跳动、京东云、昆仑万维等,还有商汤、科大讯飞、云从科技等传统的AI公司。