当前位置:首页|资讯|腾讯|GPT-4|生成式AI

腾讯混元大模型部分中文能力已追平GPT-4,还要坚定拥抱开源……|关注

作者:元创数智在线发布时间:2024-05-17

就在今日,腾讯云生成式AI产业应用峰会召开。大会披露了腾讯混元大模型、行业大模型的最新能力升级,并推出知识引擎等多个智能工具和场景应用。

据腾讯集团副总裁蒋杰对外透露,腾讯混元大模型经过持续迭代,目前整体性能已经居国内第一梯队,部分中文能力追平GPT-4。此外,混元也已经在腾讯内部600多个业务和场景中落地测试。此外,基于混元大模型打造的C端助手App腾讯元宝将于5月30日发布。

大模型落地加速,“产业实用”成为发展共识。在这场属于腾讯的AI盛宴上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生对外阐述了腾讯在大模型布局上的思考:大模型的打造只是起点,把技术落地到产业场景,创造价值才是目标。

混元大模型将坚定拥抱开源

自2023 年 9 月首次亮相以来,腾讯混元大模型不断探索最新技术,已拓展至万亿规模,并在国内率先采用混合专家模型(MoE) 结构,带来模型总体性能的升级,相比上一代Dense模型提升50%。此外,针对不同场景需求,腾讯混元在中小型模型方面同样积极部署,研发了1B、3B、7B、13B等不同参数量下的 Dense 和 MoE 模型。

据了解,在多模态能力方面,腾讯混元大模型已经取得不少成果。比如,在生图领域,腾讯混元文生图基础架构已全面升级至 sora 同款的 DiT 架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,视频生成长度可达 16秒;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。

腾讯方面对外表示,这些模型能力将通过腾讯云API对外开放,以满足企业客户及开发者在不同场景下的模型需求,让大模型能力真正落地到产业应用中。

在腾讯云上,混元大模型提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard以及百亿参数的hunyuan-lite等多种尺寸的模型服务,其中 hunyuan-standard 模型具备 256k 的超长上下文理解能力,单次处理字符数超过38万个。

同时,腾讯加入大模型开源阵营的步伐已然更加坚定。蒋杰在会上宣布,腾讯混元大模型将坚定拥抱开源,为技术社区生态繁荣贡献力量。

据悉,目前,腾讯混元文生图大模型已全面开源,开源 3 天内就在Github上获得超千位开发者关注。未来,多种尺寸的腾讯混元MoE模型也将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。

腾讯还对外宣布,混元将上线一站式AI智能体创作与分发平台“腾讯元器”,开启智能体生态。在平台上,用户不仅可以在创建专属AI智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、微信客服、腾讯云上。

新推三大AI大模型引擎

以大模型技术为核心,人工智能成为企业数字化发展的关键动力。腾讯援引相关调研指出,超过60%的中国企业计划在未来12至24个月内部署生成式AI。

腾讯方面表示,过去一年,其在服务产业客户的过程中,发现产业对模型的需求不断变化。

一方面,随着产业信息的载体多元化,模型的需求不仅仅是处理单纯的文字,还需要处理图片、视频等多种信息。大模型的能力竞争从单一文生文,拓展到文生图、文生视频、图生图、图生视频等多模态能力。

另一方面,在降本增效的大环境下,企业对“性价比”的要求更高,期待用更简易的大模型工具,加速应用开发,实现快速投产,满足可持续的投入产出比。

为了更好地解决这些需求,腾讯云推出了大模型原生工具链。在此次的大会上,腾讯相关负责人介绍了腾讯云的三款PaaS新品:“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”。它们的定位都是通过PaaS服务来输出大模型能力,缩短从模型到应用的距离。

根据介绍,大模型知识引擎聚焦企业知识服务场景,以RAG(检索增强生成)技术架构为基础,整合了OCR文档解析、向量检索、大语言模型、多模态大模型等技术,为企业打造出“低门槛”“高效能”的模型应用开发平台,通过“模块化”的应用模板,企业用自然语言,5分钟就可以开发出一款知识服务应用。

目前,腾讯云大模型知识引擎已在政务、金融、教育、出行、零售等多个行业落地。以金融行业为例,据腾讯云副总裁、腾讯云智能负责人吴运声表示,圆心惠保开发出保险代理人的高效惠民智囊,通过大模型技术辅助,自动生成产品知识问答和安抚话术,实现人均提效50%。

在腾讯内部,多款SaaS应用亦依托知识引擎进行升级。比如,在客服场景,企点客服大模型文本机器人,接入大模型多轮任务引擎执行账单查询、退换货类等任务,配置成本比传统文本机器人降低50%。

在大模型知识引擎之外,图像、视频创作引擎,将通过大模型全面提高素材生成效率。据悉,“图像创作引擎”基于腾讯混元的自研图像创作底层模型,输出高质量的AI图像生成和编辑能力,为企业客户提供AI写真、线稿生图、图像风格化等能力。“视频创作引擎”基于多模态算法技术,输出高质量的视频生成与处理能力,提供视频转译、视频风格化、画布拓展等多种功能。

吴运声坦言,腾讯云从产业的实际需求出发,打造出大模型时代的原生工具链,依托三大AI大模型引擎工具,实现数据工程、模型精调、应用开发的流程简化,助力企业更高效、方便地用上大模型。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1