当前位置:首页|资讯

腾讯云TI平台同步开放接入MoE模型“混元Large”

作者:动点科技发布时间:2024-11-06

今天,腾讯最新的MoE模型“混元Large”以及混元3D生成大模型“Hunyuan3D-1.0”正式开源。开发者可在HuggingFace、Github等技术社区直接下载。这次开源的腾讯混元Large模型,与腾讯混元Pro、腾讯混元Turbo等不同尺寸的模型源于同一技术体系,已经在腾讯内部业务经过验证和广泛使用。腾讯元宝、微信公众号、小程序、微信读书、腾讯广告、腾讯游戏、腾讯会议等近700个内部业务和场景,都应用了混元大模型的能力。

腾讯混元Large模型总参数量 389B,激活参数量 52B ,上下文长度高达256K。它采用国内外主流的MoE架构模型,推理成本远低于同等参数的稠密模型。在最新的公开评测中,腾讯混元Large 在CMMLU、MMLU、CEval、MATH等多学科综合评测集以及中英文NLP任务、代码和数学等9大维度全面领先。

此外,腾讯混元Large 模型已同步上架腾讯云TI平台。支持一键启动混元Large精调,帮助用户训练出满足业务需求的专属大模型,提升研发效率。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1