当前位置:首页|资讯|商汤|GPT-4|编程

商汤发布日日新5.0大模型:推理上下文窗口200K,对标GPT-4 Turbo

作者:IT之家发布时间:2024-04-24

IT之家4月24日消息,4月23日,商汤科技发布了日日新5.0大模型。据介绍,该模型采用MOE混合专家架构,在知识、数学、推理和代码能力方面大幅提升。该模型基于超过10TBtokens训练,具备200K推理上…...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1