当前位置:首页|资讯

幻方量化DeepSeek-V3首个版本上线

作者:钛媒体快报发布时间:2024-12-27

钛媒体App 12月27日消息,幻方量化全新系列模型DeepSeek-V3首个版本上线并同步开源,API服务已同步更新,接口配置无需改动。当前版本的DeepSeek-V3暂不支持多模态输入输出。据介绍,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1