当前位置:首页|资讯

国泰君安:计算机国产大模型性能领先 场景应用加速落地

作者:金融界发布时间:2024-12-31

智通财经APP获悉,国泰君安发布研报称,DeepSeek-V3的发布标志着国产AI在规模、效率和成本方面实现重大突破。DeepSeek-V3在多项评测中超越多款顶尖模型,且成本极具竞争力,其强大性能与开源策略显著提升了其市场竞争力,具备高投资价值。因此AI大模型在各行业落地的技术路径有望逐步明确,MoE架构的低成本、高性能的大模型在垂类领域中的运用潜力巨大。

国泰君安主要观点如下:

DeepSeek-V3的强大性能与开源策略显著提升了其市场竞争力,具备高投资价值。

DeepSeek正式发布了其全新系列模型DeepSeek-V3,并同步开源。该模型为自主研发的MoE架构,拥有6710亿参数和37亿激活参数,在14.8万亿token上进行了预训练。DeepSeek-V3在多个评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,其性能与顶尖闭源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知识类任务、长文本处理、代码编写和数学竞赛等方面表现出色。

DeepSeek-V3的生成速度提升和灵活的API定价策略为用户带来更高的使用价值。

通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从每秒20次提升至60次,实现了3倍的性能提升,用户体验更加流畅。DeepSeek调整了API服务的价格,新的定价为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元。高性价比有望为DeepSeek带来了更大市场份额和收入增长。

DeepSeek-V3的开源权重和本地部署能力增强其社区支持和应用扩展性,推动了技术生态发展。

DeepSeek-V3采用FP8训练,并开源原生FP8权重,得到开源社区的广泛支持。DeepSeek提供从FP8到BF16的转换脚本,方便社区进行适配和拓展应用场景。模型权重可通过HuggingFace平台下载,进一步促进了本地部署和多样化应用。这种开放的生态系统为其在AGI普惠化方面奠定了坚实基础。

风险提示:较低定价压缩盈利空间,技术竞争加剧的风险。

来源:智通财经网


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1