4月24日,商汤-W(0020.HK)股价涨超30%。4月23日,商汤科技发布日日新5.0大模型,采用混合专家架构,基于超过10TB tokens训练数据,推理时上下文窗口可以有效到 200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。
商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”
商汤端侧大语言模型可在中端平台实现18.3字/s的平均生成速度,旗舰平台可达78.3字/s。扩散模型端侧推理速度小于1.5秒,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。
徐立还展示了商汤的文生视频能力,并表示会在很短时间发布文生视频平台。(澎湃新闻记者 秦盛)