智谱AI在2023中国计算机大会(CNCC)上推出了全新的ChatGLM3基座大模型及其系列产品。这款最新的模型采用了创新的多阶段增强预训练方法,以实现更加充分的训练效果。
智谱AI的首席执行官张鹏亲自进行了新品发布,并通过实时演示展示了产品的最新功能。据介绍,通过使用更丰富的训练数据和优化的训练方案,ChatGLM3的性能得到了显著提升。与之前的ChatGLM2相比,MMLU提升了36%,CEval提升了33%,GSM8K提升了179%,BBH提升了126%。
此外,ChatGLM3还进行了针对GPT-4V的迭代升级,引入了一些全新的功能。其中包括具备多模态理解能力的CogVLM-看图识语义,在10余个国际标准图文评测数据集上取得了领先水平;代码增强模块Code Interpreter能够根据用户需求生成并执行代码,自动完成数据分析、文件处理等复杂任务;网络搜索增强模块WebGLM-接入搜索增强,能够自动查找互联网上与问题相关的资料,并在回答时提供参考的相关文献或文章链接。ChatGLM3的语义能力和逻辑能力得到了极大的增强。
此外,ChatGLM3还集成了自研的AgentTuning技术,激活了模型的智能代理能力,特别是在智能规划和执行方面,相较于ChatGLM2提升了1000%;同时还实现了对国产大模型的原生支持,包括工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。
除了以上功能,ChatGLM3还推出了可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,支持多款手机品牌,包括vivo、小米、三星等,甚至支持移动平台上CPU芯片的推理,速度可达20 tokens/s。在精度方面,1.5B和3B模型在公开benchmark上的性能与ChatGLM2-6B模型相当。
通过最新的高效动态推理和显存优化技术,ChatGLM3的推理框架在相同硬件和模型条件下,相较于其他开源实现,如伯克利大学的vLLM和Hugging Face TGI的最新版本,推理速度提升了2-3倍,推理成本降低了一倍,每千tokens的成本仅为0.5分。这使得ChatGLM3成为当前最具竞争力和高效性能的大模型之一。
智谱AI的新一代ChatGLM3基座大模型以其强大的性能和丰富的功能,将为用户提供更加高效、智能的交互体验,并在各个领域展现出巨大的潜力。