智谱AI发布新一代基座大模型GLM-4，“国产GPTs”生态来了？

作者：蓝鲸财经发布时间：2024-01-16

图片来源：智谱AI公众号

2024年1月16日，智谱AI在首届技术开放日（Zhipu DevDay）上展示了自己追赶Chat GPT的野心与实力，发布了新一代基座大模型GLM-4和文生图产品CogView3。此外，智谱AI还推出GLMs个性化智能体定制能力以及智能体中心，新功能对标美国人工智能公司OpenAI去年11月在其开发者大会上公布的定制功能——GPTs及其分享平台GPT Store，后者虽然因高层风波被推迟，但也已在当地时间2024年1月10日正式上线。

在基座大模型产品方面，智谱AI首席执行官张鹏表示：“从标准的大模型评测角度看，整体上我们已经接近了GPT-4。”相比上一代，GLM-4的性能全面提升近60%，它支持更长的上下文、更强的多模态支持和更快速的推理等。

具体来说，GLM-4单次提示词能够支持128k的文本长度，相当于处理300页的文本。即使是面对如此庞大的文本数量，GLM-4在Neddle test（大海捞针）测试中可以做到几乎100%的精度召回。在多模态生成能力上，智谱AI还推出的图像生成AI产品CogView的第三代，逼近OpenAI发布的DALL·E 3。

张鹏在多项能力上将GLM-4和GPT模型进行了对比。值得关注的是，GLM-4的中文对齐能力总分超过了GPT-4。根据智谱AI官方披露，用数据集进行测试可以得出，GLM-4在中文专业能力、中文理解能力和角色扮演上的表现得分均高于GPT-4和GPT-4 Turbo。在多任务语言理解、提示词跟随、指令跟随等基准测试，以及包括GSM8K、Math等多项数据集当中，GLM-4的表现均优于GPT-3.5。

图片来源：智谱AI首届技术开放日直播

除了单项性能有所提升外，GLM-4还具备All Tools能力——一个指令可以调动各种工具。得益于GLM模型的强大Agent能力，GLM-4实现了自主根据用户意图，自动理解、规划复杂的指令，自由调用网页WebGLM搜索、Code Interpreter代码解释器和多模态形成的能力。GLM-4的All Tools能力可以处理各种类型的任务，包括数据分析、图表绘制、PPT生成等常见的文件处理，旨在用自动化的方式解决提示词复杂这一痛点。例如，让GLM-4呈现过去十年的全球GDP数据，大模型可以联网对多个数据源进行检索，并将找到的数据可视化为一张简单的图表，这个过程涵盖了搜索提取代码解释器和绘图多项工具。

如今，围绕AI大模型的竞争已从“PGC”时代跨越至“UGC”时代。张鹏表示，智谱AI的决心是围绕开发者继续研发新一代的基座大模型，建立大模型生态。

这一野心被落实到GLMs个性化智能体定制能力上，GLMs对标OpenAI在去年11月上线的GPTs，支持用户用简单的提示词创建属于自己的GLM智能对话机器人。与此同时，智谱AI还上线了智能体中心，让用户分享自己创建的智能体GLM模型。这一举动与OpenAI在当地时间2024年1月10日上线的GPT Store类似。

智谱AI注册成立三年多以来，这个被称为国内“最具OpenAI”气质的公司背后，是各大投资机构和科技巨头的身影。天眼查APP显示，智谱AI目前收获了8轮次超25亿元人民币的融资，其中有5轮次的融资发生在2023年的下半年。2023年9月19日，腾讯、阿里和高瓴资本等成为智谱AI的B+++++轮投资人，这笔12亿元人民币的交易是智谱AI融资金额最多的一个轮次。2023年8月1日，蚂蚁集团和今日资本向智谱AI投资了4.4亿元人民币。2023年7月17日，美团向智谱AI投资了3亿元人民币。

智谱AI在商业化上也取得了一定的成绩。智谱AI在大模型市场上提出了MaaS（Model as a Service）的商业化落地路径，并针对不同客群类型和需求提供了云端API、云端私有化以及本地私有化等多种商业解决方案。目前，智谱AI已经有2000多家合作伙伴，与200多家单位进行深度的模型共创与共建，覆盖金融、互联网、能源制造等行业。