图片来源:智谱AI公众号
2024年1月16日,智谱AI在首届技术开放日(Zhipu DevDay)上展示了自己追赶Chat GPT的野心与实力,发布了新一代基座大模型GLM-4和文生图产品CogView3。此外,智谱AI还推出GLMs个性化智能体定制能力以及智能体中心,新功能对标美国人工智能公司OpenAI去年11月在其开发者大会上公布的定制功能——GPTs及其分享平台GPT Store,后者虽然因高层风波被推迟,但也已在当地时间2024年1月10日正式上线。
在基座大模型产品方面,智谱AI首席执行官张鹏表示:“从标准的大模型评测角度看,整体上我们已经接近了GPT-4。”相比上一代,GLM-4的性能全面提升近60%,它支持更长的上下文、更强的多模态支持和更快速的推理等。
具体来说,GLM-4单次提示词能够支持128k的文本长度,相当于处理300页的文本。即使是面对如此庞大的文本数量,GLM-4在Neddle test(大海捞针)测试中可以做到几乎100%的精度召回。在多模态生成能力上,智谱AI还推出的图像生成AI产品CogView的第三代,逼近OpenAI发布的DALL·E 3。
张鹏在多项能力上将GLM-4和GPT模型进行了对比。值得关注的是,GLM-4的中文对齐能力总分超过了GPT-4。根据智谱AI官方披露,用数据集进行测试可以得出,GLM-4在中文专业能力、中文理解能力和角色扮演上的表现得分均高于GPT-4和GPT-4 Turbo。在多任务语言理解、提示词跟随、指令跟随等基准测试,以及包括GSM8K、Math等多项数据集当中,GLM-4的表现均优于GPT-3.5。
图片来源:智谱AI首届技术开放日直播
除了单项性能有所提升外,GLM-4还具备All Tools能力——一个指令可以调动各种工具。得益于GLM模型的强大Agent能力,GLM-4实现了自主根据用户意图,自动理解、规划复杂的指令,自由调用网页WebGLM搜索、Code Interpreter代码解释器和多模态形成的能力。GLM-4的All Tools能力可以处理各种类型的任务,包括数据分析、图表绘制、PPT生成等常见的文件处理,旨在用自动化的方式解决提示词复杂这一痛点。例如,让GLM-4呈现过去十年的全球GDP数据,大模型可以联网对多个数据源进行检索,并将找到的数据可视化为一张简单的图表,这个过程涵盖了搜索提取代码解释器和绘图多项工具。
如今,围绕AI大模型的竞争已从“PGC”时代跨越至“UGC”时代。张鹏表示,智谱AI的决心是围绕开发者继续研发新一代的基座大模型,建立大模型生态。
这一野心被落实到GLMs个性化智能体定制能力上,GLMs对标OpenAI在去年11月上线的GPTs,支持用户用简单的提示词创建属于自己的GLM智能对话机器人。与此同时,智谱AI还上线了智能体中心,让用户分享自己创建的智能体GLM模型。这一举动与OpenAI在当地时间2024年1月10日上线的GPT Store类似。
智谱AI注册成立三年多以来,这个被称为国内“最具OpenAI”气质的公司背后,是各大投资机构和科技巨头的身影。天眼查APP显示,智谱AI目前收获了8轮次超25亿元人民币的融资,其中有5轮次的融资发生在2023年的下半年。2023年9月19日,腾讯、阿里和高瓴资本等成为智谱AI的B+++++轮投资人,这笔12亿元人民币的交易是智谱AI融资金额最多的一个轮次。2023年8月1日,蚂蚁集团和今日资本向智谱AI投资了4.4亿元人民币。2023年7月17日,美团向智谱AI投资了3亿元人民币。
智谱AI在商业化上也取得了一定的成绩。智谱AI在大模型市场上提出了MaaS(Model as a Service)的商业化落地路径,并针对不同客群类型和需求提供了云端API、云端私有化以及本地私有化等多种商业解决方案。目前,智谱AI已经有2000多家合作伙伴,与200多家单位进行深度的模型共创与共建,覆盖金融、互联网、能源制造等行业。