在国内竞争激烈的“百模大战”中,智谱AI被业界寄予厚望:这家成立于2019年的公司,是国内最早研发大模型的企业之一,由清华大学知识工程实验室(KEG)技术成果转化而来;在今年10月底,智谱AI官方宣布,年内已经累计完成25亿元的融资。业内也有分析称,其估值已超过150亿元。
2024年开年,智谱AI公布了最新动态。1月16日的首届技术开放日上,智谱AI团队展示了其三年多来积累的技术成果,并发布了新一代基座大模型GLM-4。智谱AI的CEO张鹏表示,新一代国产全自研的基座大模型GLM-4,中文能力已可比肩GPT-4。他还称,2024年将是AGI(通用人工智能)元年。
(图源/智谱AI)
01 GLM-4模型全家桶来了
还记得OpenAI在去年的首届开发者大会吧?让所有的AI创业者几乎都夜不能寐——除了GPT-4性能升级,包括128K的上下文长度、更强的控制能力,模型提升多模态能力、知识升级等之外,用户可以打造专属于自己的GPTs。这场大会上提到的GPT商店,也在2024年实现——今年1月11日凌晨,OpenAI在其官网发布公告,正式上线了业界期待已久的GPT store。
而在智谱AI的开放日上,我们也看到了国内企业追赶OpenAI的不懈努力。
在大语言模型预训练框架中,存在不同的技术路径。像OpenAI选择的是GPT,而智谱AI则自研了GLM预训练架构。2019年成立后,公司就在做相关的算法研究;2022年8月,智谱AI的双语千亿级预训练模型GLM-130B正式上线。在当年的斯坦福大学大模型中心对全球主流大模型进行全方位评测中,GLM-130B成为亚洲唯一入选模型,并在准确性等部分标准方面被认为,已与GPT-3持平。
据资料显示,目前智谱是唯一全内资、国产全自研的大模型企业。CEO张鹏曾对市界表示,这对智谱AI的商业化也是有利的。毕竟,安全性已经成为大模型领域最受关注的问题,而自研也意味着风险可控。2023年8月底,作为8家首批通过备案的大模型公司之一,智谱AI推出了AI助手“智谱清言”。
也因此,在业内,智谱AI曾被视作是最具有“OpenAI气质”的大模型公司。
在智谱AI看来,GLM-4的发布及上线,是其大模型研发上的关键突破。在开放日上,其技术团队也重点介绍了GLM-4的性能。
据智谱AI表示,GLM-4的整体性能相比上一代实现了大幅提升,逼近GPT-4。比如说,它可以支持更长的上下文,具体来说,GLM-4可以支持128k的上下文窗口长度;单次提示词可以处理的文本,可以达到300页之多。同时,多模态能力方面,文生图和多模态理解都得到了增强。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。
现场举的例子里,像“鱼眼镜头中,有一只乌龟坐在森林里”,以及“一只打扮的像20世纪80年代的职业摔跤手的博美犬,脸上涂着霓虹绿、霓虹橙,还有亮绿色的颜料”这样复杂的提示词,模型也作出了基本准确的理解。
(图源/智谱AI)
此外,GLM-4的All Tools能力“全家桶”发布——这也让人联想起了OpenAI的“GPT Store”。据了解,GLM-4的All Tools能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。
在去年6月,OpenA就提出Agent是AI应用层的发展方向。AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。360集团创始人周鸿祎在日前的“2023年风马牛年终秀”上也预测,Agent(智能体)将激发大模型潜能,成为超级生产力工具。
智谱AI表示,GLM-4大幅提升了智能体能力。GLM-4 All Tools 实现了自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。
对标OpenAI推出的“自定义GPT”——GPTs,智谱AI发布的GLMs个性化智能体定制功能也在开放日同时上线。用户用简单的提示词指令就能创建属于自己的GLM智能体。智谱AI表示,这也是为降低大模型使用门槛所做的努力。
02 构建大模型生态之路,需要共同努力
在大模型纷纷开放后,国产大模型竞争已进入新阶段,大模型的商用化也提上日程。在此前张鹏曾对市界坦言,智谱一直在思考通用大模型和垂直行业大模型之间的关系。在当下的时间段内,通用大模型在技术上、服务的适配性上还有不足,而不同行业内低成本、快速满足某些特定场景的需求,催生了众多垂直大模型。但在他看来,行业大模型的发展,仍然无法脱离通用底座,提升通用大模型的能力和实用性,才是最基础的。
AI生态的建立,还是要依赖底层技术的发展上,它们是相辅相成的。“通用模型和行业模型,不是并行竞争的关系,而应该是合作关系。后者以前者为底座,站在它们的肩膀上往上走。”张鹏曾如是说。
智谱AI自己也在推动大模型在产业场景中的应用。在智谱AI的官网上显示,其主要拥有大模型MaaS平台、AMiner科技情报平台和认知数字人三块主要业务。在此基础上,智谱AI形成了产品矩阵,除了数字人和AMiner外,还包括AI助手、编程、写作、绘画等大模型产品。
和GPT-4相比,国内大模型的能力仍然还需要继续提升。新阶段的“百模大战”,还在持续进行中,企业的技术实力,仍然还是在这场竞争中胜出的决定性因素。
国内大模型生态的创建,也需要不同主体的共同参与。
2024年,智谱AI计划发起开源开放的大模型开源基金,其中包括三个“一千”:将为大模型开源社区提供1000张卡,助力开源开发;提供1000万元的现金,用来支持与大模型相关的开源项目;为优秀的开源开发者提供1000亿免费API tokens。
张鹏表示,智谱AI也将联合生态伙伴发起总额10亿元的大模型创业基金,用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。
“大模型创新研发是一条长征路,我们希望与人工智能行业所有的参与者、产业链上下游合作伙伴、开发者社区、学术界一同努力。”他说。(作者|杨洁 编辑|孙春芳)