从中国的OpenAI,到世界的智谱。
作者|赵健
大模型的融资节奏在放缓,但远没有结束。
12月17日,“大模型六小虎”之一的智谱宣布完成新一轮30亿人民币融资,引入多家战投及国资,君联资本等老股东继续跟投。
这是智谱近期可查的第二轮融资。今年9月,中关村科学城公司宣布以投前200亿估值领投智谱。智谱成为当前估值最高的国产大模型公司之一。
同时,智谱也首次公开其商业化成绩: 2024年商业化收入增长超过100%,平台日均Tokens消耗量增长150倍。其中,MaaS平台的API年收入同比增长超过30倍,MaaS平台已经吸引了70万企业和开发者用户。
智谱业务覆盖智能汽车、制造、大消费、金融、政务服务、医疗健康、游戏娱乐、文化旅游等行业,近期推出的Agent带动大模型在智能设备的落地。
C端产品智谱清言App拥有超过2500万用户,年化收入(ARR)超千万。清言可以通过文本、图像、音频、视频来进行多模态互动,是拥有最全模态的AI助手。
对于本次融资,智谱打算怎么花?还会继续做预训练吗?
此前业内曾有传闻有两家大模型公司放弃预训练。在上周的2024甲子引力年终盛典上,智谱CEO张鹏对此明确回复:“ 我们肯定一直在做预训练,今年8月份还刚刚发布了最新迭代的模型GLM-4-Plus。按照我们的节奏,差不多4~6个月就会迭代一版新模型。”
今天的大模型有从预训练转向后训练的趋势,OpenAI发布的o1模型就代表了向推理的范式转移,国内已经有AI公司在迅速跟进。关于智谱在预训练与后训练推理的算力分配,张鹏也在甲子引力现场透露,“大约一半一半”。
智谱表示,本轮融资将用于智谱基座大模型的进一步研究, 从回答问题升级到解决复杂推理、多模态任务,更好地支撑行业生态发展。
在国内的“大模型六小虎”里,智谱是最稳扎稳打的一名。2023年年初,智谱曾定下目标:用一年的时间追平OpenAI最先进的模型。此后两年时间里,智谱大部分资源都投入在了确定性最高、风险最小的领域,那就是紧盯行业内最好的AI公司——OpenAI,从底层的预训练框架,到模型,到最上层的应用,做全方位的对标。
在预训练层,智谱在2020年自研了预训练框架GLM(General Language Model),这是与OpenAI的GPT(Generative Pre-trained Transformer)并不相同的技术框架。
基于GLM预训练框架,智谱在2021年训练完成百亿参数模型GLM-10B,同年利用MoE架构成功训练出收敛的万亿稀疏模型,2022年研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。GLM-130B已经实现大模型在昇腾、海光、神威等国产平台上的从零训练,适配在寒武纪、摩尔、燧原等国内外40多种GPU芯片上的高效推理。
基于全自研基座大模型的能力,智谱打造了完整的模型产品,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。
图片来自智谱
2023年,智谱推出千亿基座对话模型ChatGLM并两次升级,开源版本的ChatGLM-6B让大模型开发者的本地微调和部署成为可能。目前,智谱开源模型系列全球累计下载量超过3000万,并入选Hugging Face平台最受欢迎人工智能机构。
2024年1月,智谱推出新一代基座大模型GLM-4,整体逼近GPT-4;6月,智谱开源GLM-4-9B及视觉模型GLM-4V-9B,多模态能力媲美GPT-4V;7月,智谱推出视频生成模型CogVideoX以及视频生成产品“清影”,与Sora直接对标;8月,智谱新升级基座大模型GLM-4-Plus推出;10月,智谱发布对标GPT-4o的端到端情感语音模型GLM-4-Voice。
如果智谱的发布节奏停留在此,可以说智谱仍然只算是一名追赶者,OpenAI始终领先半步。但接下来,智谱在10月发布大模型交互智能体AutoGLM,以及11月的升级版本和GLM-PC,意味着智谱真正走到了探索AI创新的最前沿。
AutoGLM与GLM-PC是智谱发布的Agent产品,前者可以模仿人类操控手机(phone use),后者可以模仿人类操控电脑(compute use)。在11月的发布会上,张鹏在现场演示了用AutoGLM在微信里建群并在群里发出了100个、总价值2万元的红包。
萨姆·奥尔特曼也非常看好Agent技术的突破,但OpenAI目前尚未发布类似产品。
此前,智谱公布了其接下来面向AGI的的路线图。
智谱定义了大模型发展的五个阶段,与OpenAI的定义有所不同,其中,L1代表语言能力,L2代表逻辑思维能力与多模态能力,L3代表使用工具(Agent)的能力,L4代表自我学习的能力,L5代表全面超越人类、探究科学规律的能力。
图片来自智谱
并且,智谱也提出了他们认为每一个阶段的进度条。目前,L1的语言能力已经达到80%;L2的逻辑思维能力完成度为60%,o1模型是推理模型的新范式;L3 Agent的能力还比较早期,只有40%,与人类相比还有很大的提高空间;L4、L5基本才刚刚开始。
张鹏认为,目前的Agent能力更像是在用户和应用之间,增加一个智能的调度层,链接所有应用甚至是所有设备。 这可以看做是大模型通用操作系统(LM-OS)的一种雏形。未来,基于大模型智能能力(从L1到L4乃至更高),有机会实现原生的人与机器交互的方式LM-OS,这将改变人与机器交互的方式。
去年,大模型公司都被看作“中国的OpenAI”,某种程度上这仍然是跟随者的标签。自从2023年下半年开始,智谱就在很多场合强调,做中国的ChatGPT远非公司的目标。
很多人可能忽略了,智谱成立于2019年,远远早于ChatGPT发布的时间点。智谱成立的第一天,就写下了“让机器像人一样思考”的愿景,这跟今天的AGI殊途同归。
据「甲子光年」了解,今年有智谱员工在飞书的个性化签名上写着: “不做中国的OpenAI,做世界的智谱”。
这句话也可以看作智谱通往AGI之路的必经之路。
(封面图来自2024甲子引力年终盛典)