腾讯科技讯(郭晓静)1月16日,智谱AI在DevDay技术开放日上,正式发布新的基座大模型GLM-4,同时发布的还有GLMs。
近日,OpenAI也刚刚发布GPTs及GPT Store,但智谱AI希望直接对标OpenAI,“我们还在不断地追赶OpenAI,追赶GPT,他们有的,我们都要有。” 现场,智谱AI也公布了GLM-4的全面能力测试结果,其中,其中文能力全面超越GPT-4,但是在偏人类常识理解测试的HellaSwag中,表现最弱。
除此之外,GLM-4同时发布了All Tools ,可以根据用户意图,自动理解、规划复杂指令,调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能也同时上线,用户自然语言提示词的指令就能创建属于自己的 GLM 智能体。
一、GLM-4公布多角度测试结果
智谱AI在此次发布会从多个方面呈现了GLM-4的能力评测,从智谱AI现场公布的分数来看,其中在编程能力测试(HumanEval)上,超越GPT-4,其它能力接近GPT-4或与GPT-4持平,但是最弱的是HellaSwag测试,测试大模型是否理解人类常识等。
二、上线GLM-4 All Tools全家桶
智谱AI在技术开放日上还发布了All Tools,简单来说,就是一个任务可以全面调用各种能力,在OpenAI的GPT中,就有这样的功能,用户可以用All Tools调用各种能力,创建一个自己专属的Agent。
GLM-4可以根据你的意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和文生图CogView3模型。同时,GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比GSM8K、Math以及Math23K三个数据集上的结果,GLM-4 All Tools取得和GPT-4 All Tools相当的效果。GLM-4的All Tools能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。
三、AI绘图大模型CogView3,可连续绘图
基于上下文语境理解,可以连续创作,我们也真实体验了一下,在增加主体、增加环境背景等方面,呈现效果比较连贯。
四、对标GPTs,GLMs也将公布开发者分成计划
对标GPTs,GLMs个性化智能体定制能力也同步上线。用户只要登录智谱清言官方网站,用简单的提示词指令就能创建属于自己的GLM智能体。并且,用户可以通过全新上线的智能体中心分享自己创建的各种智能体。
CEO张鹏在现场宣布,很快即将公布GLMs应用商店的开发者分成计划。
五、建立开源基金,为开源社区提供1000张卡
在活动现场智谱AI宣布,2024年将发起开源开放的大模型开源基金,该计划包括三个“一千”:智谱AI将为大模型开源社区提供一千张卡,助力开源开发;提供1000万元的现金用来支持与大模型相关的开源项目;为优秀的开源开发者提供1000亿免费API tokens。智谱AI也将“Z计划”进一步升级,联合生态伙伴发起总额10亿人民币的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。
2024年被业界普遍认为是人工智能发展历史上的又一重要年份,智谱AI CEO张鹏表示:“大模型创新研发是一条长征路,一枝独秀不是春,我们希望与人工智能行业所有的参与者、产业链上下游合作伙伴、开发者社区、学术界一同努力,为中国AI新未来贡献绵薄之力。”