当前位置:首页|资讯|AGI|GPT-4

智谱AI CEO张鹏:2024年是AGI元年,大模型Scaling Law远未看到天花板

作者:搜狐科技发布时间:2024-05-18

北京智谱华章科技有限公司CEO张鹏

出品 | 搜狐科技

作者 | 任婧瑄

5 月 15 日,以“AI浪潮下,企业如何穿越技术周期”为主题的数实融合研讨会暨《数实融合》新书发布会召开。北京智谱华章科技有限公司CEO张鹏参会并发表演讲。

在张鹏看来,人工智能不是一个理论基础非常完整、完善的学科,而是一个一边发展,一边定义,一边修改自身、产生新概念的学科。

从整体发展趋势来看,张鹏指出,自1960年第一次人工智能浪潮以来,大模型诞生后的早期效果并不太好、起伏也较少。但是随着时间的推移,模型的参数量每年以十倍上涨,终于在近期迎来了爆发。

用人的大脑与大模型进行对比,张鹏在会上分享了认知双系统理论。人的大脑由对应直觉思维、下意识、自动轻松决策的系统一(快系统),和对应理性、有意识、刻意练习复杂决策的系统二(慢系统)组成。双通道处理理论,简而言之就是如果决策不合适,那就继续反复推理的过程。

他表示,大模型就是对快系统的建模,是预测、对比、反馈学习的不断的过程,

从发展层面来看,张鹏表示,人工智能已经经历了三个阶段。第一代是“符号AI”,目标是知识的可搜索性。但是“符号”太累、太难,而且人类会一直不断地产生新知识。

第二代“感知智能”实现了知识的可计算性。他认为,这一阶段最重要的进步就是把符号转算成数值计算,例如运用概率论等。

谈及知识的可计算性,如何才能将文字变成可计算的东西?他解释道,假设将所有单词映射到二维空间,每个单词就会有自己的坐标,那么通过空间的向量就能完成计算。

与静态坐标相比,他指出,Transformer的动态表示能力能够在一词多义等更复杂的情况下,更精准地得到答案。

目前的“认知智能”阶段是第三代,围绕的是认知的可计算性。比如,如何让人工智能进一步推理、决策。

为什么是大语言模型?为什么非要从语言入手?张鹏在会上引用了维特根斯坦的话,“语言的边界即世界的边界”。

据张鹏讲解,人类的感知能力,如听觉、嗅觉等都是先天的,只有语言是为了表达、压缩、交换知识而人造的。大模型建立认知系统,从语言开始学习最为容易,因为它能够包含、描述所有感知。但训练的数据在抽象层面能力更强,对于人类肌肉动作的理解较弱。

既然语言已经涵盖所有知识,为什么还需要多模态?张鹏解释道,除了语言,行为控制和感知系统等区域并不是相互分隔开的,而是互相有联系的。人的大脑智能在于协同,而多模态则是要实现人脑智能的本质。

现在的大模型能做什么?以OpenAI为例,GPT-4能参加美国各种类型的考试,能考出满分GRE的成绩,也能做通识问答、逻辑推理、序列预测生成、代码生成。

张鹏介绍,智谱最新的GLM-4已经能在MMLU、LAMBADA等国际测评中达到GPT-4 95%能力水平,这其中包括长文本能力、文生图能力、自定义GLM应用和智能体能力。

对于企业来讲,如何利用好AI?张鹏强调,过去企业通常把AI当作嵌入式的工具,未来将会是“人机协同”。

“我们不止希望它降本增效,更重要的是突破创新。”张鹏表示,2024年是AGI元年,智谱 AI将坚持技术升级和市场驱动。“大模型Scaling Law还远未看到天花板。”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1