当前位置:首页|资讯|AGI|ChatGPT

国产大模型四巨头现场激辩:价格战对中国 AI 有利,但降价逼不出 AGI

作者:AppSo发布时间:2024-06-15

与 ChatGPT 交手 500 多天,AGI、Scaling law、以及开源的浪潮依然是 AI 圈风头正劲的话题焦点。

恰逢昨日,一年一度的国内「AI 春晚」——智源大会又再一次拉开了序幕。

智源研究院院长王仲远也与百川智能 CEO 王小川,智谱 AI CEO 张鹏,月之暗面 CEO 杨植麟,面壁智能 CEO 李大海齐聚一堂,展开了一场名为通往 AGI 之路的尖峰对话。

从大模型的技术路径怎么走,到开放生态与封闭研究,再到商业模式的探索等,「大模型四虎」激辩的议题都如重锤击鼓,响彻云霄,隐约勾勒出 AI 下一步的发展方向。

主要观点如下:

大模型通过规模化可以产生智能,总体上大模型在通往 AGI 的道路上没有本质问题。

Scaling law 有助于逼近 AGI,但光靠 Scaling law 不够,需要范式改变。

大模型是通往 AGI 的基石之一,但是否唯一基石取决于 AGI 的定义。

AGI 的定义不需要精确量化,但短期内需要一些量化指标来衡量进展。

AGI 可以通过能否造出医生的能力来衡量,医生是智力密度最高的职业之一。

大模型可以通过降低成本逼近 AGI,但需要更高智能密度的小型化模型。

AGI 的定义是动态的,内涵和外延不断变化。AGI 是目标,当前以人为参照,未来期待超越人类智能的水平。

安全包括意识形态安全、长远的文明安全和现实的模型能力。当前安全问题还未到边界,需努力提升能力。

价格战对中国发展大模型有利,带来普及和减少资源浪费。企业需定位自身角色,不需要大量模型。

端侧模型需要与云侧协同,价格战短期内有营销成分,未来需更健康的商业模式。

APPSO 对本次对话进行了尽量不改变原意的编辑,以供读者翻阅参考👇

大模型是通往 AGI 之路的基石之一

智源研究院院长王仲远:

我也请教一下各位,是否相信大模型是通往 AGI 之路的一个基石,亦或者大家在实际训练大模型的过程中,发现它可能依然只是一个数据的压缩,那可能对于产业界是非常有价值的,但并不一定能够通往 AGI?我想听听各位的看法,植麟?

月之暗面 CEO 杨植麟:

对,我们比较相信大模型的第一性原理,就是通过不断地去提升这个模型的规模,就像仲远刚刚说的,它确实本质上是一个压缩。

但是这个压缩它确实是可以产生智能,然后你随着不断地去规模化这个模型,不断做更好的压缩,它能产生越来越多的智能。

当然就是肯定在这个过程中也会有很多挑战,比如说可能最大的挑战就是,有一些数据可能他并不一定有那么多,对吧?那在数据没有那么多的这个领域,或者说假设你最后要做出来一个可能比人类更好的 AI。

那你可能就根本不存在这样的数据,因为你现在所有的数据就是人产生的,所以我觉得可能最大的问题是怎么去解决这些比较稀缺,或者说甚至可能有一些不存在的数据。

但是我觉得规模化定律或者说大模型本身可能是没有太本质上的这个问题。

百川智能 CEO 王小川:

它(Scaling law)只是在逼近 AGI, 但是光靠 Scaling law,我的理解是不够的。所以在这里面的话,如果从第一性上讲,其实刚才这个亚勤也提到这个事情,就是需要有范式的一个改变。

(APPSO 注释:Scaling law 描述的是随着模型规模(如参数数量、训练数据量)的增加,模型的性能通常会得到提升的现象。)

Scaling law 只是看到的第一件事,我们今天还有一件事情大家比较忽略的,其实是把语言放到大模型的体系里面,把语言变成了数学本身。

语言其实把这个符号的这么一个主义跟连接主义之间产生了一个突破。所以除了这个规模以外的话,符号跟这种连接的融合,我觉得这是中间的一件事情。那么再往前走,还会有更多东西必须有范式改变的。

比如说今天大模型是靠数据驱动,一种学习系统能做压缩,但是反而像之前那类似于像 AlphaGo,一个能够叫思考性的系统?那它也会有这样的一个作用。

所以我的结论来讲的话,一个是我们到了 AGI 的时代。这个时代里面,我认为我们是能够有足够多的科学家进来,更多的资源进来,能够走向 AGI。

但是光是以现在我们公开,大家看到了这个 Scaling 这个事情是做不到 AGI 的。

智谱 AI CEO 张鹏:

其实要说那个大模型,它是不是说一个基石,首先同意小川说的,他肯定是基石,那是不是基石之一?这是另外一个问题。

所以这个问题其实也涉及到说,你怎么来定义这个 AGI。

其实刚才两位台上开复(零一万物 CEO)和亚勤(清华大学智能产业研究院院长)也聊到这个 AGI 到底怎么定义,其实也跟这个定义有关。但是站在我们现在看到的这个角度来说, 我是觉得做人工智能的这拨人还是挺实用主义的。

所谓的实用主义,就是说咱们不看广告,看疗效这东西,看它能不能解决问题,是不是能不能真的像我们心中所谓每个人心中定义的 AGI 那个路径上,能够帮我们推进一步。

所以大模型到目前为止还是很有效的在推进这件事情。而且就像刚才小川说的,我们这个 Scaling law 还是在有效,还是在往前前进。

至于说它是不是能够帮助我们推到那个顶峰上去,我们现在也找不到这个答案。但至少我们相信说他在这个阶段还是有效的, 我认为他肯定是基石,至少是基石之一,这个没问题。

面壁智能 CEO 李大海:

我个人是数学专业毕业的,所以我可能会比较严谨的去表达,我认为大模型一定是通往 AGI 这个方向上当前所有技术里面能走的最远的。

它能不能够直接到达。我觉得现在还有很多未知的因素,包括刚才提到的定义是什么?但我想提一个可能大家没有提到的点。

我觉得现在的大模型作为知识压缩,主要是在处理人的大脑的系统一的工作。就是我认为这种慢思考的系统二的去做各种各样的推理。

搜索空间里面去做搜索组合来完成一个任务,这样的能力我觉得是未来大模型可能要通过 agent 的技术外部化,或者把它内化为自己的能力。

这个是行业里面,我觉得大家需要需要去探索的。

像看待人类一样看待 AGI

智源研究院院长王仲远:

我们总在讨论 AGI,但似乎好像连 AGI 的定义,大家都没有广泛的共识。然后我不知道就是在各位的心里,这个 AGI 到底什么样叫 AGI?

月之暗面 CEO 杨植麟:

首先,我觉得 AGI 的定义是重要的,但是它不一定需要在现在被非常精确地,有量化的定义。

它可能是一个定性的,感性的东西,或者我觉得它最重要的一个作用,是能让社会,或者说所有人,能够对接下来要发生的事情有一个准备。因为可能也许这个技术的节奏会非常快。

我们如果能够知道 AGI 它是什么样的,能够某种程度上去定义它,我觉得其实是可以更好的去准备这个事情。

不管你是每个人的职业,还是说这个行业接下来可能会有什么发展。我觉得首先这个是重要的。

然后可能第二个就是说,在短期内我觉得可能是需要一些量化。因为如果你没有完全没有量化的话,你可能就没有办法去衡量你这个 AGI 的开发的进度是什么样的。

所以可能从短期的角度来说,本身也会是一个很难的问题,而且可能也是一个很大的挑战。

智源研究院院长王仲远:

所以植麟觉得,比如说我们需不需要有新的图灵测试,因为我们知道,如果按照传统的图灵测试,应该已经被大模型给攻克了。

月之暗面 CEO 杨植麟:

对,传统图灵测试,可能到现在已经不完全适用了。

因为即使说他现在通过了图灵测试,但是他可能还有很多事情,是人可以做的非常好。但是 AI 就是基本没法做了。

就现在还有大量这样的事情,所以我觉得这个不是一个很容易的问题,就是你可能需要去对这里面评估的维度去做很多拆分,比如说你可能会有不同的能力,比如说知识能力和推理能力和创造的能力,他可能就是完全不一样的。评估的方式会完全不一样,所以这个也是现在可能大家很多人在关注的问题,我觉得是非常重要。

智源研究院院长王仲远:

小川,咱们上次在央视对话栏目里面,其实你也提到,去年是智能纪元的元年,所以这智能纪元是 AGI 的纪元吗?亦或是你对 AGI 这块是怎么理解?

百川智能 CEO 王小川:

对,我刚刚提到今天四个元年,是因为我们掌握了这个 Scaling law,同时我们掌握了把语言变成数学,对吧?

这是重大的一个起点。当这个机器掌握语言,我觉得这是翻天覆地的一个变化。因为大家以前都在讲这个图片识别很厉害,无人驾驶也很厉害,对吧?

我可能调侃一下,就是说狗都会,这狗也可以自己导航,狗也会看图片,但是狗不会语言。

语言代表我们认知世界的一个大的一种范式。我特别喜欢刚才你这个问题,什么是 AGI 的这个定义,对吧?确实在全球里面很难有完整的一个这种共识。

大家都是学数学的,我相信我们得通过变换把它从一个空间换到另一个空间来做一个判断,换成另一种事物来判断。就跟咱们讲的保形变换一样的。

那么在我看的话呢,我会用一个大家可以评测的这个指标来看,在我心中是接近等价的,是什么呢?是能不能够去造医生。

能不能造医生,为什么是这么奇怪的题目?之前我们在谈 AGI 的话,一种首先理解把它当成工具在看,我认为这次 AGI 的首先第一个变化,它是能够开始有这种思考能力、学习能力、沟通能力、共情的能力,甚至有多模态的这种图片处理的这样的能力,对吧?

从他的学习范式的能力要求里面,我反而觉得我们是在像看人一样,在看它的,所以一种做法是说跟人是差异化看。所以大家共识的指标或者学习范式里面,就是在向人学习。

它数据来自于人类社会产生这种数据所以一直在评价里面,我是拿人的一个职业来跟他做这样一个比较。医生在这个所有的时间里面,相对而言,是一个叫智力密度相对最高的这么一个行业。

既需要多模态,也需要少幻觉,有效记忆。看 70 万字的病例,也有推理的能力,也有这种查文献的能力等等,对吧?所以我把医生跟 AGI 做比较,结果就是说做到医生是否就算做到 AGI 了。

然后我发现它这肯定有很多种声音的。比如大家觉得这个医生只是一个垂直领域。那这个医生比这个低。但是我说那你能造医生吗?

他说,呦,太难了,这里面有太多的这样的一个幻觉问题,有太多这样的幻觉问题。

刚才我们讲到的这种,它的推理能力对吧?这种不可靠。如果我们认为医生是比 AGI 低的的,医生都造不了,那咱们就别谈这个 AGI 这个事儿。

但是如果你觉得医生比 AGI 高,但是我们又讲这个医生只是这么一个叫做造人的各个种类中的一种。 所以在我的这个逻辑里面,医生跟 AGI 来讲,我是可以基本画个等号的。

数学上有一个题,就是自然数和偶数哪个多?我们第一反应是偶数比自然数少,偶数是自然数的一个子集,对不对?每两个数只有一个偶数,但数据上应该知道他们是一样多的,因为每一个自然数乘以 2 就是一个偶数,它们是可以映射的,对吧?

今天我是把大模型,咱们行业上能共识的能都都可以映射到,对于这个医生的一个要求,你去硬是拿这个做一个标准,你就知道造医生就是个 AGI。

智源研究院院长王仲远:

大海,你被 cue 到了,作为数学家,你对于这个 AGI ,怎么去理解?

面壁智能 CEO 李大海:

我会尝试从经济学的角度来去定义 AGI,我觉得从经济学的角度讲,如果我们去执行任何一个任务,它的边际成本都为零,这就是我们理想中的 AGI 了。

但是这个又回到我刚刚说的, 为什么我认为大模型走的最远,就是我相信大模型能够把这个边际成本一直往下降,可能会逼近于零。

但是这个过程中就像植麟刚刚讲的,很多时候需要我们在各行各业的产生一个飞轮,逐步的让模型持续训练,持续学习,然后让整体的成本降下去。

其实我们去年看到行业里面,大家去做大模型的落地的时候,很多的场景都还需要做微调,这个边际成本就很高。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1