文|周鑫雨 邓咏仪
编辑|苏建勋
若是要形容2024年中国的AI行业,大概是这样一幅图景:
大部分企业已经翻过了技术黑箱的大山,走向了应用落地的原野。而AGI(通用人工智能)仍是挂在天边的一轮圆日,有待攫取。
2024年的智源大会上,代表“AGI攀登者”的四家大模型明星公司,在圆桌对谈给大家唱了一曲“难忘今宵”:
其中三家,是在2023年跻身独角兽俱乐部的大模型公司:智谱AI、百川智能和月之暗面。另一家发力做端侧轻量化模型的面壁智能,在一众Scaling Law信徒中又代表了另一种技术落地图景:小模型的潜力还远未被完全开发,应用落地需要便宜好用的小模型。
成立于2018年的智源研究院,可以说是中国AI领域的一面旗帜,在学界和工业界都享有盛誉。大模型浪潮兴起后,其每年举办的智源大会,更是被称为“AI届春晚”。
今年,智源的圆桌对谈,依然聊AGI。不过,温和的交流依然暗含刀光剑影。
比如关于Scaling Law(规模定律),这个在训练大模型中的第一性原理,至少在四位CEO中,还不是通往AGI的共识。
杨植麟依然是Scaling Law的坚定拥护者,在他看来,“大”依然是第一性原理,现在最大的问题是解决怎么取得原本稀缺或者不存在的数据,以及如何高效Scale,“Scaling会一直持续,只是Scale的方法会不断变化”。
但王小川则认为,光靠Scaling Law是不够的:Scaling Law只能无比逼近AGI,达到AGI还需要不同维度符号和连接的融合。
智谱AI CEO张鹏和面壁智能CEO李大海的观点,则更为保守。张鹏认为,Scaling Law肯定是AGI的基石,但是不是基石之一还是个问号。李大海则提出了一个假设:AI System 2(决策)的能力,需要依靠AI Agent去内化外部的一些能力。
不过,四人的共识是,对AGI的看法和探索路径,取决于如何定义AGI——而这在业界,目前依然是非共识。
当下,王小川和李大海已经为自己的AGI问道之路,设立了一个靶子:已经开始训练生命智能的王小川,将AGI对标为医生,理由是医学是智力密度最高的行业;“实用主义者”李大海,将边际成本的降低程度,作为AGI的评判维度,一旦模型应用成本降到了0,AGI也来了。
不过,张鹏和杨植麟,并不想把AGI定义得太清楚。张鹏认为不能框死AGI的探索路径,因为AGI是一个内涵外延不断演变的符号。在杨植麟看来,AGI的定义是重要的,但不是必须的,定义的价值在于,让社会对未来技术发展的方向有个更好的准备。
AGI终归遥远,一旦回到落地,共识很快形成。在大模型价格战打得火热的当下,四家企业的观点出奇地一致:降价是好事,意味着大模型能落地了。
智源大会圆桌论坛
以下为圆桌实录,经《智能涌现》整理编辑:
王仲远:感谢大家来到我们智源大会的现场。我们这个环节是对话,我们想讨论的是通往AGI之路。各位都是国内头部大模型公司的CEO,那我也想请教一下,各位是否相信大模型是通往 AGI 之路的一个基石?亦或是大家在实际的训练大模型的过程中发现它可能依然只是一个数据的压缩,那可能对于产业界是非常有价值的,但并不一定能够通往 AGI。我想听听各位的看法,植麟?
杨植麟:对,我们比较相信大模型的第一性原理,就是通过不断地去提升模型的规模。就像仲远刚刚说的,它确实本质上是一个压缩,但压缩它确实是可以产生智能,然后随着不断地去规模化模型,不断地做更好地压缩,它能产生越来越多的智能。
月之暗面CEO杨植麟
当然,肯定在过程中也会有很多挑战,比如,可能最大的挑战就是有一些数据,可能并不一定有那么多,对吧?那在数据没有那么多的领域,或者假设你最后要做出来一个比人类更好的AI,那可能就根本不存在这样的数据。因为你现在所有的数据可能都是人产生的。所以我觉得,可能最大问题是怎么去解决这些比较稀缺,甚至可能不存在的数据。但是,我觉得规模化定律,或者说大模型,本身没有太本质的问题。
王小川:对,我刚刚注意到的题就是说大模型是否是通向 AGI 的基石?我觉得用“基石”这个词是没有问题的。今天大家已经看到的Scaling Law 它带来的提升。但是我想说,它只是在逼近AGI,但是光靠 Scaling Law 我理解是不够的。所以在这里面的话,如果从第一性上讲,其实刚才亚勤也提到,需要有范式的改变,所以我是认为确实是这样。在今天,大家看到了 Scaling Law,这是第一件事。
今天的话我们还有一件事情,大家比较忽略的,其实是把语言放到大模型的体系里面,把语言变成了数学。我们将往前走,语言其实把符号主义跟连接主义之间产生了突破。除了规模以外,符号跟这种连接的融合,我觉得这是中间的一件事情。那么再往前走,还会有更多东西,必须产生范式改变的。比如说,大模型是靠数据驱动一种学习系统能做压缩,但是反而像之前类似于像 AlphaGo 那这样一种能够自我思考性的系统,那它也会有这样的作用。
所以,我的结论是,我们到了 AGI 的时代,这个时代里面我们是能够有足够多的科学家进来,更多的资源进来,能够走向AGI。但是光是以现在我们公开大家看到了scaling 这个事情是做不到 AGI 的。
张鹏:其实要说那个大模型,它是不是一个基石?首先我同意小川说的,它是肯定是基石,那是不是之一,这是另外一个问题,所以这个问题其实也涉及到说你怎么来定义AGI。其实刚才两位台上开复和亚勤也聊到 AGI 到底怎么定义,其实也跟这个定义有关。但是站在我们现在看到的角度来说,做人工智能的这波人还是挺实用主义的。所谓的实用主义就是说,咱们不看广告,看疗效,这东西它能不能解决问题?能不能真的像我们每个人心中定义的 AGI 那个路径上能够帮我们推进一步?大模型到目前为止还是很有效地在推进这件事情。
而且就像刚才小川说的一样,就是我们 Scaling Law 还是有效,还是在往前进,那至于说,它是不是能帮助我们推到那个顶峰上去,我们现在也找不到很确切的答案。但至少,我们相信它在这个阶段还是有效的,所以我认为它肯定是基石,至少是基石之一,这个没问题。
智谱AI CEO 张鹏
王仲远:好,谢谢张鹏。大海呢?
李大海:我个人是数学专业毕业的,所以我可能会比较严谨地去表达。我认为大模型一定是通往 AGI 这个方向上,当前所有技术里面能走得最远的。它能不能够直接到达,我觉得现在还有很多未知的因素,包括刚才提到的定义是什么。但我想提一个可能大家没有提到的点,我觉得现在的大模型作为知识压缩主要是在处理人的大脑的系统1的工作。我认为这种慢思考的系统 2 的去做各种各样的推理,搜索空间里面去做搜索、组合,来完成任务这样的能力,我觉得是未来大模型可能要通过 agent 的技术外部化,或者把它内化为自己的能力,这是行业里面大家需要去探索的。
王仲远:好,谢谢。其实确实有一个非常有意思的问题,我们总在讨论AGI,但好像连 AGI 的定义大家都没有广泛的共识。我不知道在各位的心里,到底什么样叫AGI?植麟怎么看?
杨植麟:首先我觉得 AGI 的定义是重要的,但是它不一定需要在现在被非常精确地、有量化地定义,它可能是一个定性的,感性的东西。我觉得它最重要的作用,是能让社会或者说所有人,能够对于说接下来要发生什么事情有个准备,因为也许这个技术的节奏会非常快。那我们如果能够知道 AGI 它是什么样的,能够某种程度上去定义它,我觉得其实是可以更好地去准备这个事情,不管是对每个人的职业,还是说行业接下来可能会怎么发展。我觉得首先这个是重要的。
第二个,一定程度上在短期内可能需要一些量化,因为如果完全没有量化的话,你可能就没有办法去衡量你这个 AGI 的开发的进度是什么样的,所以可能从短期的角度来说, evaluation(评估) 本身也会是一个很难的问题,而且可能也是个很大的挑战。
王仲远:所以植麟觉得我们需不需要有新的图灵测试?因为我们知道如果按照传统的图灵测试,应该已经被大模型给攻克了。
杨植麟:对,传统的图灵测试可能在现在已经不完全适用了,因为即使它现在通过了图灵测试,但可能还有很多事情是人可以做得非常好,但是 AI 基本没法做的,现在还有大量这样的事情,所以我觉得这不是一个很容易的问题。你可能需要去对这里面评估的维度去做很多拆分。比如说你可能会有不同的能力,比如说知识能力、推理能力和创造的能力,它可能就是完全不一样,评估的方式会完全不一样。所以这也是现在很多人在关注的问题,我觉得是非常重要的。
王仲远:好,谢谢植麟。小川,咱们上次在央视对话栏目里面,其实您也提到去年是智能纪元的“元年”,所以这智能纪元是 AGI 的纪元吗?亦或是您对 AGI 这块怎么理解啊?
王小川:我刚刚提到今天四个元年,是因为我们掌握了 Scaling Law,同时我们掌握了把语言变成数学,对吧?这是重大的一个起点。当机器掌握语言,我觉得这是翻天覆地的变化,因为大家以前都在讲图片识别很厉害,无人驾驶也很厉害。我可能调侃说狗都会,狗也可以自己导航,狗也会看图片,但是狗是不会语言的。语言代表我们认知世界的一种范式, 我特别喜欢你这个问题,就是什么是 AGI 的定义。确实在全球很难有完整的共识。刚大海说他学数学的,我相信我们得通过一个变换,把它从一个空间换到另一个空间来做判断。换成另一种事物来判断,就跟咱们讲的保鲜变换一样的。那么在我看的话,我会用一个大家可以评测的这个指标来看,在我心中是接近等价的,是什么呢?是能不能够去造医生?
能不能造医生,为什么是这么奇怪的题目?之前我们在谈 AGI 的时候,一种首先把它当成工具在看。我认为这次 AGI 的第一个变化,它是能够开始有这种思考能力、学习能力、沟通能力、共情的能力,甚至有多模态的这种图片处理的这样能力。从他的学习范式的能力要求里面,我反而觉得我们就是像看人一样在看它的。