ChatGPT的横空出世,让稍显拗口的“大型语言模型”(LLM)这个词成了聚光灯的宠儿。从OpenAI、Anthropic等明星创企到谷歌、微软和Meta等公司,都在持续推进LLM的能力和商业应用前景。
然而,Meta人工智能首席科学家杨立昆 (Yann LeCun) 却认为,目前的LLM路线无法通往AGI,且非常危险,显示出业界对AI发展路线图的分歧。
杨立昆:LLM存在重大缺陷,无法实现真正的AGI
近日,在接受媒体采访时,杨立昆直指当前的LLM技术存在“理解逻辑能力极其有限”、“无法对物理世界建模”、“无法形成持久记忆”、“无法进行层级规划推理”等重大缺陷,并称单纯追求推进LLM的发展“本质是上不安全”的,无法实现真正的AGI。
LeCun指出,现有的LLM尽管在自然语言处理、对话交互、文本创作等领域表现出色,但其仍只是一种"统计建模"技术,通过学习数据中的统计规律来完成相关任务,本质上并非具备真正的"理解"和"推理"能力。
但直到今年,包括OpenAI、谷歌在内的科技巨头,都将LLM视为迈向AGI的关键一步。OpenAI CEO山姆·奥特曼就曾多次表示,GPT模型是朝着AGI方向发展的重要突破。
杨立昆所推崇的,是所谓“世界模型”(World Modeling)方法,即能够像人类一样,借助观察和体验,循序渐进地学习认知这个世界,从而形成“常识”,最终实现AGI。
杨立昆认为,“世界模型”更接近真正的智能,而非只学习数据的统计特征。以人类的学习过程为例,孩童在成长过程中,更多是通过观察、交互和实践来认知这个世界,而非被单纯“注入”知识。而杨立昆的“世界模型”路线,则是试图通过对视频、音频等媒体的模拟与补全,让AI也经历这样一个自主学习的过程。
不过,他也承认实现“世界模型”并非易事,这一雄心勃勃的目标可能需要耗时10年才能实现。业内专家对此也存疑。
图兰大学计算机科学教授亚伦·库洛塔指出,“常识”一直是人工智能发展的痛点,教会AI模型“因果关系”并非易事,很容易出现“难以预料的失败”。此前也曾有Meta内部员工质疑杨立昆的“世界模型”理念含糊不清,更像是一种噱头。
Meta需要将AI快速产品化 但首席科学家却频频拆台
从本质上看,杨立昆与OpenAI、谷歌等公司对人工智能发展路径的分歧,也反映出科技巨头在AI领域投入上的矛盾与分歧。
对砸下重金购买GPU的Meta来说,首要的使命是短期内快速推出商业化AI产品,在元宇宙的失败之后,公司在AI探索上的成果对Meta的未来至关重要。且扎克伯格面临着巨大的盈利压力,上月,当扎克伯格誓言要将Meta打造成“全球领先的人工智能公司”时,Meta就一度蒸发近2000亿美元的市值,反映出投资者对其人工智能投资回报的疑虑。
但身为首席科学家的杨立昆更看重探索性研究和长期价值,不那么在意短期的收入。他这一番公开宣称LLM路线存在重大问题,也是在打自家公司的脸——Meta也是那些斥巨资研发“危险的LLM”的公司之一。
外界早就揣测,Meta CEO扎克伯格和杨立昆之间可能存在某种微妙的矛盾,例如,去年底,扎克伯格将“AI产品化”工作剥离出杨立昆手中,成立独立的“GenAI”团队,直接分割了杨立昆“学院派”的权力。
总体而言,Meta仍然是AI浪潮的主要受益者,今年迄今,Meta股价累计大涨35%。