【环球网科技报道 记者 郑湘琪】7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)开幕。在大会科学前沿主论坛上,上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授,衔远科技创始人周伯文揭示了通用人工智能(AGI)的未来图景,还剖析了通往AGI的战略路径——通专融合。
周伯文对AGI的深入思考始于2015、2016年,他创造性地提出了ANI(狭义人工智能)和ABI(广义人工智能)两个概念,并明确提出,通向AGI的必经之路是ABI,即自监督、端对端、从判别式走向生成式的广义人工智能。
回顾历史,人工智能技术在专业能力上迅猛发展。从“深蓝”到“AlphaGo”,人工智能一次又一次地击败了人类领域的顶尖高手,成为新闻关注的焦点。然而,这些模型虽然强大,却缺乏泛化能力,只能在特定的任务上表现出色。直到2017年Transformer模型的提出,大模型在泛化能力上实现了质的飞跃,但随之而来的挑战是,这些模型在专业能力的提升上却显得步履维艰。能源消耗、数据需求、资源消耗的急剧增加,也让人们开始质疑这条路径是否真的能够引领我们走向AGI。
面对这些挑战,周伯文提出了一个新颖的观点:实现AGI的路径应该是二维的,而非一维的。他认为,AGI的落地将存在一个高价值区域,这个区域要求模型同时具备强大的泛化能力和足够的专业性。他将这个区域形象地称为通专融合的“价值引爆点”。通过对历史生产力提升的分析,周伯文认为,处在这个点的大模型,在专业能力上应能超越90%的专业人类,并具备ABI的强泛化能力。这样的模型将拥有更强的能力、更多的场景优势,以及更早的自我进化迭代能力。
为了实现通专融合,周伯文和他的团队构建了一个完整的技术体系,该体系包含三层重点工作:基础模型层、融合协同层、自主进化与交互层。在基础模型层,他们专注于更高效地构建通用泛化能力,特别是数理、因果推理等高阶能力。通过高质量数据的清洗和合成,研发高性能训练框架和高效的模型架构,他们已经取得了一系列原创性成果,如书生·浦语大语言模型和书生·万象多模态模型。
融合协同层则负责将泛化性和专业性有效结合。他们采用多路线协同的算法和技术,构建了比肩人类优秀水平的专业能力。通过高密度监督信号的生成、复杂任务规划以及新的系统架构,如模拟人脑的系统1与系统2架构,他们实现了通用模型与专业模型的相互学习,从而在复杂环境中做出更加高效、专业的决策。
在自主进化与交互层,他们强调AI的自主探索和反馈闭环的重要性。AI系统需要在真实或仿真世界中自主地收集数据、学习并适应环境。通过与环境的交互,AI能够获得反馈,这些反馈对于其自我进化至关重要。他们构建的“浦源·桃源”机器人训练场,就是这一理念的具体实践。这个集场景数据、工具链、具身模型评测为一体的开源具身智能研究平台,有望解决领域内数据匮乏、评测困难的问题,推动具身智能的快速发展。
此外,周伯文还探讨了通专融合在科学发现领域的巨大潜力。他谈到,大模型内部压缩着世界知识,并具备不确定性生成的特性,这有助于打破学科壁垒,提出新的科学假设。通过人机协同,AI不仅可以提出假设,还能掌握科学知识、分析实验结果、预测科学现象。他们已经在生物医学等领域取得了初步成果,如通过大模型提出新的生物医学知识假设,并在最新的文献中得到了验证。
“我们必须达成,我们终将抵达。”展望未来,周伯文和他的团队将继续致力于通专融合的研究,探索通用人工智能的未来。他们坚信,通过不懈的努力和创新,终将实现通用人工智能的理想。