WAIC 2024| 专家：通专融合是通往通用人工智能的战略路径

作者：环球Tech发布时间：2024-07-07

【环球网科技报道记者郑湘琪】7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议（WAIC 2024）开幕。在大会科学前沿主论坛上，上海人工智能实验室主任、首席科学家，清华大学惠妍讲席教授，衔远科技创始人周伯文揭示了通用人工智能（AGI）的未来图景，还剖析了通往AGI的战略路径——通专融合。

周伯文对AGI的深入思考始于2015、2016年，他创造性地提出了ANI（狭义人工智能）和ABI（广义人工智能）两个概念，并明确提出，通向AGI的必经之路是ABI，即自监督、端对端、从判别式走向生成式的广义人工智能。

回顾历史，人工智能技术在专业能力上迅猛发展。从“深蓝”到“AlphaGo”，人工智能一次又一次地击败了人类领域的顶尖高手，成为新闻关注的焦点。然而，这些模型虽然强大，却缺乏泛化能力，只能在特定的任务上表现出色。直到2017年Transformer模型的提出，大模型在泛化能力上实现了质的飞跃，但随之而来的挑战是，这些模型在专业能力的提升上却显得步履维艰。能源消耗、数据需求、资源消耗的急剧增加，也让人们开始质疑这条路径是否真的能够引领我们走向AGI。

面对这些挑战，周伯文提出了一个新颖的观点：实现AGI的路径应该是二维的，而非一维的。他认为，AGI的落地将存在一个高价值区域，这个区域要求模型同时具备强大的泛化能力和足够的专业性。他将这个区域形象地称为通专融合的“价值引爆点”。通过对历史生产力提升的分析，周伯文认为，处在这个点的大模型，在专业能力上应能超越90%的专业人类，并具备ABI的强泛化能力。这样的模型将拥有更强的能力、更多的场景优势，以及更早的自我进化迭代能力。

为了实现通专融合，周伯文和他的团队构建了一个完整的技术体系，该体系包含三层重点工作：基础模型层、融合协同层、自主进化与交互层。在基础模型层，他们专注于更高效地构建通用泛化能力，特别是数理、因果推理等高阶能力。通过高质量数据的清洗和合成，研发高性能训练框架和高效的模型架构，他们已经取得了一系列原创性成果，如书生·浦语大语言模型和书生·万象多模态模型。

融合协同层则负责将泛化性和专业性有效结合。他们采用多路线协同的算法和技术，构建了比肩人类优秀水平的专业能力。通过高密度监督信号的生成、复杂任务规划以及新的系统架构，如模拟人脑的系统1与系统2架构，他们实现了通用模型与专业模型的相互学习，从而在复杂环境中做出更加高效、专业的决策。

在自主进化与交互层，他们强调AI的自主探索和反馈闭环的重要性。AI系统需要在真实或仿真世界中自主地收集数据、学习并适应环境。通过与环境的交互，AI能够获得反馈，这些反馈对于其自我进化至关重要。他们构建的“浦源·桃源”机器人训练场，就是这一理念的具体实践。这个集场景数据、工具链、具身模型评测为一体的开源具身智能研究平台，有望解决领域内数据匮乏、评测困难的问题，推动具身智能的快速发展。

此外，周伯文还探讨了通专融合在科学发现领域的巨大潜力。他谈到，大模型内部压缩着世界知识，并具备不确定性生成的特性，这有助于打破学科壁垒，提出新的科学假设。通过人机协同，AI不仅可以提出假设，还能掌握科学知识、分析实验结果、预测科学现象。他们已经在生物医学等领域取得了初步成果，如通过大模型提出新的生物医学知识假设，并在最新的文献中得到了验证。

“我们必须达成，我们终将抵达。”展望未来，周伯文和他的团队将继续致力于通专融合的研究，探索通用人工智能的未来。他们坚信，通过不懈的努力和创新，终将实现通用人工智能的理想。