朱松纯：通用人工智能要“眼里有活”，关键在AI“价值观”

作者：南方都市报发布时间：2024-01-24

1月22日，北京通用人工智能研究院（以下简称“通研院”）举行“迈向通用人工智能前沿科技成果展”媒体沟通会，会上介绍了全球首个由价值与因果驱动的通用人工智能（AGI）系统原型“通通”，以及通用人工智能科研平台“通境” (TongVerse) 。

此外，全国政协委员、北京通用人工智能研究院院长、北京大学与清华大学讲席教授朱松纯也发表了演讲，他提出，当前有以ChatGPT等大模型为首的“大数据，小任务”和“小数据，大任务”两条科研范式，而后者则很大程度上属于他们在实现通用人工智能上的路径。而他认为，对于机器人或者通用智能体来说，“没有自主的价值体系”是一个根本性的问题。

··· 通用智能体的研究关键：有无自主的价值体系

在谈到通用人工智能时，朱松纯首先提到了其三大基本特征，即一个通用人工智能体应该要能在复杂动态环境（物理与社会）中做到以下三类事：

1、完成无限任务。即任务泛化，不局限在预先设定的任务里。

2、自主定义任务。即不依赖人类，自主产生任务或指令流程。

3、由价值驱动。即内在价值体系与人类价值伦理对齐。

在谈到第三点时，朱松纯提到，人类本就是被各种各样的价值诉求所驱动的，所以对于机器人或者通用智能体来说，“没有自主的价值体系”就是一个根本性的问题。而要做好包括这一点在内的三类事，就需要解决八大关键技术问题，即认知架构、自我意识、社交智能、价值驱动、价值函数、具身智能、可解释性、人机互信。

“而ChatGPT等大模型尚不满足上述任何一个要素。”朱松纯补充道。

事实上，人类对于通用人工智能中的“智能”的理解并非一直相同。一开始，人们认为人类不会的东西是智能，比如解方程、下围棋、证明某个科学定理，但事实上，人类的大脑并没有进化出某个专门下围棋的皮层，反而是九成以上的模块都在做很平常的事——比如看到物体、识别物体、捏筷子、与人交谈，等等。

而此次通研院发布的AGI产品“通通”之所以是研究一个三四岁的小女孩，而非一个更大更复杂的问题，也正是因为小孩有上述通用智能体的基本特征，也就是能够基于自主意识去探索环境，拥有持续学习和长期记忆，也可以建立基础的物理层面的因果关系（比如要找食物，先拉开抽屉冰箱门去看）。而这一智能体的构造，也不仅仅依赖于大数据或大模型。

通研院供图：AGI产品“通通”

以此契机，朱松纯也聊到了当前两条科研范式之争——“大数据，小任务”和“小数据，大任务”。他认为，前者属于“鹦鹉范式”，即AI系统面向某几个具体领域进行大量重复数据进行训练，可以说人话，但不理解话意，不能对应现实的因果关系；后者则属于“乌鸦范式”，即有很大的架构，有很多任务，但是量级较少的无标注数据，强调自主的智能，如感知、认知，推理、学习、执行。

“就像人类大脑平时相当于只有10瓦的算力，激烈思考时也就达到25瓦，但人类仍然拥有高超的智能……，这是两条完全不同的赛道。”朱松纯说。

而这两种赛道在面对同样的问题时，也会有不同的解决方法。比如要回答“什么是椅子”的问题，可以基于深度学习算法“看遍天下椅子”，对收集到的大量椅子的数据进行人工标注，涵盖各种形状、摄像头视角、材质、颜色、花纹、光照条件、遮挡等等，提取相应特征，在遇到需要识别的物体时，以像素为单位进行逐次扫描、对比，最后得出答案。

当然，也可以有另一种思路：“椅子”其实代表了人的一类需求，也就是“坐”，那么匹配人类坐姿与椅子的三维几何功能，将任务从“物体类别（模式识别）”切换到“任务需求（推理理解）”，也就是“坐得舒服的就是椅子”。随后对计算出人类坐姿的每个部位的受力情况：受力均匀，受力小的地方多，就叫“坐得舒服”。那么这时，就得到了一个泛化的功利价值函数，可以在小数据的前提下，就回答“什么是椅子”的问题。

朱松纯也告诉南都记者，他们研究通用人工智能的终极目标，在应用层面上，就是打造一个通用认证的操作系统和编程语言，它能够驱动这些智能体来完成各种类人任务，也能让智能体有一个基本的价值判断能力，不断丰富它的技能库，当然，具体还要看产业界的开发，未来，医生助手、法律咨询、老人陪伴都是有可能的。

在最后，朱松纯也提到了通用人工智能高度发展之后可能带来的问题，影响人类怎么办？会不会发展到要把机器人或者虚拟人都关在铁笼子里的地步？究竟应该如何监管？

“……我认为在行为空间上限制它们是舍本逐末的事情，根本还是要像人类的教育系统一样，‘教他做人’。因为所有智慧生物体的行为都是从价值导出的，当你从价值空间去限制它，使它具有基本的道德良知，有良好的认知架构，那么问题自然而然就会迎刃而解。”朱松纯说。

··· 发布多项产品，通用智能体可自主探索，长期记忆

在当天发布的产品中，最引人瞩目的就是正在构建中的通用智能体，其在部分能力上拥有3-4岁儿童智力的小女孩“通通”。她基于通用人工智能操作系统TongOS2.0和编程语言TongPL2.0开发，拥有类人价值观，能自主生成任务，具备物理和社会常识，可保障复杂任务高效执行，推理和决策过程透明、可解释。

现场工作人员在演示时，首先会带上VR设备进入一个预先搭建好的室内场景，“通通”则以一个普通小女孩的人物形象身处其中。据介绍，与一般专精某几项领域的机器人不同，“通通”没有被安排具体任务，而是真的会像一个普通人类一样，自发地在室内进行走动、探索、学习和认知。

她共拥有饱腹、干净、听话、安全等八项可调节的维度，在演示中，若把“饱腹”值调低，“通通”就会主动去屋内各地寻找食物，并自发产生一系列诸如行走、寻找冰箱、打开冰箱门、获取食物等等指令，然后执行；如果把“干净”调高，“通通”就会自发地去摆正鞋子、放好足球、收拾书架，即使面对突发情况——比如带有VR设备的工作人员打翻了一瓶牛奶，“通通”也能立刻作出反应，拿起一旁的抹布去擦桌子。

“就像是写小说一样，赋予她一个性格或者人设。”现场的工作人员介绍，“目前我们可以做到的是赋予她一个稳定的性格，让她基于性格去做一些事，但如果我们做到更好，‘通通’的性格应该能随着与人和环境的交互，自己发生变化。”

同时，“通通”也能通过语音与工作人员进行互动，能够在自主探索之后，准确地回答“卧室有几张桌子”“厨房有多少食物”等问题，也能由工作人员扮演“老师”，进行一些新知识的教学，比如，“老师”在黑板上写一个大写字母“L”（工作人员用VR画了一个L），“通通”很快就能学会，也能举一反三地在桌上用积木拼出一个“L”形状。

通用智能人“通通”演示界面

通用人工智能仿真平台“通境” (TongVerse) 也颇受关注，目前通境平台可实现1万多个可交互的场景，以供仿真机器人进行测试和训练。其核心在于基于前沿算法，高效生成大量随机场景，主要以室内为主。相关科研人员称，这一平台不仅能够应用于科研、赛事，还将面向智能制造、特种行业等需求，提供多场景、多任务的机器人应用解决方案。

此外，通研院打造了《通用人工智能标准、评级、测试与架构》白皮书，依据发展心理学和心智理论，参考人类婴幼儿发育的测试标准，研究总结出基于能力（U系统）和价值（V系统）的UV通用人工智能的评测方法。

最后，通研院相关负责人还表示，上述各项成果将于1月28日在中关村国家自主创新示范区会议中心正式发布。

采写：南都记者杨博雯