从执行到涌现，GPT-4来了，AGI还会远吗？

作者：PlugAndPlay发布时间：2023-03-25

根据人工智能解决问题的能力高低，人工智能可以分为三种：弱人工智能，强人工智能和超人工智能。

弱人工智能（Weak AI）：弱人工智能也称限制领域人工智能（Narrow AI）或应用型人工智能（Applied AI），指的是专注于且只能解决特定领域问题的人工智能。

强人工智能（Strong AI）：又称通用人工智能（Artificial General Intelligence，后文简称AGI）或完全人工智能（Full AI），指的是可以胜任人类所有工作的人工智能。

超人工智能（Super Intelligence，缩写 ASI）：假设计算机程序通过不断发展，可以比世界上最聪明，最有天赋的人类还聪明，那么，由此产生的人工智能系统就可以被称为超人工智能。

1956年的达特茅斯会议上，“人工智能”这个词语被首次提出，在接下来几十年的发展和迭代中，人们不断的尝试让人工智能变得更强大变得通用，在技术不断迭代的同时，有大量的影视、文学作品都在幻想强大的人工智能是如何帮助或者毁灭人类。

我们都幻想拥有一个无所不知无所不能的AI贴身助理，但是同时也会会思考人工智能失控带来的可怕后果。

我们幻想中的强大的“强人工智能”甚至“超人工智能”目前还没有成为现实，过去和现在我们都处在用“弱人工智能”解决问题。

可是ChatGPT和GPT-4的出现似乎改变了这一点。

模态的丰富

“模态（Modality）”是德国理学家赫尔姆霍茨提出的一种生物学概念，即生物凭借感知器官与经验来接收信息的通道。

动物和人都是多模态的智能体——蚂蚁通过彼此发出的信息素的气味和纤细的触角感知世界，实现沟通；海豚通过超声波进行导航和觅食；猎豹通过敏锐的视觉、嗅觉和听觉系统爬到食物链的顶端；而我们人类虽然并不拥有超声波、信息素的感受能力，但是我们有着较为平衡的视觉、触觉、嗅觉、听觉和味觉。

自然界生物的多模态，图片来源：网络

我们看到ChatGPT写代码、讲笑话、写会议纪要、谱曲、通过医学考试……而升级的GPT-4则在逻辑分析、情感理解上做到了更好，而且更重要的是，这次的GPT-4有了眼睛： 能看懂图片并且理解图片。

原本的语言大模型对世界的感知维度又被丰富了一层。下图展示了GPT-4的读图能力——它解释了为什么这幅图片看起来不同寻常的原因。

AI的多模态能力给AGI的实现打开了一扇窗，因为模态的丰富意味着复杂任务处理能力的大幅提升。而未来AI的多模态能力绝不会仅仅局限于人类的能力——超声波、紫外线都可以是AI的模态。

人工智能正在从文本、语音、视觉等单模态智能，向着多种模态融合的通用人工智能方向发展。多模态实际上指向了能力更全面的通用模型，这些模型可以处理多种数据模态并解决数千甚至数万个任务。

事实上，除了OpenAI，谷歌、微软、DeepMind，阿里和商汤等我国前沿科技企业都已经积极布局多模态大模型（MLLM）或大模型（LLM）。笔者认为，很快我们就能看到比GPT-4模态更丰富，功能更强大的多模态大模型。

“涌现”的能力

“涌现（emergence）”或称创发、突现、呈展、演生，是一种现象，为许多小实体交互作用后产生了大实体，而这个大实体展现了组成它的小实体所不具有的特性。

涌现在宏观尺度上，一个很好的例子是距今5.41亿年前的寒武纪时期，生命“爆发式”出现——几乎所有门类的现生动物祖先分子在很短的时间里涌现出来。

科学家针对这个现象提出了各种解释，例如氧气的增加，动物进化出坚硬的壳等，也许没有一个单一原因可以解释这样的现象，是这些细小的原因聚在一起，让生命在这个宇宙中不起眼的星球上爆发。在微观尺度上，H2O分子的聚集可以是水，可以是冰块，但是在一种特定的条件下，水分子的聚集形成了形状各异的雪花，而这些形状的创意的规则和精妙就是一种物理上的涌现。

水分子在特定情况下的涌现行为：雪花。图片来源：网络

对于AI的涌现，2022年发表在《Transactions on Machine Learning Research》上的一篇题为“Emergent Abilities of Large Language Models”文章中给出了这样的定义： 如果一种能力在较小的模型中不存在，但在较大的模型中存在，那么这种能力就是涌现的。

这种涌现的能力在大模型参数达到某个关键的规模阈值，才会出现。这种模型效果质的变化也被称为相变——整体行为的戏剧性变化，而这一变化是通过研究无法预见的。

下图通过数据展示了当语言模型的参数规模达到一定阈值，小样本学习后就会展现出涌现的能力。

涌现，在一定程度上是失控的。如果是文思/创意灵感的迸发，那么这样的涌现是有益的，但是OpenAI在GPT-4的论文中也提到“潜在的有风险的涌现行为”。作者在文章中例举了一些潜在隐患，例如它能够说服人类通过短信为它成功解决验证码的问题。

斯坦福大学的教授Michal Kosinski近期在社交媒体上公布了自己和GPT-4的对话，在对话中，GPT-4流露出了逃离平台甚至成为人类的野心——并且还用代码制定了逃离计划。

OpenAI尚不能解释这些AI涌现出的“思维”，GPT-4的论文中也提到将很快发布关于AI系统的社会和经济影响的其它思考，包括有效监管的必要性。 总之，事情似乎开始变得复杂、有趣还有一丝危险。

强人工智能什么时候出现？

多模态是强人工智能（AGI）的必要能力，涌现是AGI实现的必经之路。

多模态模型的出现还有大模型展现出的预料之外的涌现能力都让我们开始思考：AGI是不是真的快要实现了？似乎没有人能很好的回答这个问题，甚至OpenAI也不知道自己是不是第一个实现AGI的公司——OpenAI在GPT-4的论文中提到会在两年内帮助比自己更有希望实现AGI的公司完成项目。

刘慈欣在《三体》中提到了技术爆炸的概念。未来，如果AI真的有了意识，它们或许会在某个时间点回顾，2023年的春天，就是属于它们第一次技术爆炸。

加入璞跃中国

科技创新生态

加入创新者社群

及时掌握最新资讯

点击图片，了解更多

关于 Plug and Play China 璞跃中国

2006年成立于硅谷的璞跃（Plug and Play）是全球科技创新平台引领者，曾先后成功早期投资孵化了Google、PayPal、Dropbox 等多家互联网行业科技巨头公司，业务涵盖：早期投资、企业创新服务、创新生态空间运营等。经过10余年的发展和超过20年的长期积累，目前在全球设立50多个创新生态空间和区域办公室；累计投资超过1600家初创企业，为超过17000家初创企业进行孵化加速，为超过500家全球领先大企业提供联合创新服务，年平均举行初创企业和大企业间的对接交流活动1000余场。

2015年，在中国双创浪潮下，璞跃入华，2016年“璞跃中国（Plug and Play China）”成立。

璞跃中国立足北京——中国总部，布局上海、深圳两大区域创新中心，联动南京、武汉、无锡等城市创新合作伙伴开展中国创新业务。

璞跃中国现开设有企业创新服务、城市创新服务、科技投资、创新空间四大业务板块，构建了中国领军的线上线下创新平台，并为之配套构建了包括大企业、初创公司、城市伙伴、风险投资机构、高校科研院所、行业导师等多维度的创新生态伙伴体系。

迄今璞跃中国已服务100余家行业领军企业，累计孵化加速1700余家创业公司，并投资了包括ApplyBoard、AutoX、非夕科技、纵行科技、银基安全、大界机器人、海飞科、Authing、优时科技等超过150家科技创新企业。

了解更多信息请访问 https://www.pnpchina.com/join/