大模型的过去与未来

作者：经济网发布时间：2023-10-21

北京大学计算机学院教授、北京智源人工智能研究院院长黄铁军

人工智能这个概念自1956年提出以后，经历了将近70年的发展历程，也衍生出符号主义、连接主义和行为主义三大流派，最终走向类脑的目标。

经过六七十年的发展，人工智能发展出三条技术路线。

第一条是符号主义，也就是把智能形式化、符号化、算法化和软件化。这也是人工智能最早也是最主要的技术路线，虽然有一定效果，但并没有真正成功。

第二条路线是连接主义，或者叫神经网络学派，它的理念是人的智能不可能用一种形式化的方法表达出来，于是就构造了一个神经系统，并且训练它，这样智能就被做出来了。

第三条是行为主义。这个学派认为智能来源于主体与环境的互动，地球上本来没有智能，后来产生了有机物，有机物跟环境互动产生了细胞，才产生了后来的神经元，才有了智能。

人工智能的发展进入到20世纪80年代之后，就进入了所谓的学习期，这个学习期包含了神经网络和现在流行的深度学习。其中比较重要的是1985年提出的BP神经网络模型，到了2006年，Geoffrey Hinton在《Science》发表了关于深度神经网络的论文，包含神经网络和机器学习的深度学习开始登场。

深度学习与数据和算力结合，开始产生信息模型。在2012年至2018年之间，模型成为了AI研究和产业的中心。这之后，随着被用于训练参数（数据）的提升，具备规模大、涌现性和通用性特点的大模型，正式出现了。

通向AGI

到了现在，业界普遍认同人工智能接下来的发展，将会从通用人工智能（GAI）走向人工通用智能（AGI），或者说超人智能、强人工智能。

真正引起业界关注的大模型是OpenAI的ChatGPT。OpenAI一直定位于以人工通用智能（AGI）为最终目标，并保持开放合作，并且提出了广泛造福社会、关注长远安全问题、引领技术研究、保持合作意愿等四大原则。在2015年至2018年之间，OpenAI通过布局视觉/多模态、语言、语音、强化学习、多智体技术、机械控制、安全与可解释性等领域，一直在探索可能的AGI路径。到了2019年，OpenAI开始聚焦大模型。

OpenAI的ChatGPT的基本原理，是依托海量训练数据，大规模算力，及强大基础语言模型。发展到GPT3.5时，形成领先优势。此时被用于训练的参数已经达到了1750亿，“涌现”出强大的智能表现，具备人类“无中生有”的原创能力。2022年11月，生成式AI颠覆世界的时代正式开始，而此时，GPT-5也已在研发之中。

大模型时代

大模型已成为全球竞争热点，一个大模型时代已经到来。

1994年网景（NetscapeNavigator）浏览器的出现，使大众上网变成了可能，互联网时代才真正到来。到2007年苹果推出iPhone手机，大量智能手机应用程序出现，移动互联网时代才真正到来。而2022年11月30日，OpenAI面向公众开放ChatGPT服务，人工智能从技术圈走向全民讨论，迎来了人工智能的网景/iPhone时刻。

大模型具备三个特点：规模大，需达到百亿参数级别；涌现性，能够产生预料之外的新能力；通用性，不限于专门问题或者领域。由于这三个特点的存在，以ChatGPT为例，ChatGPT采用“人类反馈的强化学习（RLHF）”方法，这使得ChatGPT能够理解和遵循人类指令，输出符合人类偏好的内容，这种特点使它适用于广大的应用领域。

GPT知识空间里，参数达到数百亿规模的复杂系统涌现现象“融会贯通”，虽然尚不可解释，但是确实存在。ChatGPT在多项考试中表现超过人类水平，具备能够根据纯文字说明，具备生成图像或草图的整合能力，也拥有高等数学/复杂数学问题求解的数学能力。GPT-4则大幅降低幻觉率，而据估算，当幻觉率达到5%以内，接近人类水平（保守），就可作为大模型规模商用落地的基准幻觉率。

人工智能生态包括基础软硬件、基础模型和创新应用三个层次。人工智能基础模型能够支撑赋智经济与社会各类应用，也将带动基础软硬件智算体系的发展。

从当前的产业现状来看，超大规模智能模型生态在全球屈指可数，其原因是受制于应用、数据量、算力、算法等因素。谷歌由于掌握核心专利、搜索引擎积累的海量数据、通过Android能够更好地服务移动用户等原因，而走在了前列。当成为大模型标志，接受了微软投资之后，OpenAI也脱颖而出。谁会是世界上大模型第三强呢？恐怕接下来比拼的就是生态，因此，人工智能之争最终是生态之争。

对于CIO们来说，2000年以前是信息（Information）时代，2020年以前是网络（Internet）时代，而2020年以后就属于智能（Intelligence）时代了。因此，CIO们接下来需要关注两个人工智能的重大转变，首先是从信息智能到实体智能，其次是从“静态融通”到“动态涌现”，未来有望通过类脑智能实现真正的AGI。

今天，ChatGPT有强大的智能，影响深远。未来3年，除了语言，大模型正在迅速扩展视觉、听觉、具身、行动等通用智能，影响将更大。未来10年，智力革命已经打响，就像工业革命解放体力，就像电力革命解决能源流通，智力革命将是全新生态的构建，开源开放生态终将胜利。未来20年，ChatGPT是数据驱动的静态智能，未来是时空环境驱动的具体智能，智能载体不是今天的人工神经网络，而是类脑的脉冲神经网络。到2045年，还会出现结构仿脑、功能类脑、性能超脑的超人“电子大脑”。

大模型的过去与未来

推荐体验

相关资讯

ChatGPT的过去、现在与未来

浅谈国产大模型的过去、现在以及未来

ChatGPT的过去、现在与未来（附下载）

视觉分割大模型的过去、现在和未来！SAM最新综述来了！

OpenAI o1与人工智能的过去与未来

近期资讯

四大发明、三大技术，极氪亮剑北方

12月31日译名发布：斯里达拉·帕尼克·索马纳特

工信部许可基础电信运营企业开展频率重耕

益趣科普，在尝试与探索中体验创造乐趣

大模型只是工具，而不是终点！

年度最佳电视推荐：华为Vision智慧屏 4解锁春节新氛围

创新驱动成都造加“数”前行

当代年轻人的记忆方式be like，记忆会骗人那就留个证据~

支付宝推出新一代AI视觉搜索产品“探一下”，可“探知识”“探灵感”“探文字”

全国首家全高帧LED影院落成

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响