导读:最近,连续发布文字大模型ChatGPT、文字生成视频模型Sora的美国人工智能研究机构OpenAI备受关注,成为当前炙手可热的创新机构之一。
2023年,在为《中国人工智能简史》一书撰写的推荐序中,鹏城实验室主任、中国工程院院士、前中国计算机学会理事长高文强调了人工智能发展的重要性。他预测,在第三代人工智能浪潮中,下一波再出现苹果、华为这样的公司,一定会是AI 公司。
从倡议到出版,这本书历经五年之久。
我是本书的倡导者之一。2018 年年初,在发起新一代人工智能联盟后,我决意开始组建鹏城实验室,在身体力行迎接第三代人工智能浪潮的同时,也觉得需要对中国人工智能产学研的历史进行梳理和总结。
在与清华大学博士后高峰的讨论中,林军的名字跳了出来。
我与本书作者之一、雷峰网的创始人林军相识多年,用他的话说就是:“高老师, 我在本科的时候就上过你的课。”他是哈尔滨工业大学学生中有名的“笔杆子”,曾帮助《哈工大报》做了不少文字工作,他的很多同学是我在哈工大计算机系当系主任时的学生,如微软亚洲研究院的研究员吕岩、中科院计算所的山世光、鹏城实验室的曾炜……他们那批 1993 级的学生的整体素质是很拔尖的。为从小培养高峰对计算机编程的兴趣,我会带他去实验室,山世光他们同学几个还手把手教高峰编程。而在此之前,高峰有个想法是与林军合作,对中国的人工智能领军人物进行一对一的访谈,高峰负责做插画,林军负责写文字。后来,高峰建议不如直接做成“中国人工智能简史”这样一个项目。
雷峰网也是国内有影响力的知名科技媒体,与中国计算机学会多有合作,包括从2016 年开始的“全球人工智能与机器人峰会”(CCF-GAIR),每年连接上百位人工智能产学研的牛人,也赢得了业内外人士的良好口碑。
本文作者高文
我很快与林军通了个视频电话,视频那头能隐约听到海浪声,画面中蓝天白云,晴空万里。林军告知我,他当时在圣地亚哥陪女儿过圣诞节,正在科罗拉多的白沙滩转悠,追寻当年爱德华八世不爱江山爱美人的往事,言语中满是兴奋。听到我的建议,他很快答应下来。
林军之前写过一本中国互联网史《沸腾十五年》,当时正在编写它的续作《沸腾新十年》,也接触了不少关于当下火热的人工智能的内容。但同时写两本书,林军表示很有压力,他提议雷峰网的总编辑岑峰也一起参与到该书的写作中来。
一周后,在国家自然科学基金委员会给我配的专家办公室里,我见到了正在倒时差的林军。我们进行了一个多小时的交谈。从我的角度来看,人工智能在中国发展了几十年,经历了不少曲折与困难,现在人工智能火了,不少研究者对过去的历史缺乏了解,不了解中国人工智能的前世今生、来龙去脉。不知脉络,不知过往,也就有了许多的似是而非。我希望,这本书能把人工智能在中国经历的起起落落的故事展示出来,成为供后来者借鉴的一本读物。
我当时刚见完我的老师、年过八十的哈工大计算机系老主任王开铸,我还和林军分享与王开铸见面时的一些见闻,催促着林军先去东北一趟,去吉林大学见王湘浩的学生刘大有以及回哈工大把老教授都采访一遍,当时我看林军穿得很单薄,开玩笑说就这身衣服去东北可不行。林军说,许久没有在冬天回哈尔滨了,家里最厚的衣服都带上了,他自嘲在广东待久了,不怕冷。我也想起当年同学里最不怕冷的就是来自广东和福建的。我还给林军组建了一个顾问委员会,这里有浙江大学的陈纯教授,有清华大学的杨士强,有北京大学的金芝教授,有中科院计算所的钱跃良,还有白硕等人。这里面有一半人在“863-306”专家组和我并肩共事过。
中国的人工智能研究刚好赶上 20 世纪 70 年代末开始的第二波人工智能浪潮,是一个“承前启后”的重要时期。在这一阶段,我们不仅在符号主义人工智能的研究上取得了世界级的成果,也赶上了神经网络研究的浪潮,更重要的是,在前人研究和论证的基础上,国家决定启动“863 计划”的研究。在 20 世纪 90 年代国际人工智能研究进入低谷的时候,“863-306 计划”的实施培养了一大批进入国际高技术前沿的计算机人才,为我国实现创新驱动战略奠定了人才基础。
与“863 计划”结缘和参与到中国人工智能发展的历史中来,这是我个人的一段终生难忘的经历。在担任智能接口责任专家的几年间,通过课题评审、课题考察、学术交流,我逐步对汉字识别、语音识别、中文信息处理、工程图与文本识别、图像与视频编码、多媒体通信、智能交互技术、虚拟现实方向有了深入理解,与这些领域的专家们进行了充分的交流与合作,经历了人工智能发展的波峰和波谷。今天国内人工智能界的领军人物,许多是“863 计划”等主题的专家。可以说,“863-306”是人工智能人才的大熔炉。
这段经历也让我体会到,人工智能的发展是一个螺旋式前进的过程。在前一波AI 浪潮沉寂了一段时间后,前两年大家都觉得 AI“大风”来了,必须赶快前进,不要掉队;这两年人工智能有所降温,大家冷静下来后开始发现,AI 还是面临很多挑战。而当下 ChatGPT 的爆火,又让公众对人工智能有了新的兴趣。
以史为鉴,可以帮助我们懂得在科研工作中把握规律,不随波逐流,更好地迎接这些挑战。
AI 现在主要的缺陷或者说不足是在机器学习方面。深度学习,即深度神经网络是机器学习的一种方法,这种方法确实可以解决很多问题,也取得了很大的成功。但深度学习也要发展。我去美国开会,马里兰大学一位知名的 AI 专家调侃说,现在“深度学习有深度而无学习”(Deep Learning — Deep YES,Learning NO)。这是因为这样的学习严格来说不是学习,而是训练,是用大数据在训练一个数学模型,而不是真的学习到知识。
更大的问题是人们不知道机器学习是怎么解决问题的。在神经网络里,有很多东西没有办法被定性和解释,这是比较难的一个问题。解决了这个问题,AI 可能又会迎来一波大的浪潮。
用人的一生来比喻,今天的人工智能水平大概是刚上小学的程度,后面还有很长的路可走。对于未来,我们需要思考 AI 现在做了多少事,未来还有多少事需要做。事实上,我们现在所解决的 AI 问题还是很小的一部分。AI 涉及的问题可以分为四类。
第一类是可统计可推理的 AI 问题。这一部分在工业界已经可以使用,可以应用于机器人,应用于各种各样的知识决策系统。
第二类是不可统计可推理的 AI 问题。这类 AI 问题靠大数据解决不了,只能靠传统的逻辑和规则来处理。
第三类是可统计不可推理的 AI 问题。有大数据,通过大数据都能统计出规律,但是用语言表述逻辑和因果关系相当复杂。这方面的曙光已经初现,但是也需要更多的突破。ChatGPT 正是在这个问题上取得了大的飞跃。
第四类是不可统计不可推理的 AI 问题。这是最难的 AI 问题。没有模型和数据,这类问题未来机器人不可能涉足,也不可能胜过人。
通过分析这四类 AI 问题,我们可以看出,第一类问题研究的比较成熟,已经能够成功应用了。第二类、第三类问题正在突破,是 AI 1.0 向 AI 2.0 过渡的主要研究内容。也不难看出,未来 AI 会在哪些方面超过人、在哪些方面不可能超过人。第四类 AI 问题短期内难以突破。
AI 给全社会,尤其是给自动化领域、机器人领域带来的机遇是非常多的。过去几十年,我们经历了比较大的浪潮,第一波是 PC 浪潮,它给信息领域带来了颠覆性的影响。之后是互联网浪潮,它成就了一大批互联网公司,如谷歌、百度。紧接着是移动互联网的新一波浪潮,苹果、华为等都是乘着这一波浪潮起来的公司。下一波是什么?一定是 AI,下一波公司中如果能再出现苹果、华为这样的公司,那它一定是AI 公司。
目前,我国的人工智能发展正从 AI 1.0 向 AI 2.0 过渡。总体来讲,我国发展人工智能有优势也有短板。优势有四个:强有力的政策支持、庞大的数据、丰富的应用场景、非常多的有潜力的年轻人。同时有四个短板:基础理论和原创算法薄弱、关键核心元器件薄弱、开源。
既然有这四个短板,我们该怎么办?实际上,科技部在新一代人工智能发展规划方面已经有了一个很好的前瞻性考虑,基本原则有四个:一是科技引领,二是系统布局,三是市场主导,四是开源开放。目标是在 2020 年中国的人工智能能够和世界同步,到 2025 年其中一部分能够达到领先水平,到 2030 年总体上能够走在前面。
从事人工智能研究 30 多年来,我曾与不少科学家共事和交换意见。尤其是在上一波人工智能浪潮中,他们在诸多不利因素下,克服了种种困难,突破了自己的学科和背景所带来的局限,他们的献身精神和科学态度令我感动,也为今天的研究者们树立了榜样。在新一轮人工智能浪潮中,中国已经有了与世界同步发展的实力,以古鉴今,本书对中国人工智能发展的总结和梳理恰当其时,有助于新时代的人工智能研究者更好地了解人工智能的发展规律,同时可以让前人的积累成为代代相传的宝贵的精神财富。
未来的人类和未来的 AI,一定会共同在开放环境中前进。
本文摘自高文为《中国人工智能简史》一书所写的推荐序,标题和导读为《赛先生》编者所加。
《中国人工智能简史》
林军 岑峰 著
图灵新知出品
人民邮电出版社
2023年8月 出版
本系列图书全面讲述中国人工智能 40 多年的发展史,几乎覆盖了中国人工智能学科的所有领域,包括中国人工智能研究的起源、各个分支在中国的发展情况、当下与产业相结合的现状以及未来的研究方向等。以宏观的视野和生动的语言,对中国人工智能领域进行了全面回顾和深度剖析。
作者团队深入采访了全国十余所主要高校、中科院多个研究所老中青三代人工智能研究者,重点介绍中国人工智能领域杰出的科学家,以及他们创造非凡成果的有趣故事。
本书为该系列第一卷,梳理了自 1979 年至 1993 年中国人工智能领域初期十多年的发展历程,用轻松而真诚的笔触,讲述了为中国人工智能发展寻路的奠基者,并介绍了重要历史事件的来龙去脉,带领读者深入了解中国人工智能发展早期鲜为人知的历史。
如何成为AI第三波弄潮儿,不妨读一读历史
我所知道的裴健和华人数据挖掘大牛们 | 中国人工智能简史
微软系 40 大 AI 科学家,为何最钟情 GAIR 大会?