图片来源@视觉中国
钛媒体注:本文来源于微信公众号中国企业家杂志(ID:iceo-com-cn),作者 | 赵东山,编辑 | 李薇,钛媒体经授权发布。
在ChatGPT之前,全世界的科技圈似乎多年未见如此兴奋的场景了。
比尔·盖茨公开强调:“像ChatGPT这样的人工智能,与个人电脑、互联网同等重要。”而埃隆·马斯克在使用ChatGPT后的感受是“好到吓人”,他甚至断言,“我们离强大到危险的AI不远了。”
在国内,一波ChatGPT创业浪潮汹涌袭来。一直保持程序员身份的360集团创始人周鸿祎,对此次技术浪潮同样十分关心,在360集团总部办公区的洗手间墙壁上,甚至都张贴了包含ChatGPT及生成式AI的信息简报。
周鸿祎依然保持着自己的技术嗅觉。他认为ChatGPT即将带来新一轮的信息工业革命,与此同时,他反思过去国内对人工智能的研发太过于实用主义了,以至于错过了像ChatGPT一样通用人工智能的机会。
近日,《中国企业家》与周鸿祎就ChatGPT这个话题进行了一次长谈,精彩观点如下。
1.历史上,人类模仿鸟来飞行,失败了很多次,在身上加翅膀扑腾的都没有成功,但是,当人们领悟到鸟飞起来的空气动力学,后来设计出翅膀以后,人类就发明了飞机。
2.ChatGPT会因为胡说八道而犯错,这恰恰是一种真正智能的表现,这让人觉得它有非常大的潜力。
3.很多人拿ChatGPT当一个玩具,也指出它有很多缺点,这些缺点瑕不掩瑜。
4.ChatGPT不是把已有的资料搜索给你,而是模拟你的笔法,写一个你从来没有写过的文章,这个能力实际上已经非常贴近人类。
5.人类到现在对意识怎么产生、智能怎么产生也没有搞清楚,ChatGPT可能给我们打开了另外一种方式——通过模拟,通过大模型的算力来模拟人脑对知识的记忆、理解和推理。
以下为《中国企业家》对周鸿祎采访实录:
ChatGPT太惊艳
《中国企业家》:你是从什么时间开始关注ChatGPT的?
周鸿祎:说起来大家可能觉得我在吹牛,但很早我就开始关注了。因为我们本身就做搜索引擎的,互联网推荐需要的基础知识就是NLP(自然语言处理),在ChatGPT出来前,Google很早推了一个模型Bert,出来时很惊艳,当时我就让搜索团队和人工智能团队一定要关注这个技术,我自己对一些东西有些嗅觉。
后来GPT出来后据说路线和Bert不太一样,Bert找到很多实用的地方,可能太实用主义了,拿它来解决广告点击率、网页分类、推荐内容情绪判断,GPT出来后感觉这也是一个大家伙,但是没有看到好的应用场景,所以,到GPT-1、GPT-2我都进行了跟踪,这次ChatGPT出来突然有种恍然大悟的感觉,但是没有想到这么惊艳。
《中国企业家》:你是2020年左右第一代时就关注了?
周鸿祎:对,但那个关注还是抱着一种实用主义的观点。这次中美的互联网巨头都大跌眼镜。我自己总结,国内互联网公司花钱多少不一样,聚集人工智能的人才团队大小不一样,但是思路一样——人工智能应该找场景,要解决自己业务中遇到的问题。
所以,为什么中国的人工智能都用来解决人脸识别、图像滤镜做得更漂亮,如果一个人工智能技术和自己的业务不能结合,可能就会认为没太大意义,所以,没有人想到用GPT NLP的模型解决通用知识理解和推理的问题,更没有人想到大算力大数据,最后做出一个大模型,能够产生一种连OpenAI自己都想不到的智能化的结果。
《中国企业家》:感觉这一轮科技圈都有一种久违的兴奋。为什么会集体看好一件事?
周鸿祎:再牛的技术一定要有个贴切的场景。ChatGPT这次火起来,很重要的一点是找到了一种非常简单的交流方式,就像当年Google把复杂的搜索引擎藏在一个简洁的搜索框一样,ChatGPT今天把复杂的人工智能变成了云服务。
任何一个伟大的创新,背后一定有个伟大的技术在支撑,但是老百姓绝不会因为有伟大的技术、伟大的理念去支持你,他们都是需要你帮我解决一个特别庸俗、特别实用的问题。
ChatGPT很完美地在这三年做到了:第一,有强大的技术;第二,对产业界同行来说,让人感觉到它是一场工业革命的起点;第三,这种方便简单的交互方式,降低了用户的使用门槛;第四,它解决问题,尽管有很多人把它当玩具调戏。
这是为什么它破圈了,事实上它是人类历史上最快达到月活用户超过1亿的产品,这肯定不是靠任何的宣传炒作,也不是靠任何的概念煽动起来的。
学习能力像大学毕业生
《中国企业家》:可不可以理解为第一代搜索引擎还是资料型,第二代是知识型,再往前进化一步可能会到智慧型?
周鸿祎:我不太愿意这么分工,ChatGPT不是第三代智慧搜索引擎,如果把它当成搜索引擎用就理解错了它的定位。我觉得它真正的能力有三点:
首先, ChatGPT是一个通用人工智能,它不是为了解决某一专有领域的问题,而是为了解决对人类知识进行存储和知识化。
过去人工智能在搜索上做知识图谱,想了各种方法却找不到一种合理的范式,去把人类所有的知识能够全部吸收下来。但作为基础,ChatGPT完成了这件伟大的工作。它完成的工作很简单,建立了一个大语言模型,通过大力出奇迹的方法,而且不需要人工标注,我们叫做无监督学习。
ChatGPT用大模型、大数据训练出这个能力,有点像一个大学毕业生,它有了大学的很多常识、通识教育之后,再来学外语编程的速度就快很多。
第二,ChatGPT模型上增加了一种能力的训练机制,人可以训练它很多能力。举个例子,如果今天我要教你两位数乘法,需要的知识首先是九九乘法口诀表,但是,两位数乘两位数如何进位、借位,这个叫做能力,ChatGPT提供了这样一种能力机制。
ChatGPT从某种角度来说,它的能力就像一个7岁或8岁的小孩,假以时日只要有更多的人来教它,它的学习速度非常快,而且它的悟性会越来越高。
《中国企业家》:我记得上世纪60年代出现了一个知识管理概念,认为知识管理包含了对知识的提纯转化,第一步当然是存储了,但之前认为知识管理只能通过组织力量、人的力量来完成。
周鸿祎:你说的知识管理和人工智能的知识完全不一样,你说的知识管理像企业关心的一些概念,有点像维基百科里面的知识,但仅仅维基百科里蕴含的知识不足以实现人对这个世界的理解。
ChatGPT用的模型叫做Transfomer模型,这个模型模拟了人类对知识的存储、处理、理解,还有推理,我个人觉得,它基本实现了人工智能的一种,不仅是通用人工智能,而且是成为强人工智能的基础。
所谓强人工智能首先要能够理解这个世界,把ChatGPT看成一个黑盒子,会发现它能理解很多概念,做出很多推理。人们就喜欢强调,它和大脑不一样,它是一堆芯片,大脑都是神经元,这就是需要另外一个悖论。
如果我们把它看成硅基智能,人类叫做碳基智能,我们老用碳基智能的想法,就觉得只要有智慧生物的地方一定是碳基吗?一定要呼吸氧气吗?也不一定,在三体星球上生活的人就不一定是碳基生物。
历史上,人类模仿鸟来飞行,失败了很多次,但是,当人们领悟到鸟飞起来的空气动力学,后来设计出翅膀以后,人类就发明了飞机。今天飞机比任何鸟飞得更高更快,但长的并不像鸟,基本原理也不像鸟,但不能说因为它不像鸟一样翅膀扑扇,就不能定义叫飞。
今天ChatGPT用机器程序软件和芯片结合的方式,实现了人对世界的理解,而且能做出适度的推理,为什么我们就认为它不能产生智力呢?
《中国企业家》:你刚才做了一个特别好的比喻,人类向鸟学飞行。所以,现在我们倒过来看,其实ChatGPT模拟了人脑?
周鸿祎:它没有用物理上来模拟,是用算法来模拟。很多人拿ChatGPT当一个玩具,也指出它有很多缺点,这些缺点瑕不掩瑜。
第一,说它搜资料搜不准。这很正常,未来它就像人会犯错一样,真正的人工智能一定会犯错,因为给了它很多知识,在推理过程中产生突变。搜索不会犯错,是因为搜索不具备智能。
第二,有人说它胡说八道,这是比较可怕的地方。搜索保证不会胡说八道。原来我们做的“人工智障”对话有两种思路:一种用搜索的思路,用关键字匹配一些相关的答案,会给你感觉驴唇不对马嘴的回答一句应付过去;一种原来我们也做过,为你特意编程序,对问题做一些敏感词的处理,这样看起来很智能,其实也是伪智能,因为是程序员写好了代码。但ChatGPT就能煞有介事地编出一段一本正经胡说八道的文字,这恰恰是一种它真正智能的表现,这让人觉得它有非常大的潜力。
《中国企业家》:可以理解为,能胡思乱想恰恰是它最强大的能力,和之前AI相比来说是它进化的地方。
周鸿祎:我再举个例子,它其实和人脑的学习过程非常像,为什么ChatGPT的知识训练很重要,语料很重要。我们经常说熟读唐诗三百首,就算不会作诗也会胡诌两句了。
一个人一生最多读一万本,ChatGPT是你的500倍,未来ChatGPT如果把5000万本书都读了之后,它写东西的能力,即使它是模仿和借鉴,其实人类写东西哪个又不是模仿和借鉴呢?
智力超过了一般小朋友
《中国企业家》:你第一次和它交流的时候,有没有这种惊艳的过程,或者你第一次交流问它什么问题?
周鸿祎:刚开始把它当搜索用,就是问了一些知识型问题。后来我就开始问它很多推理的问题。再后来我有个朋友问了一个特别惊艳的问题,说他领养了一只狗叫三万,请问为什么给这个狗起名字叫做三万?
ChatGPT就回答说,人们给宠物起名字有很多原因,有的是为了纪念一个亲人,有的是用一个熟悉的物体,但是你这只狗叫三万不太理解为什么,能不能给更多的信息。我这个朋友接着说,这只狗曾经遭遇过一次车祸,送到医院做了一次手术,做完手术之后就把它收养下来了。ChatGPT说,我猜手术费比较昂贵,可能是三万块,那你起这个名字是为了纪念狗的这场手术。
这里面这个智能和推理能力,超过了一般小朋友的联想能力。当我告诉它手术的时候,它能知道手术是有费用的,三万块钱有可能是这个手术的价格,这是它最牛的地方,很多知识已经被编码在里面了。
《中国企业家》:它能够理解。
周鸿祎:Facebook首席人工智能科学家最近拼命攻击ChatGPT,说这个玩意就是一个产品化的成功,没啥了不起的。我和他们的观点不一样。我觉得ChatGPT有了非常强大的理解能力。
人脑的神经元工作原理非常简单,它中间有一个灰度,对一些信号能够起到反应。人脑里有100万亿甚至1000万亿个神经元,建立了100万亿个复杂的链接,所以人脑产生了智慧。人脑最伟大的地方是,用非常简单的单元经过无数多层的建构,产生各种复杂的关系。
反过来ChatGPT是不是无意中也一样用自动填空机这样最简单的编码方式,经过强大的算力、数据,比较完美地把人类的知识重新做了一种coding(编码)?
人类到现在对意识怎么产生、智能怎么产生也没有搞清楚,ChatGPT可能给我们打开了另外一种方式——通过模拟,通过大模型的算力来模拟人脑对知识的记忆、理解和推理。
一个技术奇点
《中国企业家》:你不只是从技术的角度看这件事,是从一个进化的角度来看这件事,就是它应该是全世界目前最强的一个学习体?如果按照这个逻辑的话。
周鸿祎:那天我开玩笑,ChatGPT像一个油腻中年人,因为它学的知识有很多书、文章的作者就是油腻的中年人,另外训练它的油腻中年人也很多,所以,它表现出情商很高,说话尽量不偏不倚,一碗水端平。
但是,从它的能力侧来讲, ChatGPT像一个刚小学毕业的小孩,它的训练过程分成三层,第一层就是给它足够的书,先不求甚解,生吞活剥,囫囵吞枣,先读进去。这个有点像大脑的神经元连接的能力。
第二,他们称为人类监督的微调。它是人类提示工程师,编各种答案,这个可能就会有误解,世界上的问题没有亿万也有万亿,它是能举一反三的。
第三,实际上是一个价值观的校正,它有能力做推理回答很多问题了,但就像小孩会犯错一样,你问它一些问题之后它会出很多答案,人会挑一个答案,它就会知道人类的偏好。
《中国企业家》:所以它是一个奇点吗?
周鸿祎:我觉得是奇点,你看过一个电影叫做《Lucy》吗?Lucy就说人的大脑的利用率由于受到功率,我认为是受到能量的限制只有10%,如果能够挖掘到20%、30%就很牛了,人类可能突破不了这个局限,但是GPT有可能。
这就需要巨大的算力。OpenAI现在也拿了微软100亿美元,算力不存在问题,微软也有Azure云,ChatGPT很聪明,和微软合作做了很多工程化的工作。
《中国企业家》:这么听下来,像知乎这样的公司应该是最恐惧的?
周鸿祎:那倒不一样,因为知乎里有很多高质量的问答素材,我认为知识是非常好的语料。语料很重要,过去很多人做机器人,训练语料用错了,训练出来的聊天机器人何止人工智障,还是人工杠精,跟你谈的主题毫无逻辑。
ChatGPT反而刻意回避了这样的数据,就像一个人不一定善于聊天表达,但他饱读诗书,他一张嘴很有逻辑,我们愿意跟这样有知识的人聊天。所以语料非常重要。这是第二个进化。
第三个进化,ChatGPT的GPT能力没有打开。它用同样一个模型,或者叫编码了人类的文本知识,这是基础。你再想象一下,它同样处理音频、视频和图片呢,这个能力对它来说已经不是问题了。这是我讲的第三种可能。
第四种可能,它今天还没有手跟脚,没有行动力,有人说做个物理机器人,这个想法就太狭隘了。ChatGPT今天需要的手跟脚是什么?API(应用程序接口)。
《中国企业家》:有API接口就行了?
周鸿祎:Web service(Web服务),比如你今天能够在美团订餐,通过滴滴叫车,在淘宝、京东上购物,都是网站提供了这样的按钮可以下单。今天ChatGPT输出的是一段语言代码,明天它输出的可以是一段指令,这段指令可以是格式化电脑,这段指令可以是把一个文件送到哪里去,也可以是下单,当它有了这种能力之后,ChatGPT无所不能了。
OpenAI今天没有让它自动去扒全网网页,不是OpenAI不能,是不愿意。为什么?
《中国企业家》:没有让它主动搜索。
周鸿祎:最近微软把它跟主动搜索结合起来,弄出很多问题,原因有两个,有个原因是因为所有的网页需要清洗数据和定期来进行训练。一旦它学了摩尔定律,当训练的成本急剧降低,算力每18个月又提高可能好几倍,它能索引全世界网页之后,它可以自己阅读,我觉得这件事就有可能会失控。
为什么很多机器人一放出来就被人教坏了呢?因为网页里充满了大量正确、不正确的东西,也充满了很多新的东西。这样训练出来的人工智能,就不知道学出来什么样的价值观了。
《中国企业家》:所有科幻电影当中的预言都实现了。
周鸿祎:对,在我的想法中,可能大部分都是错的,我也希望我的想法是错的,可能我本身并不是人工智能专家,但因为不是专家,使得我们没有用显微镜看它,没有用放大镜去看它,而是说用一个整体的外部视角去看它。我提的。
真正可怕的是什么
《中国企业家》:大家都在争先恐后地要搭上ChatGPT这个车,我记得您也说过类似这样的话,上不了这趟车,你会错过很多东西,而且有可能会被淘汰,你怎么看这种热潮?
周鸿祎:我刚才给你论调ChatGPT,因为它实现了通用智能,它实现了对人类知识基本的理解和编码。第二,它也实现了有能力随时更新和学习各种推理和计算的技能,也颠覆掉了很多传统的垂直人工智能领域。它巨大的进步,使得它有可能成为各个行业的水跟电的支撑。
我还是那一句话,你把它看成云服务,把它看成API,它对消费者是聊天机器人的界面,那只是一个连接端,聊天机器人之所以强大,不是聊天机器人强大,是聊天机器人背后的云端,智能大脑非常牛。
你可以想象一下,今天如果把智能大脑通过API的方式,相当于把云服务的方式连到目前各个业务系统里,今天所有的产业,所有的行业是不是都可以被它赋能之后,都被它提升一下?
我觉得它的发明,如埃隆·马斯克说不亚于iPhone,比尔·盖茨说不亚于重新发明互联网,我觉得这些溢美之词都不为过,我更愿意说它可能会带来一场新的工业革命,有点像蒸汽机和电力的发明。
很多人忽视了一个概念,大家都把ChatGPT当作一个to C的应用,其实它做to C,仅仅是牛刀小试。它真正野心在哪里呢?
微软今天是一家做to B的公司,微软有Bing,有Edge,但市场份额都很小,微软在Bing和Edge里加这种东西,我认为叫柔道战略,以小博大,去对付谷歌。
谷歌占据了全球92%的搜索市场,微软只有5%。这有点像当年面临免费杀毒的窘境一样,谷歌要不要引刀自宫?最后可能即使自宫也未必成功,因为Chrome的市场份额也比Edge大很多。今天微软真正的价值在于云服务。换句话说,微软可能将来要在自己to B领域真正地把这些能力用上。
据说ChatGPT已经找了100家左右的垂直类的创业小公司跟他们来合作,他们在ChatGPT的云服务的基础之上,来孵化100个垂直应用。我认为这才是ChatGPT可怕的。
《中国企业家》:培养它的生态。
周鸿祎:实际上我认为是叫SaaS的生态。我早就鼓吹SaaS应用是对企业数字化最好。ChatGPT本身就是SaaS服务,部署容易,有浏览器就能用,门槛极低,会聊天就能用。当然价格也很便宜了。
ChatGPT一个月收费,一个账号也就几十美金,将来一年可能199美元或者几百美元。所以它要扶植的一定是垂直应用。如果没有App Store,苹果不可能成为一个平台,苹果就是一个触摸屏的诺基亚。所以这是一种非常去中心化,市场化的思想,就是群体智慧。
ChatGPT它做的是通用人工智能,在通用的人工智能上搭建垂类,我觉得是非常聪明,也是非常省力的方法。
数字化浪潮来的时候,我说所有的行业值得重做一遍。这句话叫正确的废话,肯定是要重做,很多传统企业问我怎么重做?我还回答不出来。但现在很多企业如果用ChatGPT重塑一遍就比较容易,你买个SaaS服务就好了,把SaaS服务跟你现在已有的业务流程对接起来。
作为中国的高科技公司,我的观点是技术一定要有团队去跟踪。
《中国企业家》:在底层的,它还是大厂的游戏,因为你的技术能力,算力,模型的训练,只有大厂做得了,在生态上创业公司才行。
周鸿祎:我不这么看,它为啥能变成一个革命,五个链条都做得很好。
第一,ChatGPT能做出来,除了OpenAI的努力,实际上所有的成果都不是OpenAI,里边用到的各种算法,各种模型,都是美国几十年下来,包括谷歌很多公司、大学、实验室,公布了开源的算法、论文,这种集大成者,所以ChatGPT是很恰当地把这些成果用到了一起,这是对我们第一个启发,我管它叫Open Source(资源开放)。我认为是新时代的集中力量办大事,大家一定要相互交流成果,而不是封闭起来,画地为牢。
第二,OpenAI和微软的合作模式,OpenAI更像是有理想的研究机构,它选择了一条最难的任务就是做强人工智能,用通用大模型解决通用问题。如果没有这种格局和长期主义,即使是微软、谷歌、Meta这些公司也不行,公司大到一定时候,最大的障碍是实用主义,我承认我们有人工智能研究院,也培养了很多专家,但我们也是实用主义观念。
第三,确实需要产业化公司的介入。大厂的介入,不光是算力,它要解决几个问题:
1.ChatGPT的成功一部分是技术,一部分是产品体验,还有一部分是工程化,这里边看起来很简单,把多少亿的数据送进去进行训练。我认为这次ChatGPT成功,微软出了很多算力、工程师,帮它解决工程化的问题。
2.公司比较擅长的是用户产品体验,很多做研究的科学家可能技术完成了,但这东西有人没有人用,因为用户体验很重要。苹果手机再有App Store,如果它的体验界面做得不好,这个产品也是不能成功的。所以我觉得微软在这方面的贡献应该做了很多。
3.最后这件事还要找到商业模式,因为运算的成本很高,训练、推理、运转的成本高,如果找不到商业模式,这事难以为继,但你让科学家们去想挣钱的事,可能会错位。这应该是商业公司来做。
4.生态。光有大厂是不够的。大家现在都意识到了这东西像一个操作系统或者像云服务、App Store一样,无论你打什么比喻它上面一定要有垂直的应用。我是觉得国内要做,无论谁做这大模型,都要早点开始考虑不能把它做成封闭的,而是把它变成开放的市场的概念。
5.面对用户。强大的用户流量的反馈,上亿的用户,个人和企业都能用极低的门槛,使用ChatGPT,这里面用户使用意图的猜测,使用问题满意度的反馈,都会给ChatGPT带来不断的改进,推动智能飞轮越转越快。
中国不能缺席
《中国企业家》:刚才您说的ChatGPT在美国是开放的胜利,而不是大家关起门来自己搞。
周鸿祎:我力图总结它成功的经验,我觉得从技术、语料、战略上,我们都能做。我们中国人的工程化能力很强,模仿能力也很强,后来居上也不是不可能,现在最关键的难题是大方向和目标,别人已经给你验证出来了,剩下就是时间问题。
我觉得可能需要在机制上有真正的创新,要不然很有可能画虎不成反类犬。我粗略总结几个词:第一肯定是开放,第二是合作,第三是Open Source。
《中国企业家》:咱们之前已经谈过一部分,数据的污染有可能会存在自我修正吗,怎么样让它避免和人类为敌呢?
周鸿祎:第一,ChatGPT现在还是事件驱动型的模式,你问它的时候,它才会被激活。第二个缺陷是它没有记忆能力,它跟你聊完天,你把聊天窗口关掉了,它这个东西并没有训练和补充到模型里去,它只是短暂记忆。这些在工程上都是可以解决的,(人工智能)产生意识之后会怎么样,会不会产生对人类的(影响),这个就没法回答了。
《中国企业家》:人工智能会不会毁灭人类?这是特别可怕的事,你想起来最后不管我的后代多么优秀,但是他都会被ChatGPT秒杀。
周鸿祎:这个问题也有人问过我,我也回答不出来。目前ChatGPT的能力还是知识面广,推理能力一般,现在的创新力和想象力不足,或者没有创新力和想象力。
《中国企业家》:在ChatGPT之前,这都是科幻小说当中的场景,但是到了三五年之后,好像觉得不是那么不可能变成现实的事。
周鸿祎:对,对于GPT,我的建议还是要多用,在用的过程中,仔细体会,测试它人工智能的能力。
首先,中国要做自己的ChatGPT,中国的算力不太缺,要集中起来;第二,算法,别人已经指出道路了,算法很多也是开源的,这里重要的是两个东西,一个是语料知识,一个是能力的训练,能力的训练是ChatGPT中唯一没有公开的,这块可能也是一个重点。
语料上,我提几个观点。
第一,我个人觉得工业革命级的创新,最好国家有包容创新的支持政策,这事一定要做,中国至少没有缺席。我刚才讲开源+众包可能是很重要的合作,包括生态,可能有很重要的策略。但是有很多人顾虑它种种风险,我认为如果不做,可能才是对我们国家发展最大的不安全。
第二,客观地讲,要把ChatGPT训练好,要用全人类的知识。整个全世界中文网页大概是其他语言网页的1/10吧,书籍的数目也不足。大家训练一定要有开放的思路。国外的,虽然是不同语言,也是人类共有的知识积累,这里边要用ChatGPT学习,要用全球的知识来做训练。
国外虽然APP也取代了Web,但国外很多APP基本保留了Web版,用浏览器还是能在网页之间跳来跳去,能够自由使用。国内信息都被APP私有化了,如果这些巨头互相把握着,谁的数据都不全,最后训练出来的大脑肯定能力是比不上的。
在这方面,我觉得国家应该像当年工信部要求大家不能互相阻拦对方网址一样,要求我们APP都应该有Web版本。这样的话,大家手里才都有数据。我是觉得在这方面,国家可能要有相应配套的产业政策,来鼓励行业里良性竞争,开放合作。