高小山说
2023年2月15日晚,百姓网创始人王建硕做客高山书院,与同学们一起进行了一场关于 ChatGPT 的主题讨论会,讨论话题涉及:
(1)ChatGPT 出来,创业者关注点应该是什么?
(2)ChatGPT 将会有怎样的应用?
(3)百度的“文心一言”或王慧文的“光年之外”,值得做吗?
(4)ChatGPT 创业有哪些坑?
(5)很多工作会被 ChatGPT 取代吗?
以下内容根据课程分享整理而成,经导师审核后公开发布。课程内容分为上下两篇,此为上篇,下篇为高山同学们的分享,敬请期待~
嘉宾简介
王建硕
百姓网创始人
基于GPT大模型的产品探索者
主持人
李可佳
Monad Infinity Venture Partner
原字节跳动智慧教育CEO
高山书院2020级同学
张首晟奖学金获得者
高山科学促进中心秘书长
各位老师同学,大家晚上好。我是今天讨论的主持人李可佳,感谢今天的嘉宾王建硕老师和上线的各位同学们,非常期待与大家就最近大热的 ChatGPT 进行一次深度交流。
作为一个计算机专业的毕业生,我第一次听说 GPT 已经是比较晚的时候了。2020 年的 7 月份,GPT-3 横空出世,我一个老同学兴奋地发了个朋友圈:“请注意,现在站在你面前的是互联网原子弹、人工智能界的卡丽熙、算力吞噬者、黄仁勋的新 KPI、下岗工人制造机、幼年期的天网——最先进的 AI 语言模型 GPT-3。” 我随手评论三个字:拉倒吧。
在我看来,这就好比是美国研发了一个新的核武器,比第二名的武器要强上百倍。但这些事情对于我们小老百姓来说,又有什么关系呢?
所以最开始我没有太在意这个事情,跟着大众吃了一个月的瓜,最近看了张宏江院士和王建硕老师的一些文章后,我发现这个东西不是一个核武器,反而有点像是给每个人发一把 AK47。
在 ChatGPT 的冲击下,这个世界会变得更加分裂还是更加美好?有没有可能会有一些意想不到的事情发生?下面有请王建硕老师为我们分享他的观点。
谢谢可佳,也感谢高山书院邀请我来与同学们一起分享这个话题,大家有任何问题可以随时提问。
首先谈谈我个人对 ChatGPT 一个感性的认识。一个词来形容就是:兴奋。
像 ChatGPT 这样能够发动全民参与,提升生产力这样的事情,我这一辈子只遇到四次。
1994年,网景浏览器诞生,图自网络
第一次是见到 Netscape Navigator(网景浏览器)。那个时候感觉好像是打开了一个新世界,这也是与我见到ChatGPT 感觉最像的一次。第一次使用了这个浏览器的人兴奋得不得了,可以连续玩三四个小时停不下来,像打了鸡血一样地抓着周围的人一起去上网,疯狂地推荐给别人,就像病毒式的传播一样。虽然那个时候还需要花 29 美元买了以后才能上网。
这次 ChatGPT 给人的感觉就是用了之后很惊喜,有一种莫名的冲动想要拉着别人一起用。
第二次是我觉得跟 Google.Com 出来的时候很像。当初我用 Google 的时候,其实里面是一个信息的荒原,它的搜索能力很强,但因为信息太少,几乎什么都搜不出来。我印象很深刻的一件事是当我去搜上海这个词时,结果只有 4 个,一页填不满。
所以当你看到 Google 出现的时候,你最该干的事情是什么?回过头来看,其实我们最不应该干的就是再去做一个 Google.Com,而应该是赶紧去做网站,做了网站就很容易被 Google 索引。因为没有人给互联网提供信息,尤其是中国本土相关的信息,所以那个时候我随便写一篇文章都会出现在 Google 搜索的第一名。
第三次是看到 iPhone 出来的时候。但相对来说,这次并没有那么深刻。
第四次就是现在的 ChatGPT。它让我们看到,人机交互这个事情原来是可以真实做到的,这对我来说,相当于是一个时代的转变。现在很多自媒体文章都在说 ChatGPT 这款产品有多么优秀,就像是94-95年,所有的新闻报道都说 Netscape Navigator 的创始人吉姆·克拉克(Jim Clark)和马克·安德森(Marc Andreessen)多么厉害,年纪轻轻就做出来这么牛的产品。回看历史,其实我们的关注点不应该在这上面,也不应该再关注浏览器,而是应该关注一个互联网时代的到来。
网景浏览器创始人吉姆·克拉克和马克·安德森,图自网络
因为没有浏览器就没有互联网。浏览器出现后,它不仅仅是开创了一个浏览器的产业,更是开创了一整个互联网产业。事实上,浏览器产业占整个互联网产业的1/1000都不到。
今天之所以跟大家做这个分享,我想的就是,我们应该把注意力从 ChatGPT 这个产品和 OpenAI 这个公司本身移开,投入到未来星辰大海一样的应用领域。
那么,ChatGPT 将会有什么样的应用,如果要投入,又该如何去投入?
应用
很多人说 ChatGPT 像 Google,像聊天机器人,像各种各样的东西。在我看来,并不是这样的。
简单来说,ChatGPT 可以看成是由两部分组成的,一部分是用 45TB 的训练数据+无数 GPU +无数电力像“炼丹”一样“炼”出来的一个含 1750 亿个参数的 800G 容量的“大脑”,我们把它称之为“大语言模型(Large language model,简称LLM)”。另外一部分是 45TB 的数据库。
今天我们重点讨论的是这个“大语言模型”。
“大语言模型”其实跟浏览器和 HTML 有点像。我们做网站需要有自己的数据库,需要有搜索,有业务逻辑等等。很多人说,ChatGPT 出来了,感觉一切都会变了。
我认为是不会的,即便是互联网的出现,也并没有造成地动天摇一切都变了的情形。比如餐馆现在用互联网点餐了,但是我们吃的麻婆豆腐、鱼香肉丝它还是大厨在做,只是餐从做出来到我们手里的流程变了而已,90% 的根基还是不变的。
ChatGPT 时代,我们也会需要数据库,需要索引,需要业务支持系统等等,只不过是人机交互从 HTML 变成了 Chat,当然这也不是绝对的,很多的 Chat 的界面还是需要用 HTML 来写,只不过是核心变成了一个 text 入,一个 text 出这样的交互。
一旦变成这样了以后,现在很多的业务都需要重写,但是重写的部分不多,数据库那部分基本都是平移过来的,而这种平移过程,就是我们所有从业者最大的机会。
大家要注意的是,ChatGPT 不是只有一种,就像并不是全世界只存在一台阿帕奇服务器一样。今天我们聊的并不仅仅指的是 OpenAI 开发的 ChatGPT,而是讲它所建立的大语言模型。
而在这样的大语言模型下,我看到是一片信息荒原。
什么是信息荒原,比如你去跟接入了 ChatGPT 的“机器人”聊天,会发现它其实就是“一本道”——一本正经的胡说八道。比如你去问它今天的天气、航班信息、财经信息、推荐股票等等,它就胡说八道或者说“网站无法找到”、“暂无信息”等等,因为它的数据是截止到2021年的,但如果你把这些信息告诉它,它就能给到你想要的回答。
在这种信息荒原之下,难道你就没有一种冲动想要去做点什么吗?其实这些信息都是有的,只需要我们“灌”给它就行,就像当初1995年的时候,为了给互联网提供信息,新浪每天都派人早早地去买纸质的报纸,扫描进计算机然后公布到网络上,后来它成为了中国当时最大的网站。
所以这个层面上,ChatGPT 仅仅只是一个“翻译官”,给它信息的人才是“Google”。
我很清楚地记得,96年第一次看到 Netscape Navigator 出来的时候,我激动得一晚上没有睡着觉,在宿舍里写未来的各种可能。过了20多年,前一段时间 ChatGPT 或者更贴切地说是这种大语言模型出来,这样的事情在我身上又发生了,我也是激动得写了一晚上idea,写到凌晨五六点。
以我这种“互联网老兵”的身份回头再去看的话,就会发现,当浏览器出来的时候,我们未来缺很多东西,首先缺新闻;其次缺电商,98年我第一次创业做的就是一个电商网站,比刘强东还早15年,但很显然时机不成熟,废掉了。但总有一天是需要电商的,需要像美团这样的东西。
不管是 ChatGPT 还是百度未来的“文心一言”或者王慧文要做的“光年之外”,其实相当于是开启了新的人机对话模式,这个世界未来的可能性太多了,机会非常大。比如在这个世界里,暂时没有互联网时代的“携程”,没有“eBay”,没有“Google”,甚至连“雅虎”也没有,“好123”、“新浪”也没有......
在当下这种情况下,确实是有很大的机会,但也有很大的坑。在我看来,整个世界都可能被2个大“黑洞”吸走。
第一个“黑洞”就是,大家都跟风去做大模型。
很多人问我怎么看王慧文老师带资入组做大模型,那在我看来这就像是当年 Netscape Navigator 出来的时候一样,着急忙慌的再去做一个浏览器意义并不大,也没有那么必要。大模型是需要有人做,比如王慧文老师、百度等等,世界上一定需要像王慧文老师这样的上头派、热血派,需要这样仰望星辰大海的人去把大模型做出来。
但对于绝大多数创业者来说,世界不需要那么多浏览器,也不需要那么多大模型,有三四家就够了,我们应该把目光专注在应用领域。
而在应用领域,90%的人又会被另外一个“黑洞”吸走。
很多人迟迟没有动手去做一些事情,其实不少人是一位做AI需要非常专业的人员,需要去招博士招搞自然语言处理的人才等等,但实际上,这就是一层窗户纸的事儿。就像浏览器出来,真正进入了你就会发现,只需要懂得做建网站的所有基础信息基本就足够了。
在这个问题上,我当初也被耽误了两三个月。当我看到 Netscape Navigator 的时候,我特别想进入互联网,我去图书馆查,所有的书都是关于怎么编程,怎么写C++的,都是做浏览器的教程。但其实,真正进入互联网之后,你只需要懂得怎么写 html 就行了,不需要专业的基础。
互动问答
答:简单一句话回答就是:无法识别。
答:这是一个很显然的问题,因为它本身就是一个文科生。它是一个大语言模型,就是训练语法、行文的表达等功能的,所以在这个层面,它几乎是不会犯错的。那它在什么层面会犯错呢?首先是事实错误,比如你问它:“意大利面和42号钢筋一起怎么做菜”,它就会像模像样的告诉你,需要切段,加上什么调料之类的。
为什么会出现这样的状况?这就要回到语言模型建立的原理上去。鉴于时间关系,我们不展开细说,可以给大家举几个例子说明一下。
大语言模型的工作原理,其实有点像是我们人常会被影响的一个现象——“顺口溜”,比如我说“床前明月X”,那你一定会马上回答出来我们都在想的那个字,为什么?因为我们见得太多这样的组合了。ChatGPT 也是一样,它阅读了大量的资料和文献,它也能轻易补上这个字,甚至还能反着补齐“X前明月光”,这都已经是2017年那个时候的技术了。
另外一个例子,我们问 ChatGPT:“1+1=?”,它会立刻回答2,但如果问它 3114×332=?它就回答不上来,它会随机说一个数,但我们也会发现,最后个位上的数从来不会错。比如这道题里,个位数就一定会是 8。因为 ChatGPT 见过太多这样的模式了,就像我们的“顺口溜”一样出来了。
答:我认为可能性是 99. 99%,我不是真正做大模型的,但是我问了一些专家,总结起来就是,中国做出一个大模型的难度,跟哥伦布第一访问新大陆之后,第二次再去访问新大陆的难度是一样的。虽然过程会曲折,但整体流程是清晰的,不存在秘密和不确定性,就看愿不愿意投入那么多精力和金钱。
之所以最开始大家不愿意投入那么多的金钱,是因为这是一个完全未知的。比如 OpenAI 在做出来 GPT-3 之前,先投入了 5 亿美金,没做出来,又投入了 10 亿美金,还是什么都没做出来,再投入 20 亿美金,钱烧没了,又追加 30 亿美金,这个时候全行业的人好像都在看笑话,就看他们怎么收场,因为所有人都不知道接下来还要投入多少,每个人心里都是没底的,如果真的投入到了 100 亿美金,1000 亿美金的时候会是什么样子?
这就有点像是哥伦布航海的时候,一直往西开,开到船上的补给刚好够折返的时候,还要不要继续往前?这个时候能决定这个事情的,就是人类的意志了。当然最后哥伦布一直往西前进了,他相当于是堵上了一整船人的性命,与船上所有人为敌,好在最后找到了新大陆。
但是一旦找到新大陆之后,西班牙人、荷兰人、葡萄牙人、法国人也都相继找到了,为什么?因为他们知道了这一趟行程是什么样的了,知道需要花费些什么。
所以不管是对于 Google 还是中国的厂商,只要这个路走通了,不管要花费多少钱,投入进去就好了,因为最终肯定是能做到的,而且,由于已经有了先例,后来者可能还会规避掉很多的弯路,更节省成本。
但实际上,对于行业来说,谁做出来大模型并不重要,有没有这个模型很重要。
答:可能性都存在。但其实对于我们这些创业者来说,这场战争其实还没开始,就已经结束了,因为不管是 OpenAI 赢还是百度赢,最后能让我们调它的 API,把我们的信息经过它的语言大模型,最终翻译成用户可以理解的东西就可以了。所以我不在意这个问题的答案,我觉得也不重要。
答:我觉得这是一个很好的问题。
可能才能用100年前的农民的眼光来看,我们都是一群“无用”的人,因为看起来好像我们每天什么都不做,不用下地,不用种田,只是每天对着电脑“傻笑”就能有钱赚,一天就可能轻易收获原来农民干一年那么多的粮食。
在我看来,其实所有人的工作都将会被取代,但工资从来没有被取代。
为什么这么说,你想想,你见过有人拿着计算器去考试考满分的,但你见过计算器自己考满分吗?所有这些技术的东西,到目前为止,都只是人类的工具,使用工具的人效率越来越高,也使得越来越多的人慢慢走向100年前的人看来的“不劳而获”。
大多数人都担心自己被取代,但我认为,这是最不可能出现的事情。
因为不管在哪个行业,善于使用工具之后,行业的生产效率都会极大提高。不是被取代,相反而是这个行业的从业人数会增加。而那些不能被提升效率的行业从业人数则会越来越缩减。
比如在我看来,现在最容易取代的是程序员,但在未来5-6年时间内,成为程序员的人会越来越多。原来的代码要写得非常规整,一个分号一个括号出问题都会报错或者是识别不出来,有了 ChatGPT 之后,只要是人能读懂的东西,机器都可以执行,这样一来,大部分人都可能成为程序员,从业人员只会越来越多。并且,工作强度和工作时间一样,但因为效率提升,工资可能会是原来的3-5倍甚至更高。
而画家这个领域,从米开朗琪罗到现在,基本没有什么专职的画家了,大家现在使用 Midjourney 去画画,即便是我这种从来不会画油画的人,敲几个字进去,就能自动生成一幅漂亮的画作。去年可能有1万人左右从事画画,而在未来5年,估计全球会有2亿人左右从事画画相关的工作。所以你看,Midjourney 究竟是取代了画家的工作,还是创造了 2 亿个“新画家”的职位?
仔细思考这个事情,我们会发现,其实本质是一个领域生产效率的极大提升,而效率提升越多,从业人员就会更多。所以某种程度上,我们都是机器养活的人,未来的人在以前的人看来,可能会显得更加“游手好闲、无所事事”。
答:这是一个关于整个 AI 未来走向的问题。作为一个狂热的技术乐观主义者,我相信未来肯定是好的。大家喜欢说 AI 统治人类什么,其实都是因为我们在进步的时候看到有风险的可能性,但其实我们也要看到对抗的部分。就好比我们知道酒驾危险,后来就不允许酒驾了。
我们的整个技术都是在发生发展的,所以我并不觉得前面一定是黑暗的。对于我们创业者来说,大的政策方向其实是我们无法把握的,那我们就需要把更多的时间和精力花在“真问题”的层面上,去思考如何抉择和变化。对于关注圈之外的问题,不浪费自己的“算力”。
非常感谢建硕老师。刘慈欣在他的小说《赡养人类》里写过这样一个场景,未来可能是某一个大佬养着全世界的人,所有的人都变得越来越“游手好闲”。当然,这是不同人对于技术的不同看法,这是非常值得我们探讨的问题。
最近也看到一个观点特别有意思,它讲的是在历史上,价值链是不断地在被打破,而每一次被打破时,对应的商业模式、商业机会就会被重塑。
就像书写出现之前,内容从创造到消费必须是即时的,就像听说书人讲故事一样的场景;而在印刷术出现后,再到互联网信息分发,价值在一步步被解绑,这个过程中也涌现了越来越多的机会。所以像建硕老师所说,某种意义上确实是会有新一代的“程序员”“画家”群体出现。
ChatGPT 可以说是让所有知识劳动者做一次个体的数字化转型。
个体需要开始解绑自己的“工作”,拆解成不同的“任务”,对应不同的“技能”,然后在不同技能上使用不同的AI来替换或支持,重新设计工作流,达到强化自己的效果。
这是最坏的时代,因为必然有大量的就业岗位消失;这也是最好的时代,因为对用好AI的少数人来说,“组团队”只需要过去10%的资本量。
关于高山书院
高山书院(GASA)以“科学复兴”为愿景,以“没有受教,求知探索”为理念,以“公心大用,智识生活”为共识,引导企业家、创业者及各界知名人士学习科学,同时向社会传播科学精神和科学知识。(
高山书院是一个什么样的地方?
)