编者按:
在AI对话机器人ChatGPT火出圈两个多月后,全球范围内围绕它的讨论持续发酵,从一个简单的搜索功能的改变,到人工智能离产生自主意识最近的时刻,甚至到可能引起的新一轮科技革命和对人类文明进程的影响,都有涉及。
在这个互联网圈、投资圈言必称“AIGC”和“ChatGPT”的时刻,我们撷取了一位低调的科技圈大佬的深度思考,在他发散的思维中,感受到ChatGPT代表的这波通用人工智能小试牛刀给人类认知带来不小冲击的背后,可能会是更深远影响的开始。
以下为正文:
如果人类文明将在明天消失,今天,我们留下ChatGPT还是Google Search?
语言产生的本质是为了协作和思考,大规模的思考和协作反过来推动语言的丰富和发展。我们用语言赋予万事万物以名相,我们用语言讲故事以构建想象共同体、互相信任、凝聚共识,我们用语言把大自然的规律抽象出来并传承下去。语言是知识积累和文明进化熬成的一锅汤,人类文明的精华都在这一锅汤里。
语言是智能涌现的必然现象。OpenAI的科学家正在探索让机器发明属于自己的语言。他们在受限环境里,赋予机器某些目标,让多个智能体在奖励函数的驱动下,共同协作做出动作。在拿到奖励和完成目标的过程中,全体机器需要最高效的交流和协同,一种新的语言便可能被发明出来。
人类发明的语言在用作交流时是一维的序列,非常低效,半天说不清楚一件事,但用语言进行思维时,是非常高效的,这和大脑如何使用语言进行编码、计算和解码的机制有关。
GPT模型通过阅读互联网上足够多的语言和文本,试图在其中发现结构和模式,发现常识和事实。ChatGPT则希望在GPT构建的理解之上,根据我们输入的文本,用聊天机器人的方式,预测和生成下一段文本。
很难说,ChatGPT理解了人类的语言,他是一个黑箱,它的发明者都不能预测它的预测,它或许发现了一些结构和模式,但并没有形成因果和逻辑,更谈不上自主意识层面的目的和意义。有的时候,我们以为他有用,但实则不可靠。但不管如何,他和Google Search不一样。
Search是人类知识的快照,是一份硬拷贝。ChatGPT根据自己看过的东西,尽可能拟合出一个不那么耗能但足够逼近的映射函数,根据sequence预测下一个token,它可以生成这些快照的一部分,也可能生成这些硬拷贝中完全没有的东西。 回到开头的问题,如果文明消亡,我倾向于留下ChatGPT,而不是Google Search,因为确定性是死亡,不确定性才是生命。禅宗说,不立文字,言语道断,说出来的话,写下来的字,已经死亡了。
人类是否会被机器奴役?大概率不会。迄今为止,我们发明的最伟大的机器,其实是时钟。无论物理世界还是数字世界,所有生产力巨变的底座都来源于计时器。没有时钟,大规模协作不可能发生,不会有手机,玩不了游戏。时钟没有奴役我们,而是创造了诸多美好。要说奴役,是我们甘愿被我们热爱的事物所奴役。
时钟很重要,但单纯计时的手表没有那么重要了。我好像快三十年没有带手表了。买手机的那一年,就没有再带过手表。科技浪潮一浪接着一浪,有些事物曾经很重要,后来变得不怎么重要,他们可能成为奢侈品或者收藏品,一些新的事物慢慢开始变得重要起来。
我们曾经觉得Windows很重要,后来发现浏览器更重要,搜索引擎更重要,社交网络更重要,到后来发现推荐引擎更重要,再后来,也许像GPT这样的基础模型和人机对话也很重要。
再过几年,也许我们不用再满屏幕找词典App,查字典和翻译你和模型对话就行;百科和拍搜也不再需要,学习知识、答疑解惑,你和模型对话就行。学习语言同理。生活服务同理。
学习和知识的陪伴只是一部分,未来还包括心灵和情感的陪伴。未来的AI,它听得懂人说话,它像人一样说话,当他们学会下地走路,就是我们家庭的一个成员。
人工智能和基础模型把我们带到对话商业时代。生产生活的每一个环节,过去不能解决的问题,因为对话可能会被解决;过去本来就靠对话解决的问题,可能成本大幅降低、体验大幅提升,更多场景受益,更多人受益。
对话商业带来的是地球人口大爆炸,除了80亿人类,还有数亿乃至数万亿新人口产生。
作为企业,我们曾经从购买服务器,到购买虚拟机,到购买云容器,最终必将进化到直接购买和雇佣新人口。之前,我们曾经透过程序员和这些购买过来的计算资源打交道;以后,我们将有机会直接购买新人口,并用自然语言与他们交流和协作。 个人和家庭也是一样。过去我们购买电脑、手机等等,无非是购买背后的计算、存储、网络连接和信息,帮助我们提高生产力、娱乐和解决问题。以后我们可以直接购买新人口,Digital Being或者Embodied Agent,都行。
面向未来,我们需要生产和制造哪些新人口,满足谁的什么需求;为了维系企业的高效运转,为了生产和制造满足客户需求的新人口,我们需要雇佣哪些新人口。
Android中文的意思本就是机器人,Google从Andy Rubin手上买过来,做成了手机操作系统,只负责透明和驱动硬件、提供runtime跑应用,但凡和信息相关的东西都收进了GMS,和OS解耦,中国用户其实看不见,用不到。
Foundation Model把逻辑和数据封装到了一起,想在它上面做domain fine tune或者开发应用,你不仅要和人类对齐,还要和意识形态对齐,和所在社区的价值观对齐,剪不断,理还乱。只有底座越聪明,上面的domain、app和prompt才会越聪明。
ChatGPT只是冰山一角,未来的CoT、多模态、稀疏MoE、语言路由动作,都在路上。机器在通识的加持下,在环境中学会感知和认知,学会自主按需使用工具,是大概率的事情。
未来,自然语言和身体将成为主流的人机交互方式,GUI份额逐步缩小;神经网络计算成为主流后,GPU/TPU消耗越来越大,CPU消耗越来越小。
未来,基础模型(FM)将成为双端OS的新kernel,同时在云端和终端部署,燃烧大部分计算资源。
未来的应用将面向FMOS编程。未来的流量生态面临改变,超级App地位下降,信息分发和应用分发的模式面临改变,财富和权力的格局面临改变。
或者说,类似今天这样的高级编程语言,还会存在吗?