在语言上有天赋的人,大致表现分为两种。一种是作家,善于在小屋里憋坏,花时间攒出一套文字,让人花时间看完,还得细细回味,才懂得其中深意。一种是演说家,比如脱口秀演员,他们难以输出长篇文字,但长于临场发挥,出口成章。
这两种人的代表,可以选莫言和何炅。莫言做不了主持,何炅写不了小说。如果让莫言和何炅现场吵一架,何炅必胜。反之,如果两人都在网上骂架,有时间编套路,莫言赢面占优。
从ChatGPT开始,我终于知道,世界上还有另一种可以模拟即时生成文字的科技。它们统称生成式AI。
使用日久,我发现,生成式AI与脱口秀演员,或者任何需临产发挥的人类技能,相似度极高。
总结如下:
1.编句子靠概率
生成式AI的原理是根据上文,搜索向量数据库,并按照相似度找出匹配的结果,完成句子编造。
脱口秀演员亦如是。口头表达出众的人,大脑神经元周边活跃的回路,类似向量数据库。活跃度高的部分,有更大概率提供下文需要的文字。
我虽然不强与现场发挥,但就某个议题扯上一段时间,问题不大。在我说话的时候,脑子里是有大量词语和句子候选的。虽然它们出现的时间很短,事后我也很难复述,但我可以明确感知到句子的组织,并根据想要表达的意思来不断调整。
生成式AI的表达,类似。在OpenAI的接口文档中,有一个参数,中文翻译过来是温度。温度越高,随机性越大,AI的语言创造力,或者胡说八道的可能性就越大。
脱口秀演员与常人不同的地方,异曲同工。他们就是温度贼高的生成式AI,段子不走寻常路,才能做到语出惊人。
2.没有逻辑
生成式AI产生的文字,只和相似度计算结果有关。它并不真正理解自己在说什么。所以我们会用,一本正经的胡说八道来指责它。AI说的每句话,都符合文法,句子通顺,但表达的意思满拧,完全禁不起推敲。
脱口秀演员的表现要稍好一点。但即时发挥,让他们的思考只能通过简单的快思考来完成,缺乏理性。好比莫言和何炅吵架,何炅虽然赢了,但事后复盘,他的话全是漏洞,不值一驳。可现场输赢,比的是气势,要的是情绪,不能找后账。
3.受语境限制
生成式AI的本质是通过计算上文向量,找匹配的文字,续上。所以,上文很重要,得接下去。
脱口秀也一样,段子不能太飘,否则没有叠加效果,东一榔头西一棒子,不好笑,观众搞不清你在干嘛。
4.固定范式
脱口秀有没有套路。肯定有,虽然李雪琴这样的学霸看起来天生就会,但段子通常还是有套路的,不然会变成自说自话。
生成式AI在使用时,有一个场景,叫做finetuning,微调。微调的意义不在于让Ai学习更多语料,而是教它学会一种新的范式。以不同的计算方式,去匹配向量数据库,找到不同的答案。
我相信,如果有人将某个脱口秀演员的作品拿来做AI微调,一个傻不拉几的脱口秀AI可能就此诞生。
5.胡说八道
脱口秀是冒犯的语言表达。人类从古至今都在践行一条行为规则:将笑声建立在别人的痛苦上。所以有段子:今儿你有什么不高兴的事,说出来让我高兴高兴。
边界没弄好,就变成胡说八道。比如Will Smith扇出的大耳瓜子。但除了Will Smith,别人确实也笑了。
生成式AI的胡说八道,主要是因为上面的第2点。它是真的不懂自己在干嘛。但码农可以根据人类规则给AI设定栅栏,不然它说某些话。前提是,这些禁忌能够被明确出来,才能写到程序里。
明确不出来的东西,也不能怪AI胡说八道。无知无觉的AI,特别适合背锅。
好了,今天的科普就到这里。综上所述,我大胆预测,AI最先取代的工种之一,就是脱口秀演员。这份职业没有前途,还是干回老本行,写剧本吧。