最近推出的ChatGPT已迅速成为现象级的AI应用程序。它如何代表人工智能技术的飞跃?它的出现会破坏哪些现有应用程序的稳定性?本文通过ChatGPT的一个真实用例,详细分析该应用的技术轨迹及其对信息检索的潜在颠覆性影响。我希望它能启发你。
这两天新出的ChatGPT真是火爆!
首富马斯克一马当先,带领大家玩个痛快。看来AI奇点来了!没玩过的小伙伴我就不多介绍了,大家自己摸索吧。
作为一个二手AI从业者,很多人催我写《人会死吗?当然,我没有机会看他们的源码,看的时候一头雾水,也没有人告诉我。
所以,我们先不谈技术框架,而是看真实的用例,这个现象级的AI应用会走什么样的技术路线,能把现有的应用拿下来。
限于篇幅,今天我们只讨论以下问题:
为什么ChatGPT突然变得这么难了?
这家伙先揭穿谁,是搜索引擎吗?
人工智能测试垫底的图灵测试要KO了吗?
1.为什么这次ChatGPT这么难?
与其前身相比,ChatGPT的影响是惊人的!大家感受最深的就是机器人说话“人性化”了。这就像人的话有两层意思。首先,一些基于信息的内容答案的准确性会显着提高。这个例子太多了,随便贴两张:
看这专业度,至少比问我还靠谱!它反映了什么样的技术发展?
自然语言处理的广义模型一直存在一个问题:如果是完全无监督训练,则无法区分语料库的真伪和质量;这次ChatGPT在答题质量上有了质的变化,更要强调的是优质内容。
类似于监督训练。从结果来看,还是比较成功的。
最让我意外的是,ChatGPT这次给出了很多令人钦佩的道德限制。不用说,这需要稍微监控一下。除了大家耳熟能详的“未来预测题不作答”,下面两个例子的对比也相当出彩:
除了内容,ChatGPT的答案组织和语言技巧也特别好。
基本上就是把各种信息综合成一二三点的模式,就好像领导讲话一样。这就是为什么我认为在语言生成的结构方面,我们也应该有意识地选择高质量的认真职位,并且还要使用一定的引导学习。
所以你也可以看到,它总是说着南北北调的老套话,一点也不像论坛里混杂的语言风格。后来有消息称,ChatGPT这次采用了强化学习系统,确认的方法是找几个人盯着结果录入,这和有监督的差不多。
2.谁将率先废除ChatGPT?
那么,ChatGPT能否成为很多人期待的搜索引擎杀手呢?
熟悉搜索的朋友应该明白,搜索查询分为两类:信息搜索和导航搜索。让我们分别看看它们。
基于数据的搜索寻求特定的信息或信息,并且要求当然是精确和明确的。在清晰度上,ChatGPT提供的结构化呈现比传统搜索引擎要好很多!
但就准确性而言,老实说还是很接近的,而且经常会有一些误导性的答案。最重要的是,人们仍然有信心:
尤其是中间那个,简直让我高兴不已:要找这么个豪门女人,只怕是活不过正月十五啊!
让我们谈谈浏览搜索。简单地说,用户输入关键字并使用搜索引擎进行购买。目前,并非所有信息都要求准确,但覆盖率和实时性非常重要。
在实时性方面,这个模型仍然不能近实时更新,可能是训练成本高的缘故,目前它的知识横截面应该还停留在去年的《纽约时报》水平。
从语言数据覆盖面来看,ChatGPT只有英文语料库,中文问答均使用机器翻译转为英文。这一点也得到了实测的验证。如果只想使用中文语料库中的背景信息,基本上会给出错误的答案:
总结:我认为ChatGPT绝对是搜索引擎的主要对手。然而,由于信息列表被单一答案所取代,准确性挑战相当大,还有很长的路要走。
另外,现有的技术栈似乎并不支持近实时的数据索引,这极大地限制了它的实用性。
(顺带一提,宋江被普遍认为是秦命野废墟行的牺牲品,但金圣叹认为这是花溶的主意。)
不过,目前取代百度、Stackoverflow等非实时专业知识社区的ChatGPT前景广阔。不,Stackoverflow应该感到寒冷并开始禁止上传由ChatGPT创建的内容。
当然,对于那些像微博、推特这样的情感化、非专业化的图文社交网络来说,这样一个不知疲倦的五人六喇叭机器人很可能会给整个社区的内容生态带来巨大的改变,那么它不是颠覆,它可以马上做!3.通过图灵测试?
最后说一下图灵测试。
ChatGPT一出现,就有人惊呼:图灵测试要结束了!我认为这可能仍然是一种严重的夸大。
图灵测试的水平其实远超常人的想象。想让电脑聊一会不露馅的话,主要不是写代码,问攻略之类的专业问题,而是在一些人看起来很肤浅的日常对话中撒谎。
善于聊天的人,互相说几句,对方就原形毕露。例如,我问了ChatGPT这两个问题,你可以看到它是如何回答的:
对于前一个问题,大多数正常人的回答是,“你为什么关心1.25亿这个奇数?”
人对后一个问题的正常反应应该是:“这件事我怎么提醒经理,多丢人啊!
”
看到这两个问题的答案,我知道虽然ChatGPT在理解和表达上有了很大的进步,但一些核心难点还是一样,不容易解决。
当然,你不需要人工智能来通过图灵测试。即使失败了,也有很多可能的业务应用场景。只是,客观上,以目前的技术栈和方法体系,我认为短期内没有希望通过图灵测试。
毫无疑问,ChatGPT是人机自然语言交互的一个重要里程碑,在非实时、专业信息领域已经有很好的机会取代原有的社区和垂直搜索。
当然,客观地看目前的情况,说它可以取代搜索引擎,甚至通过图灵测试,无疑是过于乐观了。
不要误会我的意思,我不是一个满口脏话的ChatGPT!相反,我觉得这个东西应该尽快商业化。随着大量用户反馈的积累,质量可能会快速提升,适用场景也会增加。但是,正如我们一开始分析的那样,从大规模的用户反馈中识别出高质量的语料库,并进行有监督的模型开发,真的是一个挑战!
当然,作为一个老码农,看到ChatGPT写出的程序,也让我为众多码农的未来捏一把汗。你好吗,有感冒吗?
作者:北冥程海生,公众号:计算广告(ID:Comp_Ad)
本文首发于人人产品经理。未经许可禁止转载
头图来自Unsplash,CC0协议下
本文观点仅代表作者本人,大家都是产品经理平台只提供数据存储服务