出品 | 搜狐智库
编辑 | 钟昕格
近日,对话式大型语言模型ChatGPT在各大中外媒体平台上迅速火爆。短短4天时间,其用户量到达百万级,注册用户之多导致服务器一度爆满。
ChatGPT是美国人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具,拥有语言理解和文本生成能力,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流。
ChatGPT为何会如此火爆?它的神奇之处在哪里?ChatGPT未来发展可能的局限性是什么?搜狐创新产品中心总监王旭与其部门同事从技术角度对ChatGPT进行了分析。
搜狐智库:为什么ChatGPT会如此火爆?从技术角度,ChatGPT的神奇之处是在哪?
王旭:ChatGPT是一个语言生成模型,这次爆火的原因在于其语言生成能力达到了一定高度,整个语言生成能力非常流畅。
原来不管是软件、硬件、互联网,其本身就是工具,如果不预置内容的话,是无法与它进行交流的。例如搜索引擎,不管是谷歌还是百度,人们需要告诉机器想查找的信息,搜索引擎在已处理的所有网上信息进行快速查找。
ChatGPT相当于人第一次和电脑进行沟通交流,它可以产生除了预置之外的相关内容。它的生成方式和人学说话的方式非常类似,ChatGPT看似复杂且高级,但其原理只有一条,就是如何把若干个词变成一句话,例如说天的时候,后面应该跟什么字,它就解决了这一件事。
搜狐智库:ChatGPT在技术层面有没有局限性?
王旭:有,而且是用现在技术难以解决的,ChatGPT虽然沟通很流畅,但是它实际上并不理解你的逻辑。
ChatGPT的本质是对整个语言做建模,但是问题在于,它实际上并不理解人为什么要这样说,我们可能会理解其中的语法、词的含义以及上下文的语境,但ChatGPT不是,它的观测方式就是做统计。
ChatGPT没有任何思维,它甚至都不是一个聊天工具。因为如果作为聊天工具,在问它信息的时候,这些信息至少是准确的,但对ChatGPT来说不是,它的整个模型就是输入进去之后,按照概率判断接下来应该回答什么,ChatGPT只是在建模合理的范围内回答一个答案,但这个答案并不一定是准确的。
你会发现它说话特别通顺,但是这恰巧是它的原理性的东西,它必然会通顺,它就是为了解决通顺这件事。
ChatGPT知道什么话后面应该接什么,但它反而在事实性方面会偏弱一些。
ChatGPT的主要缺陷就是事实性方面偏弱,它基于其原理能够根据你说的话去接话,但实际上它对于话里的事实性内容,是无法保证的。例如问它今天几号,它可能会随便说一个日期,因为它没有从外部去查询信息,没有求证信息的能力。
所以未来不可避免地可能还需要接入一些与规则相关的判断,但只要接入与规则相关的判断,就又会变回模式化的产品,被规则所框定。
但我们在看到新鲜事物时,需要用发展的眼光去看,就像语言对于人类来说,ChatGPT的发展是有突破性意义的。
搜狐智库:这类AI产品,国内的研发进度如何?国内是否已经具备复刻ChatGPT的条件?
王旭:从原理上讲,复刻ChatGPT并不难,但是所产生的效果并不可控,因为基于深度模型技术,无法保证最终结果,只能不断尝试。
在深度学习领域做训练、做拟合的时候,不是一次出一个模型,而是一次出几百个模型,每个模型最开始的数值变量都不一样,在里面挑好的,所以在训练的时候,并不知道这个模型是否能够训练出来。
但是OpenAI这次证明了在算力变大、基础数据变大的时候,这一技术是有线性增长的,其效果随着投入资源变多,效果肯定会越来越好。
搜狐智库:我国有追赶OpenAI的可能性吗?
王旭:从产品效果来说,要做到ChatGPT那种程度,肯定是可以的,但是要看ChatGPT的最大意义是什么,如果觉得它在大语言模型上具有突破性意义,那后面再去追赶,意义并不大,因为你并不是第一个研发出来的。
ChatGPT更偏向学术上的证明,不太存在技术难点,更多是偏工程的问题,如果愿意花资金、花时间,追赶OpenAI并没什么问题。
搜狐智库:未来ChatGPT等AI产品会代替人类思考吗?
王旭:ChatGPT无法替代人类完成思维性的工作,无法决定人类要干什么,所以并不会代替人类思考,只能说会带来一些灵感上的启发,例如写篇文章、提供一些词藻,但它依然是一个效率上的工具。对于ChatGPT,既不要高估它,也不要低估它,要在社会上尽快形成正确的共识。