最近,一款名为ChatGPT的聊天机器人爆红了。它是由OpenAI开发的,是一款基于自然语言处理技术的聊天机器人。
ChatGPT的主要功能是能够进行自然语言的交互,就像人类一样,它可以回答问题,并且能够与用户进行智能对话。它的交互能力非常强,可以自动识别用户的意图,并且能够以自然的语言进行回答。据OpenAI公司的介绍,它可以“通过对话的方式交流,可以连续回答问题,承认自己的错误,挑战不正确的前提,以及拒绝不合理的要求”。
ChatGPT已经成为了最受欢迎的聊天机器人之一,只需要注册一个OpenAI的账号,就可以免费和这个模型交互对话,简单方便。短短5天内,就吸引了100万网友,从硅谷的精英到中国的程序员,从加尔各答的印度外包到欧洲核子研究中心的科学家,都在反复挑战这个模型的极限,也发现了很多让人意想不到的结果。
如果你是一个前端开发,收到这个PRD,发愁怎么写代码,那么一问ChatGPT,它也如你所愿的把代码一并奉上:
AI人工智能
人工智能写的代码
这时候服务端同学也收到PRD,外事不决问ChatGPT,那么神奇的事情发生了:
chatGPT写的代码
chatGPT写代码
如果你仔细看我上面的对话可以发现,我质疑ChatGPT给出的代码存在问题,它很快承认并给出修复方案。而且如果你再仔细查看我的对话记录,我还会继续质疑修复方案,让他给出性能更优的方案,而它也如我所愿,最终给出了我想要的答案。这些代码和方案完全是一个合格的Go程序员能给出的最好答案。
ChatGPT的强大不仅体现在写方案和代码上,他还能帮你润色文本,优化代码,写故事,心理辅导,都能回答的有模有样,让大家爱不释手,玩的上瘾,欲罢不能。也难怪上线几天内就成为一个“现象级”的大事件了。
那么ChatGPT是不是一个根本性的科研或者工程突破,实现真正质的飞跃呢?是,也不是。“是”的方面,ChatGPT真正第一次将大规模预训练模型结合有人类参与的强化学习模型,展现了近年来大模型AI技术的强大能力,能够让人们实实在在感受到惊艳“出圈”。“不是”的方面,ChatGPT本质上还是建立巨人肩膀上的进一步创新,这个巨人就是预训练大模型GPT-3。但和2017年提出的Transformer模型,2022年爆火的图像生成Diffusion模型家族相比,还并没有革命性的突破。因此,我们在看待ChatGPT的角度上,不仅要看到质变,也要看到之前无数的量变。
但我想重点说明的是,ChatGPT模型效果的成功,离不开三大基石:
从ChatGPT的原理我们可以看出,海量数据通过Transformer算法预训练大模型,加上高质量数据集微调,再叠加强化学习和人类反馈,已成为新的机器学习范式。成本方面,按照OpenAI工程师的反馈,每次调用成本需要几美分,训练在微软Azure AI平台完成。
随着深度学习大参数模型技术的不断发展,AI领域呈现出百花齐放的进化趋势,有说法是,OpenAI公司的下一代大型预训练语言模型GPT-4,参数量级会达到恐怖的100兆级别,也有人说只是在2800亿左右。要知道,人的大脑的神经元数量也只是1000亿,神经连接数量才只有数兆级别。
那是否可以认为,ChatGPT目前已经可以代替很多职业了呢?结论也没有这样乐观。比如刚才上面给的设计世界杯频道的例子,大家一眼也能看出,这些PRD和样例代码离设计一个真正的世界杯频道产品,写出前后端代码还相距甚远。目前还没到能取代广大产品经理和程序员职业的地步。