近日,美国人工智能研究公司OpenAI推出的聊天机器人ChatGPT火爆全网。它能通过学习和理解人类语言进行自然语言对话,跟人类聊天时遇到敏感问题会“打太极”,还能替打工人生成颇具幽默感的辞职信……
可以说,ChatGPT打开了自然语言处理技术商业化落地且成为消费端爆款的大门,具有划时代的意义。中国目前还没有可媲美的类似应用,会在本轮AI竞争中因慢一步而落于人后吗?不必过虑!
AI发展的三大要素是数据、算法、算力,中国在这三方面都有良好基础。
AI的进步迭代需大量数据进行学习训练,ChatGPT也不例外。ChatGPT的训练使用了约45TB数据,其中包含多达近1万亿个单词的文本内容。从大数据资源看,中国拥有全世界最大规模的网民数量,有丰富的应用场景,在数据积累方面优势明显。
在算法方面,ChatGPT的技术底座是大型语言模型。GPT属于自然语言处理NLP的范畴,本质上仍是以深度学习为代表的人工智能技术长期发展和积累的结果,并未出现算法的革命性突破,发布于2020年的GPT-3是有1750亿个参数的大模型,ChatGPT正是基于它的改进版本创建的。国内也有NLP领域的大模型,并有智能客服、作诗机等实际应用。虽然目前全球还没有能跟ChatGPT惊艳表现相抗衡的大模型,但是业界共识是差距在两年左右。两年的差距并非鸿沟,有赶超可能。
AI的训练和使用需要强大的算力,算力的基础是芯片,有人担心中国在这方面会吃亏。实际上,芯片水平并不等同于算力水平,算力还需要广阔的应用场景支撑,需要具备对千万个芯片进行规模化调度运行的能力。《2021—2022全球计算力指数评估报告》显示,美国计算力指数得分为77分,中国为70分,分列世界前两位,中国算力水平与美国处于同一等级,差距并不大。
对于中国企业来说,ChatGPT的优点值得学习,它的不足也正是我们参与竞争的机遇。
学习它提高AI智商的新路径。ChatGPT的聪明表现,源自让AI从人类反馈中进行强化学习。在训练过程中,人类训练者扮演着用户和助手的角色,这比过去AI大模型的“深度学习+人工标注”模式省时省力、效果更好。
在它表现欠佳的中文领域错位竞争。ChatGPT的英文水平明显高于中文水平,这是它在训练阶段被“喂”了更多英文素材的必然结果,也可以成为中国版ChatGPT应用的竞争切入点。
从它被诟病的伦理挑战中寻得商机。ChatGPT会一本正经地胡说八道,生成错误信息的能力远超人类。它还会被人类不当使用,比如学生拿它写作业,黑客拿它写代码用于网络攻击,诈骗犯拿它开设“杀猪盘”。防范治理这些风险,一方面需要完善相关伦理法规,另一方面也应考虑到人类处理信息的速度远逊于AI的事实,开发自动判别并警示AI生成有害信息的技术。届时,反ChatGPT技术也将成为新商机。
中国版ChatGPT并不遥远,已有百度等多家公司宣布将进入此赛道。面对ChatGPT这个新晋AI网红,我们应清醒分析其优势和不足,学优补劣。
来源:经济日报