去年11月上线的人工智能对话机器人ChatGPT,最近月活用户数突破1亿,成为业内和公众关注的科技明星。这个由美国企业OpenAI开发的人工智能系统,能够回答用户提出的各种问题,包括完成撰写研究报告、解答试题、写诗、写程序代码等各种文字符号类任务。
虽然大多数中国人尚未用过ChatGPT,但介绍它的中文文章已有很多。有些作者认为它是人工智能领域的革命性产品,将改变人们的学习和工作方式;也有些作者觉得它的能力有点言过其实,自动生成的报告、论文、诗歌等作品水平一般。
对此,复旦大学计算机科学技术学院教授、自然语言处理专家邱锡鹏认为,这个人工智能系统确实掀起了一场技术革命,生成的内容可谓瑕不掩瑜,非常看好它在教育、金融、数字人等诸多领域的应用前景。
语言模型参数量达到千亿级
邱锡鹏介绍,在大算力、大数据的支撑下,ChatGPT已基本完成大型语言模型从量变到质变的过程。这个语言模型的参数量高达1750亿,而在它问世前,世界上最大的语言模型是微软开发的Turing-NLG,其参数量为170亿。
“过去,自然语言处理存在一个瓶颈,就是数据量不够。”邱锡鹏说,为了突破这个瓶颈,OpenAI公司利用互联网上的海量文本,对人工智能神经网络模型进行大数据训练,让神经网络把海量文本都“背”下来。ChatGPT的“背诵”量超过45万亿字节,从而训练出参数量达到千亿级的大型语言模型基座。
基座形成后,研发团队要让它执行各种任务,以提高其回答人类各种问题的水平。为此,他们收集了至少几十万条人类指令,并让各行各业的人写出指令回复,再将这些内容输入大型语言模型基座,使ChatGPT在学习人类回复的过程中,逐步“理解”各种自然语言指令。
在这个大数据训练过程中,研发团队会不断地对大型语言模型进行修改,以提升其智能水平。在此后的产品开发和应用过程中,研发团队还会根据人类的反馈,对模型进行持续微调,使它越来越准确地解答用户给出的问题。
“ChatGPT的学习能力很强,它已通过互联网学到了截至2021年的知识信息,今后将持续学习,提高知识储备量和回答准确度。”邱锡鹏告诉记者。值得称道的是,它虽然看似“无所不知”,但拥有约束自己回答问题的能力。对于大多数违背伦理、政治敏感、金融预测等问题,这款机器人都会拒绝给出实质性解答。
ChatGPT中文作品引发热议
ChatGPT完成中文任务的水平如何?“ChatGPT中国应用社区”展示了它自动生成的多篇研究报告,其中一篇报告是《长江中下游城市群现代化战略规划2023—2050》。它的大纲包括介绍、2023—2050年现代化战略、核心行业布局、城市协调与合作、数字经济、结论6章,下设若干节,看上去有板有眼。
第一节“长江中下游城市集群概述”是这样写的:“长江中下游城市群是指中国长江中下游的一组城市。该地区包括湖北、湖南和江西省,是中国重要的经济枢纽,拥有强大的制造业基础和丰富的文化遗产。该地区连接紧密,交通网络发达,包括长江,长江在货物和服务运输中发挥着关键作用。该地区还以其自然美景而闻名,包括著名的三峡大坝,并具有进一步经济和文化发展的巨大潜力。”
对此,网民评论道:“各级秘书有福了,这玩意儿绝对是写八股材料的利器。”“干巴巴的文字和片儿汤话堆积。”“AI什么都有,但是缺灵魂。”
诗歌创作方面,有自媒体博主要求ChatGPT“原创一首赞美领导的诗”,它生成的诗歌引发了网民热议。这首诗的开头是这么写的:“领导是阳光般的人物,带领我们前进的舵手。智慧和勇气是他的品格,让我们的团队蒸蒸日上。”
将深度影响诸多行业和领域
虽然这个人工智能系统生成的文章和诗歌水平还不够高,但邱锡鹏觉得瑕不掩瑜,ChatGPT已掀起一场技术革命。“中美两国公众对ChatGPT的认知存在差距,因为很多中国人无法登录ChatGPT,没有感受到它给一些行业带来的冲击。”
以教育行业为例,美国已有90%左右的学生在做作业时使用这个人工智能系统,很多教师也在用。在“无所不知”的机器人帮助下,学生可以更好更准确地解题、写论文;教师输入若干知识点后,机器人会生成相应的题目。当然,使用过程中存在学生偷懒的问题,这是ChatGPT带来的负面效应。
除了对教育行业的深度影响,人工智能生成内容(AIGC)技术还有望影响社会治理、医疗、金融等诸多行业和领域。邱锡鹏认为,AIGC技术可以接入虚拟的数字人,让数字人具有角色功能。未来,它们将扮演多种角色,与人类进行比较自然、深入的交流,成为工作和生活秘书、老人陪护、儿童玩伴等多功能家庭机器人。“这将是人工智能对机器人和元宇宙领域的深度影响。”
因为有巨大的应用潜力,邱锡鹏建议国内政府部门和企业投入更多的资源,包括算力和人力,尽早开发出面向中文用户和其他语言用户的AIGC系统,将它们用于教育、家庭服务、社会治理等通用领域,同时开发出一批用于各个专业领域的AIGC系统。“百度今年3月将推出类似ChatGPT的产品,国内其他互联网大厂预计今年也会发布这类产品,让我们拭目以待。”