大型语言模型向人们展示了一条通向通用人工智能的崭新路径。复旦大学MOSS语言模型开发者、自然语言处理实验室邱锡鹏教授近日在发表在大学公众号上的一篇深度访谈中预测,未来5到10年,人们会像现在接受搜索引擎一样,接受通用人工智能。
长期以来,巨头公司都在致力于打造通用型人工智能(AGI),ChatGPT如此强大的语言模型让技术人员看到了希望。所谓AGI,是指人工智能可以理解或学习人类能完成的任何智力任务的能力。
邱锡鹏表示:“中国要想站在大型语言模型或者将来的通用人工智能等技术的最前沿,就必须要建设自己的语言模型基座。”
他表示,MOSS的定位是自然语言处理领域乃至是通用人工智能领域最前沿的探索。“也许工业界更看重它的落地性能,而我们更看重它的下一代发展,即如何实现通用人工智能。”邱锡鹏表示。
据介绍,复旦MOSS开发近百人的团队中,大型语言模型基座研究相关的学生超过30人。
业内普遍相信,AGI能够解决世界上面临的最难的问题,将会成为AI史上最重要的技术发展,有可能重塑人类发展的轨迹。
早在2019年,微软和OpenAI在合作之初就曾表示,双方的目标是让通用人工智能与人合作,共同解决目前棘手的跨领域、跨专业的问题,包括气候变化、个人健康、以及教育等全球的挑战。
OpenAI首席执行官山姆·阿尔特曼(Sam Altman)日前在《福布斯》杂志的采访中谈及公司是否已经接近实现通用人工智能的问题时表示否认,但他称“朝着AGI的方向发展是驱动OpenAI所有行动的推动力”。
阿尔特曼说道:“我不认为我们已经快要实现AGI了。我最近一直在思考我们如何知道AGI会何时实现的问题。在过去五年多里,我对AGI的认知是它不会一蹴而就,将是一个渐进的过程,或者说是缓慢起飞,但我几乎所有的行动背后都是受它驱动。”
邱锡鹏认为,国外开发者不太可能以中文为主去发展他们的模型,中国要想开发一个大型语言模型的基座,用于国内的信息处理,就必须建设一个中文能力非常强的大型语言模型。
尽管MOSS在参数规模上和ChatGPT相比小一个量级,但邱锡鹏表示,开发MOSS模型,是想在百亿规模参数上探索和验证ChatGPT的技术路线,以证明中国团队在技术实现上并不落后于国外。“我们想证明,在有限的资源下,也能做出类ChatGPT模型。”他说道。
与ChatGPT相比,MOSS除了参数较小之外,迭代能力也有所不同。在邱锡鹏看来,用户量越大,交互数据越多,模型的迭代能力就越强。ChatGPT作为新一轮人工智能赛跑的领跑者,已经基于模型和大量数据实现了“飞轮效应”,拉开了与其他大模型在事实类知识储备上的差距。
不过他强调,人们在关注大型语言模型的时候,更应该看重它的理解能力、学习能力以及思维能力,而不是看重它的事实类知识储备。“如果从逻辑类能力来看,我觉得MOSS的表现其实还不错。”邱锡鹏表示。
在他看来,规模较小的模型也可以找到特定的应用场景,例如可以在企业内部私有部署,经过一些数据微调就可以转化为生产力。
在构建MOSS的数据语料方面,邱锡鹏表示,团队已经开始自己构造一些高质量的中文数据,但仍需要时间。此外,MOSS还会开放接口并实现开源,把研究成果无偿地分享给学术界,在合法合规的前提下把研究成果开放给业界。