封面新闻记者 易弋力
4月10日,封面新闻记者获悉,由昆仑万维和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——「天工」3.5发布在即,并将于4月17日启动邀请测试。
为什么说「天工」是第一个真正实现智能涌现的GPT类大模型呢?
据昆仑万维官方微信介绍,“”涌现现象是指一个相对简单的系统中产生出了复杂的行为或特性。在AI领域,涌现能力也标志着人工智能是否已具备高度的自主学习能力,以及是否有可能完成逻辑推理等复杂的任务。最近有不少网友吐槽友商模型在回答一个经典问题“小王的爸爸有两个儿子,老大叫大毛,老二叫什么?”时,根据问题措辞和标点符号的不同,竟然会生成多个不同的答案。为什么会这样呢?我们可以推断,友商模型的逻辑推理是靠定向优化来覆盖特定题库,而不是靠大模型的智能涌现来解答较为复杂的问题。而靠人工打补丁、定向优化的方式是不能真正实现人工智能的。所以我们还要骄傲地宣布第二件事:「天工」大模型已经非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型,所以我们把这个版本命名为「天工」3.5。
2023 年无疑是人工智能的“爆发年”,各种基于 AI 的新技术如雨后春笋般拔地而出,其中 AI 大模型成为了全球科技公司的“角逐场”。百度、阿里、华为、京东、科大讯飞等国内科技企业纷纷入局。
简单来说,AI 大模型就是基于 AI 的 Foundation Model(基础模型),这是一种在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型。AI 大模型兼具“大规模”和“预训练”两种属性,面向实际任务建模前需要在海量通用数据上进行预先训练,这样才能大幅提升 AI 的通用性和泛化性。
今年一季度,基于深度学习的大型语言模型ChatGPT迅速爆红,全球用户数强势破亿,成为史上用户增长最快的消费级应用程序。风靡世界的ChatGPT还引发了全球新一轮AI技术迭代浪潮,它与传统“对话机器人”相比读懂人类意图再作答,背后融合了机器学习、神经网络和Transformer模型等多种技术模型。ChatGPT是在GPT3基础上进一步开发的NLP大模型,参数规模由“千亿级”迈入了“万亿级”。
想要实现从大模型到“ChatGPT”的进阶,我国的“底子”也不差,多个国内企业研发出了基于文本或多模态的预训练基础大模型。但要打造一个类ChatGPT大模型还是任重而道远。在数据方面,需要保障用户隐私安全,符合各国法律法规和政策;在算力方面,需要大规模计算集群和对应模型并行算法框架的支撑;在工程实现方面,需要将大模型部署在线上云端,以供大规模用户快速地、经济化地使用。