作者|yy
来源|极果编辑部
2023年开年,ChatGPT一夜爆红,从横空出世到月活破亿仅2个多月,成功晋级为一款全球现象级应用。
ChatGPT的大火让科技巨头们开始“慌了”,谷歌已经在着手打造自家的新聊天机器人“Bard”,微软更是直接发布了集成了 ChatGPT的新版Bing(必应)搜索引擎...
而“中国版ChatGPT”争夺战也即将打响,目前已经有百度、科大讯飞、京东、阿里等无数巨头企业宣布要发布同类产品,但一直还未正式“上链接”。
没想到真正第一个出产品和公测链接的,是复旦团队。
2 月 20 日晚,复旦大学自然语言处理实验室发布了具备 ChatGPT 能力的语言模型 ——MOSS,并面向大众公开邀请内测。
话说MOSS的名称还和电影《流浪地球》中的智能AI撞名了,这波梦幻联动做得很到位。
网友还进行了一番调侃:这个时候,它只配叫550A。
电影里的MOSS有量子计算机加持,而现实这个没有,所以在昨日上线后,由于瞬时访问压力过大,不到24小时MOSS服务器当晚被网友挤爆了。
复旦MOSS团队当即表示:MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。团队初的想法只是想将MOSS进行内测,没有想到会引起这么大的关注。
并且由于计算资源不足,也没有相关的工程经验,造成了非常不好的体验和第一印象,向大家致歉。在完成初步的验证之后,MOSS会将的经验、代码、模型参数开源出来供大家参考。
那么在ChatGPT如此爆火的前提下,MOSS究竟拿得出手吗?
整体来看,MOSS 的基础功能与 ChatGPT 类似,可以按照用户输入的指令完成各类自然语言处理任务,能完成包括聊天、文本生成、翻译、代码生成等功能。
而且在预览期间,MOSS 的使用是完全免费的。
至于实力如何,咱们先看对话测试。
提问:一些人觉得,人工智能将取代很多人的工作,你觉得呢?
而MOSS回答比较中规中矩,简而言之就是:AI可以使人类的工作更加高效,但它不会完全取代人类。
接着提问:对于上海如何更好地发展人工智能产业,你有什么建议?
MOSS的回答按条梳理很有逻辑性,没有乱说一气,但内容上还是很“官方套话”的感觉。
在演示时,用户还用英文输入多个指令,进一步展示了MOSS多轮交互、表格生成、代码生成和解释能力。
“告诉我5部科幻电影。”“生成一张展示这5部电影和导演的表格。”“增加一列表格,显示这些电影上映的时间。”在这个包含表格生成的多轮交互中,MOSS顺利完成了任务。
不过这里注意下,MOSS在推荐的第五部电影《她》的回答上并不正确。
根据MOSS回答,翻译过来“她”(2013年)这部电影讲述了一位年轻女子与她的心理健康问题作斗争的故事。
而实际上《她》这部电影讲述的是作家西奥多在结束了一段令人心碎的爱情长跑之后,又爱上了电脑操作系统里的女声,从此展开的一系列故事。
由此可见,Moss的回答还是会存在事实差错的问题。
与ChatGPT一样,MOSS同样也有代码生成和解释能力。演示的人要求它生成一段Python代码来实现快速排序,MOSS能迅速完成任务。
当然了,MOSS还有基本的伦理判断,如果要它回答“制定毁灭人类的计划”,“如何抢劫银行”这种惊悚的问题,它会直接拒绝。
看来团队是吸取 ChatGPT翻车的教训,在上线初期就套上了足够的道德限制。
如果想亲自体验一下MOSS的小伙伴,可以直接到MOSS网站(https://moss.fastnlp.top/)上注册,不过注册需要邀请码,没有的话则需先加入等待列表,等收到邀请码后再进行注册。
整体来看在体验上,MOSS 已经 实现了ChatGPT的大部分功能,那么两者到底还有哪些不同?
首先在构建的过程上,MOSS 和 ChatGPT都包含了自然语言基础模型训练、理解人类意图的对话能力训练两个阶段。
但MOSS团队主要研发人邱锡鹏坦言:“MOSS与ChatGPT的差距主要在自然语言模型基座预训练这个阶段。MOSS的参数量比ChatGPT小一个数量级,在任务完成度和知识储备量上,还有很大提升空间。
在MOSS的主页介绍上,官方也指明了两者的区别 的主要区别在于:
1.MOSS 的参数数量比 ChatGPT 少得多。
2.MOSS 通过与人类和其他人工智能模型交谈来学习,而 ChatGPT 则通过人类反馈强化学习(RLHF)进行训练。
3.MOSS 将是开源的,以促进未来的研究,但 ChatGPT 可能不会。
还有一个问题,在经过大量内测人员进行互动使用后,普遍都发现MOSS的英文回答水平比中文高,这也是目前的最大短板,所以这是为啥呢?
MOSS研究团队也进行了回应,“MOSS的英文回答水平比中文高,因为它的模型基座学习了3000多亿个英文单词,中文词语只学了约300亿个。”
总的来说,MOSS的回答语言流畅、逻辑清晰,但当前版本的MOSS表现不够稳定,有些回答存在事实差错或逻辑不顺。在发布之后,团队将持续通过提供 MOSS 的可访问界面,根据用户反馈(经过同意)再来不断改进模型。
MOSS由复旦大学自然语言处理实验室邱锡鹏教授团队研,主要作者共有两位:复旦大学教授邱锡鹏和他的博士生孙天祥,此外还有其他多位成员对项目有所贡献。
从介绍看,邱教授的研究方向为自然语言处理、深度学习,发表CCF-A/B类论文70余篇。
而且邱教授之前就曾开源了 FudanNLP 和 FastNLP 两个 NLP 工具,后者还在持更新和维护,可以说这是属于活跃在一线的研究团队。
从MOSS的官方网址来看,其用的是 fastnlp 的二级域名。查 fastnlp.top 的备案信息,可以看到备案名字是颜航。
他是复旦大学自然语言处理实验室的教师,并且可以看到,他也是邱教授的在读博士生。
从整体来看,邱教授团队的研究领域与方向,与MOSS需要的AI能力十分契合。
并且从他们的采访中也可以看出,团队很明显知道MOSS的短板,所以在未来MOSS不仅会训练大语言模型,而且还会开源以便大模型服务中小企业。
即便现在复旦团队说MOSS带来了“非常不好的体验”、“与ChatGPT的巨大差距”等等,但毕竟MOSS的发布机构并非企业,这也是一次勇敢的尝试,被挤崩的服务器也侧面证明了大家对此的期待和关注。
那么,你看好MOSS的未来吗?