整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)
身处科技圈的各位,最近应该都被 ChatGPT “刷屏”了吧。
不仅国外微软、谷歌、Meta 等科技巨头争相布局,国内百度、科大讯飞、华为、阿里巴巴、360、京东等大厂也集体“上车”:百度官宣最快 3 月份发布国产版 ChatGPT“文心一言”,科大讯飞称有信心百天内实现应用落地……
结果万万没想到,国内各大厂准备地如火如荼,但谁也没抢到这个“首发”:2 月 20 日晚,复旦大学自然语言处理实验室发布了国内首个类 ChatGPT 模型 MOSS,并邀请公众参与内测(https://moss.fastnlp.top/#/)。
与 ChatGPT “类似”,但“落后”于 ChatGPT
从 MOSS 的项目主页来看,其定位是“一个类似 ChatGPT 的对话式语言模型”,能按照用户指示执行各种自然语言任务,包括回答问题、生成文本、总结文本和生成代码等等。
与 ChatGPT 一样,MOSS 的开发过程也包含了自然语言模型的基座训练和理解人类意图的对话能力训练两个阶段,但不同之处在于:
目前,MOSS 已拥有了一些 ChatGPT 的基本功能,复旦开发团队为此展示了几个与 MOSS 对话的示例:
不过,虽然MOSS 的基本功能与 ChatGPT 类似,但复旦开发团队坦言它仍有许多不足:
在这些限制当中,其团队指出,作为国产版 ChatGPT,MOSS 的最大短板是中文水平不够高:“MOSS 的英文回答水平比中文高,因为它的模型基座学习了 3000 多亿个英文单词,中文词语只学了约 300 亿个。”据了解,造成这个缺陷的主要原因是,互联网上中文网页上如广告等干扰信息很多,因此清洗难度很大。
“尽管 MOSS 已经获得了 ChatGPT 的一些能力,但我们知道还有许多限制。由于缺乏高质量的数据、计算资源和模型能力,MOSS 仍远远落后于 ChatGPT。”基于这些原因,开发团队呼吁公众积极参与 MOSS 的内测并提供反馈,以便他们进一步优化与改进。
团队回应:MOSS 非常不成熟,距离 ChatGPT 还有很长的路要走
“ChatGPT 火了两个月,可算有国产版能让我们尝尝鲜了!”作为国内首个类 ChatGPT 模型,MOSS 一经发布就引来不少网友关注,尤其是它又与最近热映的《流浪地球》系列电影中人工智能 550W 量子计算机的“MOSS”重名。
一时之间,不论是关注 ChatGPT 的技术人,还是《流浪地球》的粉丝,都对这个 MOSS 一拥而上——结果,由于瞬时访问压力过大,MOSS 服务器当晚就被挤崩了。
与此同时,网上不断出现对 MOSS 的负面评论,认为复旦大学自然语言处理实验室的这个行为,不仅蹭了 ChatGPT 的热度,还蹭了《流浪地球》的热度:“一定要叫这个名字吗?”,“名字倒是很会取,反正先占个坑,炒个热度”,“还没学会走路,就要‘抢跑’了。”
对于服务器的意外崩溃以及陆续增多的质疑,今日复旦 MOSS 开发团队在其官网发布了一则公告作为回应:
此外,复旦 MOSS 团队还表示,等到 MOSS 完成初步验证后,他们将开源 MOSS 的经验、代码和模型参数以供参考:“中国版 ChatGPT 的诞生还需要中国全体 AI 从业者的努力,也更需要不断和人交互以提高能力。”
不过,由 MOSS 暴露的这些短板以及引发的一系列争议,也令许多人再次意识到,国内想要研发出类 ChatGPT 的产品并不简单,而大公司更具优势:
那么,你是否看好 MOSS,又对它有何评价呢?
参考链接:
☞复旦发布类ChatGPT模型Moss;OpenAI回应ChatGPT不向中国用户开放;Linux 6.2 发布|极客头条
☞ 从 ClickHouse 到 Apache Doris,腾讯音乐内容库数据平台架构演进实践
☞ 大学生快上车!大学教授要求用 ChatGPT 写论文