当前位置:首页|资讯|ChatGPT|Stable Diffusion|Midjourney

别再吹开源版ChatGPT了,中文版StableLM是 把人逼疯的人工智仗!

作者:灵秀巨匠计算机发布时间:2023-04-20

原标题:别再吹开源版ChatGPT了,中文版StableLM是 把人逼疯的人工智仗!

StableLM虽然是第一次听说,但是这家公司之前出过一款很不错的绘画Ai产品——Stable Diffusion。同样是一款开源Ai,是目前市面上唯一一个可以和Midjourney一较高下的主流绘画Ai,大家感兴趣的话后面也可以介绍一下。

自从ChatGPT出现以后,今年可谓是锣鼓喧天,百花齐放,大语言模型几个字在互联网随处可见。不管是国内的企业还是国外的公司,纷纷推出自己的大语言模型。就说国内,前有文心一言,后有通义千问,不久前商汤的大模型“商量”也发布了。

国外的公司也不遑多让,微软、谷歌、Meta......各式各样的互联网公司和Ai科技公司都在凑热闹。不管是大模型还是小模型,开源的还是不开源的,总之,如今的Ai大模型就如四五月的春笋,一夜之间就冒了尖。

今天的主角Stability.ai和OpenAi这样一直不愿意开源的公司不一样,这是一家乐于分享的公司,专注于大模型开源。绘画Ai成功后,团队最近又推出了这款名为StableLM的开源大语言模型。只是从训练参数来看,StableLM到底能不能担得起“大”模型三个字,还是个未知数。

Stability.ai称,相比于 GPT-3,StableLM最大的优势就是透明和可定制化啦。这意味着研究人员和开发者们可以自由地检查、使用和修改代码,并且根据自己的需求进行自主配置,打造专属你的大语言模型。

虽然它的参数大小只有30 亿和 70 亿,和GPT-3 的1750 亿参数没法比。但是它是基于一个比 The Pile 数据集还要大三倍的扩展数据集训练出来的,所以在编码和自然语言对话方面表现十分不错。

而且,The Pile 数据集本身就包含了大量书籍、Github 知识库、网页以及跨学科论文等等多种类型的数据。为通用大语言模型、跨领域文本生成训练提供了很好的基准。所以说,在实际应用中,StableLM 与 GPT-3 的性能差距并没有纸面上那么大!

不错,StableLM 与其他大模型相比最大的特点就是,开源后的StableLM 可以让用户自主训练,修改,生成属于你自己的大模型。这对各大中小企业来说也许是个好消息,对于普通人影响不大,就算是开源了,普通人也没那个硬件设备进行大模型训练。

唯一比较糟糕的是这款大语言模型其实并没有要和中国客户玩的意思,因为它的中文实在是太糟糕了!

接下来就给大家展示一下StableLM的中文水平。

首先,第一个问题,你会说中文吗?

StableLM回答:中文。

这,这,还挺幽默。

第二个问题:先用中文问了一遍,天空为什么是蓝色?

StableLM回答:天空是一个生物,蓝色是叶绿之类的缘点。遗憾的地点在天空中会生成一些蓝色生素。

很好,很抽象,开阔视野,增长见识,天空为什么不能是一种生物呢?

接下来又用撇脚的英文问了一遍

它的回答是:The sky is blue because the sunlight is scattered in all directions by the atmosphere. When you look up atthe sky, you are looking at the scattered sunlight. The scattering of sunlight produces different colors, depending on the amount of scattering. Blue is the brightest and most abundant, followed by purple, orange, yellow, green, and gray.

看着像是正确答案,又让它翻译成中文。

结果StableLM翻译出来是:天空是天地作为一种生物的可scattering的平行星球,蓝色为权尽的生素。当你看上天空时,你看到被scattered光分子生成的蓝色生素,即深度的光芒。根据透明度,天空中生成的生素分别是紫色、黄色、鲜蓝、萍、静烂、花茶、辣植等。

为了证明不是所有的Ai都这么离谱,立刻将这段英文复制粘贴发给了ChatGPT,这下终于看到正常的文字排列了。

ChatGPT翻译出来的结果是:天空之所以是蓝色的,是因为大气层将阳光散射到各个方向。当你抬头看天空时,实际上是在看散射的阳光。阳光的散射会产生不同的颜色,这取决于散射的程度。蓝色是最亮和最常见的颜色,其次是紫色、橙色、黄色、绿色和灰色。

这样一对比就会发现,StableLM只是在中文语境中表现比较糟糕,在它熟悉的英文语境里还是正常的。

在对StableLM的中文水平绝望以后,换了一种思路,也许它对数字的理解能力更强,于是,发送了一个1+1=?

StableLM仍旧在胡说八道......

StableLM和ChatGPT之间的差距或许也就差了几个目光清澈且愚蠢的大学生吧,当然,StableLM未来的路还很长。

Stability.ai也称未来会不断增加参数对其进行训练,所以不要小看任何一个发育不健全的Ai,也许某天它就会再次惊艳亮相,成为高攀不起的存在。更何况StableLM也在持续优化中。StableLM仅用10个小时github已突破3000颗星,说明这仍旧是一款潜力无限的产品。

在人工智能发展的道路上,每一款自主研发的产品都值得鼓励。也许它们不会留到最后,但在人类科技文明发展历程中,总会留下点什么。

哪怕只是几百年后,残留在互联网上的一串数字......

这串数字也会告诉未来的人,在人工智能不断发展的路上,有如此多的先驱者,他们是站在先驱者的脊梁上,一代代发展,迭代,而这正是科技得以进步的原因。

开源地址:

https://github.com/stability-AI/stableLM/

测试地址:

https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1