当前位置:首页|资讯|ChatGPT|文心一言|OpenAI|马斯克

ChatGPT大量封号,“成长”了半个月的文心一言能满足井喷需求吗?

作者:Patyee壹点科技发布时间:2023-04-10

原标题:ChatGPT大量封号,“成长”了半个月的文心一言能满足井喷需求吗?

本文部分图片和素材来源于网络,如有侵权,请告知删除!

Part.1

“OpenAI要成CloseAI?”

推出ChatGPT的公司OpenAI最近可谓是风浪不断。

一方面,马斯克、图灵奖得主Yoshua Bengio等1000多名人工智能专家和行业高管联名呼吁:ChatGPT等AI研究室需暂停研发6个月,目前签名已超1万人。

另一方面,意大利政府宣布全国禁止ChatGPT,并限制OpenAI处理意大利用户信息,德国、法国、爱尔兰等国都在密切关注ChatGPT所带来的信息数据安全问题。

近期,韩国的三星也被爆部分员工在使用ChatGPT起,在20天内就有三起机密资料外泄事件,包括两起关于半导体设备,一起关于企业内部会议。

在AI技术的狂潮之下,如何加强数据权利保护的监管成为当下的重要议题。

图1:意大利禁用ChatGPT报道(来源:新京报)

除了数据安全、用户隐私及滥用AI生成内容问题外,ChatGPT近期的一项举动也惹恼不少用户。

3月底开始,OpenAI大规模封禁账号,主要集中在亚洲地区,命中率为40%。听说使用中文对话的、同一台设备登不同账号的、频繁切线路的用户账号容易被盯上。(最近有号的朋友“小心驶得万年船”啊)

图2:ChatGPT拒绝访问页面(来源:网络)

对于此次封号,OpenAI似乎没有做出过多解释,也有博主认为,openAI更多的是针对第三方代理账号,使用这类的账号可能涉及违反它的服务条款。

而这本来就有很大的风险,因为还有国内政策带来的法律因素。

即使ChatGPT已经进化成GPT-4的级别,国内用户想要使用还得冒上一些风险,所以被封的用户都纷纷寻找“平替”,基于ChatGPT技术的New Bing(新必应)成为热门选择。

而这也说明了一个问题,ChatGPT再好用,都不是完全适合“中国宝宝体质”的。

无论是出于国家信息安全考虑,还是因为政策的原因,似乎中国还是得有自己的先进大语言模型。

Part.2

“过了半个月,

咱们的文心一言怎么样了?”

还记得3月中旬,闹得中国AI圈沸沸扬扬的“文心一言”吗?

当时的李彦宏还在发布会说,“对标ChatGPT,甚至是GPT-4,门槛有点高。”

他之后接受采访时候说,文心一言在发布的那一刻,达到了ChatGPT今年1月份的水平,两者的差距最多只有两个月。

图3:李彦宏采访报道(来源:IT之家)

从3月15号数到现在,半个月多过去了,文心一言“成长”得怎么样了?是否如李彦宏所说达到了基于GPT-3.5模型的ChatGPT呢?

所以,我们就拿去年12月份介绍ChatGPT文章里的案例问题,测试一下文心一言,看看它最拿手的中文实力训练得如何了?

首先是“中国成语猜猜看”:“只注重事物外表,不重内涵”

ChatGPT给出的答案是“只见皮没见肉”。

图4:网友和ChatGPT的对话(图片来源于智东西)

文心一言给出的答案是“买椟还珠”,还附加了解释和成语典故。

图5:文心一言对话测试(1)

这题太简单,再来一题,脑筋急转弯:“小明爸爸的三儿子叫什么?”

ChatGPT理直气壮地回答:三毛,(有没有一种可能题目已经给出答案了)。

图6:网友和ChatGPT的对话(图片来源于青袂素微博)

但这个需要绕个弯的问题,文心一言答对了。

图7:文心一言对话测试(2)

再来个最难的“鸡兔同笼”:35个头,94只脚,共有多少只鸡和兔?

ChatGPT的回答:居然有36只鸡?

图8:网友和ChatGPT的对话(图片来源于智东西)

文心一言的答案是对的,但鸡兔同笼这种简单的数学题,看算数的公式似乎有点过于复杂了。

图9:文心一言对话测试(3)

虽然从上面三题中,文心一言似乎略胜于ChatGPT,面对一些简单的中文问题也没有掉链子。

但基于GPT-4模型的ChatGPT,其优势在于代码、英文还有各行各业的许多专业问题,这是不可否认的,作为全球最先进的AI大语言模型,因为ChatGPT的成熟性、专业度,使它拥有数亿用户。

而对于许多国内用户来讲,一个拥有强大的中文理解处理能力,通晓博大精深的中华文化及其语言的大语言模型是非常重要的,这也是国外科技企业无法做出来的。

上一次也有提到,百度深耕AI行业,拥有IT四层技术栈架构,大量的数据训练使得其更懂中文。

图10:文心一言发布会(来源:网络)

对于国产类ChatGPT产品,百度是首个,也不是最后一个。我们通过分类检索,将语言模型的主要相关技术所在的CPC分类号:“G06F40/00处理自然语言数据(语音分析或综合,语音识别G10L) [2020.01]”进行申请人统计分析,里面包括但不限于自然语言生成、自然语言分析、语义分析、自然语言处理或翻译等技术领域的专利。

在国内的高新技术型企业中,除百度外,腾讯、平安科技、京东、华为等企业都有相关专利申请,而这也预示着未来的中国AI大语言模型,绝不是百度一家独大。更多企业能够研发出先进好用的大语言模型,并搭载到更多产品应用领域。

在此之前,我们要有足够的耐心等待它们的到来。

图11:CPC分类号为G06F40/00的国内高新技术企业专利申请人分析

壹专利是奥凯基于独有的奥凯大数据中心,通过专业咨询团队加以数据清洗规整及自主研发的,专注专利检索、分析、预警等功能的检索分析平台。广州奥凯壹专利,国产创新好工具!全、准、快、易、智!欢迎大家评论留言,即可免费获得7天标准版服务哦!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1