网传Gemini用文心一言训练？可能谷歌也是受害者！

作者：镁客网发布时间：2023-12-19

文心一言谷歌

AI可以污染互联网，也能被互联网污染。

热闹的AI圈，今天又传出一个大瓜：谷歌Gemini的中文回答自曝自己是文心一言？

据科技媒体量子位报道，有网友爆料：在谷歌Vertex AI平台使用该模型进行中文对话时，Gemini-Pro直接表示自己是百度语言大模型。

图源 | 量子位

紧接着，微博大V@阑夕发布微博表示，在AI聚合网站Poe上进行测试时，Gemini模型同样在多次问答里把自己当成了文心一言。

为了验证，量子位分别在Peo、Bard以及谷歌AI Studio都进行了三轮测试。

最后证明：Gemini-Pro确实在中文的训练数据上使用了百度文心。

但当事情曝光之后，我们又挖掘到一些有趣的信息。

AI犯错后，谷歌紧急修复？

在阑夕以及量子位的测试里，都提到了Poe这个AI聚合网站。

这是一个由知名问答平台Quora推出的AI聊天机器人应用。

虽然名头不小，但实际上这只是一个聚合了多种主流的AI模型的网站，包含了GPT、Claude、PaLM等大厂模型，包括此次的Gemini-Pro，都能在该网站上进行免费体验。

当笔者在Poe上对Gemini-Pro进行提问后，大模型给出的答案其实并没有提到任何与文心一言相关的内容。

紧接着，笔者加上了“文心一言”的关键词进行追问后，Gemini-Pro依然否认自己与文心一言的关系。

可见，即使是“钓鱼式提问”，Gemini-Pro还是努力在避免不上当。

不过在回答里，Gemini-Pro提到了文心一言的底层模型是谷歌的Transformer模型。

而文心一言的官方表述是：百度飞桨开源深度学习平台中的基础模型库。

既然Poe的回答很正常，那么谷歌官方平台是否修复了呢？

在谷歌AI Studio里，笔者同样围绕“文心一言”关键词提了几个问题。

与量子位测试的结果进行对比来看，Gemini大模型否认了自己使用文心一言来训练中文模型。

但在答案里，Gemini提到了不少中文训练集的数据来源，并提到自己可以从ERNIE、阿里巴巴达摩院M6以及腾讯优图实验室GLM等中文语言模型中进行预训练。

由此可见，在曝光数小时后，谷歌技术人员紧急修复了这个“bug”。

不只是文心一言？

虽然按照正常流程没有钓鱼成功，但笔者还是挖到了一个彩蛋：

在Poe网站上新建一次对话后，Gemini-Pro竟然把自己介绍成“小爱同学”，回答也是非常离谱。

而在多次反问“你不是Gemini-Pro吗”后，Gemini-Pro再次给出了离谱的答案。

虽然不清楚是不是网站接口出现了问题，但可以肯定的是，目前的AI聊天机器人并没有想象地那么神奇，免费的AI聚合网站更是“图一乐”。

实际上被互联网污染了？

这不是谷歌Gemini第一次“闯祸”。

在该模型刚发布当天，就有人质疑演示视频的真实性。

结果，谷歌官方真就承认了Gemini演示视频是经特殊剪辑处理，非实时画面，但否认视频系“造假”。

事实上，为了避免现场演示翻车，绝大多数科技公司都会稍微对演示视频进行调整，这非常普遍。

但为了与GPT-4进行对比，从而进行夸大剪辑，只能说谷歌的营销手段还是“翻车”了。

而在今天爆出的“文心一言训练中文语言模型”这件事上，我们同样可以看出谷歌Gemini其实并不是有意。

对于中文数据来说，百度确实算得上一个重要来源，但缺点在于：中文互联网上存在大量低质量内容，让人眼花缭乱。

自从AI火爆之后，不少快速生成的劣质内容开始充斥互联网，并逐渐造成数据污染。

对于互联网获取数据的AI模型来说，在无法很好地辨别信息的真实性和可信度的情况下，极有可能产生造成“AI被互联网污染，再生产更劣质信息”的恶性循环，最终出现不可逆的缺陷。

这里笔者做了假设：谷歌Gemini在训练中文时“偷懒”使用了未经辨别与筛选后的中文数据，最终造成了这次“翻车”。

只能说，作为一款对标GPT-4的重磅产品，Gemini背负着“再次领跑AI浪潮”的使命，所以谷歌的技术人员还是用点心吧。

本文作者：jh，观点仅代表个人，题图源：网络

近期资讯

顶流预定！华为余承东开通微信视频号

快科技11月18日消息，华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东今日正式入驻微信视频号平台。余承东视频号的首秀尤为引人注目，他正式揭晓了华为Mate 70系列的发布日期&md

鹿角 2024-11-18

曝合创汽车解散上海分公司员工：拖欠被裁员工赔偿金

快科技11月18日消息，合创汽车近期被曝已裁撤上海分公司的所有员工，并且拖欠了被裁员工的赔偿金。多名已离职员工表示，公司原本承诺在10月31日前支付N+1赔偿金，但截至目前已逾期半个月仍未发

王略 2024-11-18

抢占苹果市场小米在日本爆发！出货量猛增4倍挺进前五

快科技11月18日消息，据日本ICT市场调查咨询机构MM总研（MM Research Institute）报告显示，2024财年上半年（2024年4-9月），小米智能手机在日本的出货量同比猛增418.7%，达到86.1万部，市占率大

黑白 2024-11-18

极速454km/h！布加迪W16 Mistral创下敞篷车极速世界纪录

快科技11月18日消息，布加迪W16 Mistral以454公里/小时的速度刷新了敞篷车极速世界纪录，成为全球最快的敞篷车。这款限量99台的特殊设计车型售价高达1400万欧元，约合人民币超过1亿元。

王略 2024-11-18

特斯拉辟谣FSD入华授权上汽：仍在评估当中

快科技11月18日消息，特斯拉中国近日否认了有关与上汽就FSD（全自动驾驶）技术授权进行讨论的传闻，明确表示这些消息不实。尽管有市场传言称特斯拉FSD入华后可能授权上汽开展Robotaxi业务，但

王略 2024-11-18

没信号也不怕小米SU7自动泊车等智驾在地库都能用

快科技11月18日消息，有车主好奇，小米SU7的智能驾驶功能在没有信号的地下车库是否还能正常使用，尤其是自动泊车功能。对此，小米汽车官方给出了明确回应：小米智能泊车功能并不依赖网络信号，

随心 2024-11-18

鹅厂和鸭厂在一起：上万间零售门店大升级

快科技11月18日消息，最近，鹅厂和鸭厂在一起了。腾讯宣布，和绝味食品达成了战略合作，推动绝味业务与腾讯AI大模型的深度合作。当前，绝味食品拥有上万间零售门店，它们将全部升级为数智门

随心 2024-11-18

10分钟预约量破100万！华为重磅新品开启预定

快科技11月18日消息，今天上午12:08分，华为Mate70系列正式开启预定，在华为官方商城，三款产品Mate70、Mate70 Pro和Mate70 Pro+预约人数10分钟就累计超过100万，并且还在持续增加。今天华为还

黑白 2024-11-18

华为Mate70一小时预订量已破百万：线下门店排长队抢疯了

快科技11月18日消息，今天12:08，华为Mate 70系列正式开启预订。根据华为商城界面显示，华为Mate 70系列一小时预订量已破百万，线下门店也出现抢购热潮，众多消费者排队购买，多个城市华为门店

振亭 2024-11-18

甘肃首台“全国产化”智能防外破装置成功试点应用

中新网甘肃新闻11月18日电(赵中鑫李志茹)近日，国网甘肃电科院在天水110千伏天铁二线及张家川绵上线现场成功试点应用了甘肃首台“全国产化”智能防外破装置(线路小卫士)，该装置的应用可帮助线路巡检人员及时发现并预警可能对输电线路造成破坏的风险，有效保障输电线路及设备安全，确保电力持续稳定供应。

中国新闻网 2024-11-18

网传Gemini用文心一言训练？可能谷歌也是受害者！

AI犯错后，谷歌紧急修复？

不只是文心一言？

实际上被互联网污染了？

推荐体验

相关资讯