谷歌被曝直接抄ChatGPT数据，BERT一作抗议后投奔OpenAI

作者：量子位发布时间：2023-03-31

谷歌 OpenAI ChatGPT Bard

明敏鱼羊发自凹非寺

量子位 | 公众号 QbitAI

谷歌这回，可真是出大糗了。

Bard处处不及ChatGPT也就罢了，如今竟然被曝出，为了快速训练这个ChatGPT竞品，他们直接使用了ChatGPT生成的数据。。。

数据来自于一个收集ChatGPT对话的公开网站，上面的对话数量超过11万。

The Information爆料，这种操作在谷歌内部不是没人反对。BERT一作就直接向劈柴哥等高管发出警告，并且明确提示：

这种行为违反了OpenAI的服务条款，并且会让Bard的回答和ChatGPT非常相似。

此后，这位大佬迅速从谷歌离职，转投OpenAI。

ShareGPT网站的作者，也佐证了这个消息：“我知道这事儿有一阵子了。”

并且正因为此，ShareGPT上周关闭了浏览他人聊天记录的探索功能。

这一锤下来，吃瓜网友当场坐不住了，有人直言谷歌这是犯了大忌。

还有人嘲讽，这下谷歌完全成了OpenAI的陪衬。

而谷歌这边，也立马被炸了出来，紧急否认三连：

Bard没有用任何来自ShareGPT或者ChatGPT的数据训练。

Bard自己承认“浏览过”ShareGPT

但谷歌用ShareGPT数据训练Bard这事儿吧，多少是有迹可循。

比如在上周，ShareGPT突然关闭了浏览他人ChatGPT对话的功能。

ShareGPT本来是一个谷歌插件，能方便人们一键分享自己和ChatGPT的对话到各种平台。之后开发者又进一步推出了一个探索页面，可以方便大家互相浏览有趣的对话，因此也成为了一个海量ChatGPT数据的聚集地。

随着The Information的爆料不胫而走，ShareGPT的开发者也公开喊话：

秘密终究还是藏不住了吧！

再来看谷歌这边的回应，比较因吹斯听。

虽然他们否认使用过ShareGPT或ChatGPT的任何数据。但在The Verge追问之前是否使用过ChatGPT数据做训练时，发言人拒绝回答并表示：

很抱歉我能分享的只有我们昨天的声明。

有消息人士说，在BERT一作雅各布·德福林（Jacob Devlin）和谷歌高管发出警告后，谷歌确实停止使用ChatGPT数据训练了。

由此The Verge猜测，Bard里或许已经删掉了之前这部分训练数据。

而如果把这个问题直接抛给Bard本身，它的回答同样引人深思。

因为它否认使用过ChatGPT的数据。

但承认读过ShareGPT的对话……

反倒是ChatGPT这边的回答很谨慎体面，表示除非“谷歌官方或相关研究人员明确承认了”，否则它没法作答。

实际上，OpenAI对于能否使用ChatGPT输出数据做训练这件事，有明确的条款说明：

竞品，不行。

但如果是非商用的，比如斯坦福大学发布的对话模型Alpaca，应该可以。

在Alpaca发布时明确提到，团队是通过购买OpenAI的API来生成数据集。

由此也就不难理解为啥BERT一作雅各布老哥，当初知道谷歌操作后反应如此激烈，甚至直接跑去和劈柴哥发出警告，毕竟这可是明目张胆地违反友商条例。

更何况这么做对Bard也不是没有坏处，会导致它生成的答案和ChatGPT非常相似……

而在给谷歌“吹哨”后，雅各布选择了马上提桶跑路转投OpenAI。1月份离职，都没等Bard发布。

不过这还没完，谷歌的操作还在继续——

因为他们居然和DeepMind“一笑泯恩仇”，联手开发新的大模型来应对ChatGPT了。

要知道，虽然DeepMind从2014年就被谷歌收购了，但它一直都保持高度独立运营，和谷歌的开发团队时常保持着竞争关系。

但在ChatGPT热潮下，谷歌和DeepMind如今的局面都颇为被动。

由此也就看到了这次罕见联手，DeepMind和谷歌大脑团队合作，共同开发一个名为Gemini（双子座）的大模型。

据悉，这个模型对标GPT-4，参数量大约在1万亿左右。谷歌大脑负责人Jeff Dean领衔技术开发，负责代码编写等工作。

网友：暂停大模型研究6个月根本不可能

谷歌这一波操作下来，外界也有些目瞪狗呆。

就有网友提出：Gemini的出现，是不是意味着谷歌已经放弃Bard了？

放不放弃不好说，但至少，谷歌内部的“赛马”已现端倪。

事实上，Gemini的消息传出之前，在2月份ChatGPT掀起第一波高潮之时，谷歌和DeepMind就已有联手动作：

谷歌旗下专注语言大模型的“蓝移团队”（Blueshift Team）宣布，整体并入DeepMind。目标就是追赶ChatGPT的进度。

此前，谷歌的5400亿参数大模型PaLM背后，就有蓝移团队成员的贡献。谷歌耗时2年发布的大模型基准BIG-Bench，也有蓝移团队的深度参与。

另外，DeepMind还手握另一张名为“Sparrow”的牌。

这一聊天机器人在去年9月就吸引了外界的关注，有评价认为它“朝创建更安全、偏差更小的机器学习系统迈出了重要一步”。

但当时，DeepMind出于对公共安全的顾虑，并未面向公众发布Sparrow。

论文的主要作者Geoffrey Irving当时解释说：

我们没有部署该系统，因为我们认为它还存在很多类型的偏见和缺陷。

问题在于，你如何权衡机器与人沟通的优势和劣势。我倾向于认为安全更为重要……从长远来看，我认为这是一种工具。

在ChatGPT发布并引起广泛讨论之后，据英国《独立报》消息，DeepMind的CEO哈萨比斯（Demis Hassabis）透露，Sparrow的内测版会在2023年年内推出。

种种迹象，让网友不由感慨：什么先进大模型“暂停六个月”，都是没谱的事儿。

开弓没有回头箭，尤其对于在这一波浪潮中处处落于下风的谷歌而言，显然没有停下脚步的理由。

毕竟，用户是真的在流失。Similarweb的数据显示，在过去近一个月时间里，新必应的页面访问量增长了13.6%，谷歌搜索的访问量则下跌了2.8%。

而谁也不想做下一个黑莓。

你觉得呢？

参考链接：

[1]https://www.theverge.com/2023/3/29/23662621/google-bard-chatgpt-sharegpt-training-denies

[2]https://twitter.com/amir/status/1641219919202361344

[3]https://twitter.com/steventey/status/1641267979399704576

近期资讯

科研成果从“书架”走向“货架”

金万勤手握一根长约80厘米、管壁均匀涂覆了有机膜材料的陶瓷管说，“从最初实验室里5厘米的样品到80厘米的产品，我们花了10年才实现气体净化膜材料从实验走向中试。”

央广网 2024-12-28

中国熟透了的28nm及以上芯片，美国为何会害怕？

所以我们看到，最近几年，美国针对中国的芯片禁令不断升级，更是联手荷兰、日本，将包括EUV光刻机在内的众多先进设备，禁运了。美国之前的目标，是锁住逻辑芯片在14nm，NAND闪存有128层，DRAM内存在18nm即可，至于成熟芯片，就不管了，也管不着。

科技plus 2024-12-28

雷军：小米SU7全年交付量超13万提前完成全年目标

雷递网乐天12月28日小米CEO雷军今日表示，今天是小米汽车正式亮相1周年，截至目前，小米SU7全年交付量已超过13万，已提前完成全年所有目标。雷军说，之所以这么早公示，小米汽车希望YU7测试车可以尽早拆除重伪装。

雷递 2024-12-28

资源大揭秘|一次参展就将交通行业资源收入囊中？这场展会真就做到了！

清晰知晓自身企业所处环节的坐标，洞悉与上下游伙伴的衔接疏密、竞争差异。尽收囊中。看到这里，如果你还不知道是哪场展会那就太OUT了！

PPP知乎 2024-12-28

盘点2024年那些快消失的手机配置简直大快人心!

【CNMO科技】科技圈永恒的主题是“喜新厌旧”。但2024年，它们并没有选择沉默，至少在百元机这个市场，没人再动它们的蛋糕。首要原因是曲面屏的配套钢化膜价格高昂，相较于直屏，其费用要高出5至10倍。谁能料到，仅仅在去年还被视为大容量的5000mAh电池，到了今年已悄然变成小容量。换句话说，200W快充的营销噱头远大于其实用价值。

手机中国 2024-12-28

郑州二七警方加强人才培养体系建设全面提升公安新质战斗力

12月5日，在郑州市公安局2024年度智慧公安应用场景创新大赛中，二七公安分局一组师徒搭配选手魏霞、张凌波格外抢眼，她们团队凭借过硬业务素质和出色现场表现，赢得了现场领导和评委们的一致好评，创作的《矛盾纠纷类警情分级评估深度研判数据模型》在22个参赛作品中脱颖而出、一举夺魁，荣获一等奖。

大象新闻 2024-12-28

川渝首条低空短途运输航线在绵阳北川正式开通

人民网成都12月28日电12月27日14时许，一架载着7名游客的皮拉图斯PC-12飞机从北川永昌机场起飞，1小时20分钟后降落在重庆梁平机场。一架载着7名游客的皮拉图斯PC-12飞机从北川永昌机场起飞。

金台资讯 2024-12-28

正观新闻 2024-12-28

谷歌被曝直接抄ChatGPT数据，BERT一作抗议后投奔OpenAI

推荐体验

相关资讯

谷歌Bard被曝剽窃ChatGPT？BERT一作跳槽OpenAI，揭惊天内幕

投奔 OpenAI 后，BERT 之父 Jacob Devlin 重返 Bard 项目！

BERT一作反复横跳！入职OpenAI仅3月后又回谷歌

刚刚，GPT开山一作被曝离职OpenAI，被Ilya感谢，ChatGPT无名英雄选择单飞

BERT一作反复横跳！入职OpenAI仅3月后又回谷歌，重新加入Bard项目

近期资讯

科研成果从“书架”走向“货架”

中国熟透了的28nm及以上芯片，美国为何会害怕？

雷军：小米SU7全年交付量超13万提前完成全年目标

资源大揭秘|一次参展就将交通行业资源收入囊中？这场展会真就做到了！

盘点2024年那些快消失的手机配置简直大快人心!

郑州二七警方加强人才培养体系建设全面提升公安新质战斗力

川渝首条低空短途运输航线在绵阳北川正式开通

APP在线升级经验分享

推动产业创新与进步康利IP产业对接交流会成功举办

嫦娥五号月球样品向公众开放！去了这个展四舍五入也算去了趟月球

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响