ChatGPT标注数据比人类便宜20倍，80％任务上占优势｜苏黎世大学

作者：量子位发布时间：2023-03-29

ChatGPT

Pine 发自凹非寺

量子位 | 公众号 QbitAI

又一“人类饭碗”被AI抢走，还是和训练AI息息相关的：

数据标注。

苏黎世大学研究发现，在ChatGPT面前，无论成本还是效率，人类可以说是毫无优势：

成本上，ChatGPT平均每个标注成本低于0.003美元，比众包平台便宜20倍；

效率上，在相关性、立场、主题等任务中，ChatGPT也是以4:1的优势“碾压”人类。

论文发出后，有网友调侃，“生成训练数据需要人工”的说法已经成为过去式了。

还有人直呼“古籍修复数字化工作是不是有希望提速了”。

还有人看热闹不嫌事大，直接发推称：

这是直接端了平台工作者的饭碗。

话说回来，ChatGPT是怎么抢了数据标注工作者的“饭碗”的？

ChatGPT在80%任务上占优势

首先得先了解下数据标注工作的具体内容。

简单来讲，数据标注就是给社交媒体上的内容数据贴标签，将其以不同主题或者概念进行分类，或是对其立场以及情绪进行判别。

这些经过标注的数据就可以用作NLP模型的训练集或是评估标准。

以往，这类工作都是交由人工处理的，比如说MTurk就是专门进行数据标注的一个众包平台。

在MTurk这类众包平台内部，还会有更加精细的分工，比如说会有经过专业训练的数据标注者以及众包工作者。

前者在产出高质量数据上具有优势，但自然成本也更高，而后者虽然更便宜但质量也会随任务难度波动。

于是研究团队就开始着手研究大语言模型（LLM）在这方面的潜力，并且对比了没有额外训练（zero-shot）的ChatGPT（基于GPT-3.5）和MTurk在数据标注上的性能。

这项对比基于研究团队此前收集到的2382条推文样本。

ChatGPT和MTurk分别将推文以“相关性、立场、主题、政策、实用性”这五种任务进行标注。

评估的标准有两条：

准确性：ChatGPT和MTurk众包工作者相较于正确标注的百分比；

编码者间的一致性信度：用ChatGPT、MTurk众包工作者以及专业数据标注者任意二者之间的一致性来计算；

结果呢也显而易见，在准确性上，ChatGPT有五分之四的任务都要优于MTurk众包工作者。

在一致性信度上，ChatGPT全部任务都超过了专业数据标注者。

成本方面，开头也已经提过，ChatGPT平均每条比人工便宜20倍，何况AI还能24*7无休。

不过对于研究团队得出的这个结论并不是所有网友都买账，有人表示：

这五条任务都太单一了，难度也是。仅凭这一点就得出这样的结论可靠性存疑。

甚至还有网友嘲讽了起研究样本太少来：

（竟然）只用2382条推文做样本。

“饭碗威胁”不止数据标注

现在，AI会不会完全取代某一类工作还不好说，但它会在一定程度上影响人类工作是毋庸置疑的。

上周，OpenAI就发布过一份分析报告，称有80%的工作都会在一定程度上受到ChatGPT的影响，19%的岗位会受到ChatGPT的严重冲击。

并且薪资越高的职业受到的冲击就越大。

OpenAI还进一步列出了会被影响的具体职业，从大到小依次是：

翻译从业者、文字创作者（包括诗人、作家等）、公关人员、数学家、税务编制人员、区块链工程师、财务工作者、媒体从业者……

除此之外，OpenAI的CEO奥特曼也不止在一个场合下说过“AI会取代现有的部分工作”。

前不久，MidjourneyV5大升级也是让不少人类画师直呼饭碗不保。

emmmmmm，你觉得你的饭碗还保得住吗？

论文地址：

https://arxiv.org/abs/2303.15056

参考链接：

https://twitter.com/arankomatsuzaki/status/1640521970608402435

近期资讯

美的BCD-185WM(E)冰箱：1199元享185升风冷无霜，节能静音新体验

#年货节好物集市#美的冰箱以其创新技术和卓越性能在家电市场中占据了重要的地位。美的冰箱的技术特点包括风冷无霜技术，该技术能够避免结霜问题，使食物保持新鲜；双系统双循环技术，独立控制冷藏室和冷冻室的温度，有效避免食物串味。此外，美的冰箱还以其节能低噪、小机身大容量等特点，满足了现代家庭对高效、环保和便捷生活的需求。

小米地瓜 2024-12-26

酷凛推出雪界 DF 系列厚排一体式水冷，冷头配备 VRM 散热风扇

IT之家12月26日消息，酷凛ID-COOLING官网现已上线雪界DF一体式CPU水冷。酷凛雪界DF一体式水冷散热器配备运行噪声25dB(A)的2900RPM定速“自研V7水泵”，采用三相六极水泵马达和新铜底方案。

IT之家 2024-12-26

康佳BCD-408WPEG4S冰箱：1199元享408升变频风冷无霜，节能新体验

#年货节好物集市#康佳集团作为家电行业的佼佼者，一直以其科技创新和高端化、智能化发展为战略方向，致力于在消费电子和半导体两大主业上实现突破。康佳BCD-408WPEG4S冰箱以其408升的大容量、一级能效和风冷无霜技术在市场上备受关注。

小米地瓜 2024-12-26

共绘巫山红叶盛景｜华为Mate70红枫原色影像见证自然之美

日前，“巫山盛景入镜来”红枫原色影像分享沙龙在华为智能生活馆·重庆解放碑来福士店成功举办，本次活动由市民影像计划、华龙网、巫山县文旅委、巫山县林业局以及巫山文旅集团共同发起，旨在通过华为Mate70系列的镜头，捕捉巫山红叶的壮丽与细腻，还原自然之美，展现“两岸青山·千里林带”生态修复工程的辉煌成就。

金台资讯 2024-12-26

Steam账号安全指南：如何修改密码与启用双重验证

在现代社会中，网络安全越来越受到重视，尤其是对于游戏玩家来说，保护自己的账户安全是非常重要的。Steam作为全球最大的数字游戏分销平台，拥有数以亿计的用户。为了保护自己的账号，定期更改密码是个不错的选择。一旦登录成功，你会看到界面右上角有一个“昵称”或者你的账户名。

新报观察 2024-12-26

斯派尔精创取得装配式建筑墙板加工用切割装置专利，便于调整墙板切割宽度

金融界2024年12月26日消息，国家知识产权局信息显示，陕西斯派尔精创新材料科技有限公司取得一项名为“一种装配式建筑墙板加工用切割装置”的专利，授权公告号CN222200672U，申请日期为2024年5月。

金融界 2024-12-26

景胜电子取得导电胶生产用切条装置专利，避免人工切割效率低下

金融界2024年12月26日消息，国家知识产权局信息显示，井冈山景胜电子科技有限公司取得一项名为“种导电胶生产用切条装置”的专利，授权公告号CN222200674U，申请日期为2024年5月。

金融界 2024-12-26

启明星辰集团数据安全检查工具箱正式发布，“有理有据”搞定数据安全检查“痛点”！

随着我国《数据安全法》《个人信息保护法》《网络数据安全管理条例(征求意见稿)》等一系列法规政策相继出台与持续推进,国家监管部门和各大行业领域加大对数据安全工作重视程度,数据安全监管体系日益严密,数据安全检查成为网络安全管理的一项重要任务。

砍柴网 2024-12-26

轻松连接无线打印机的详细步骤与注意事项指南

连接无线打印机其实并没有想象中的那么复杂。很多人可能一开始会觉得无线打印机技术听起来高深莫测，但实际上，只要按照一些简单的步骤，就能轻松搞定。下面我就来和大家聊聊，如何把无线打印机连接到你的小伙伴们——电脑、手机或者平板上。

新报观察 2024-12-26

荣耀工程师称手机拍照只有 2 家可比，豪言背后的自信与底气

12月23日，荣耀举行了荣耀Magic7RSR保时捷设计及影像技术发布会。在发布会上，荣耀正式宣布Magic7系列将全面升级“大王影像”，旨在以人性化的摄影体验为核心目标，重塑摄影体验新境界。总之，整场发布会看下来，我们能够深刻感受到荣耀在影像技术方面确实取得了非常耀眼的成果。

IT之家 2024-12-26

ChatGPT标注数据比人类便宜20倍，80％任务上占优势｜苏黎世大学

推荐体验

相关资讯

苏黎世大学：ChatGPT标注数据比人类便宜20倍，80%任务上占优势