苏黎世大学：ChatGPT标注数据比人类便宜20倍，80%任务上占优势

作者：量子位发布时间：2023-03-29

ChatGPT

又一“人类饭碗”被AI抢走，还是和训练AI息息相关的：

数据标注。

苏黎世大学研究发现，在ChatGPT面前，无论成本还是效率，人类可以说是毫无优势：

成本上，ChatGPT平均每个标注成本低于0.003美元，比众包平台便宜20倍；

效率上，在相关性、立场、主题等任务中，ChatGPT也是以4:1的优势“碾压”人类。

论文发出后，有网友调侃，“生成训练数据需要人工”的说法已经成为过去式了。

还有人直呼“古籍修复数字化工作是不是有希望提速了”。

还有人看热闹不嫌事大，直接发推称：

这是直接端了平台工作者的饭碗。

话说回来，ChatGPT是怎么抢了数据标注工作者的“饭碗”的？

ChatGPT在80%任务上占优势

首先得先了解下数据标注工作的具体内容。

简单来讲，数据标注就是给社交媒体上的内容数据贴标签，将其以不同主题或者概念进行分类，或是对其立场以及情绪进行判别。

这些经过标注的数据就可以用作NLP模型的训练集或是评估标准。

以往，这类工作都是交由人工处理的，比如说MTurk就是专门进行数据标注的一个众包平台。

在MTurk这类众包平台内部，还会有更加精细的分工，比如说会有经过专业训练的数据标注者以及众包工作者。

前者在产出高质量数据上具有优势，但自然成本也更高，而后者虽然更便宜但质量也会随任务难度波动。

于是研究团队就开始着手研究大语言模型（LLM）在这方面的潜力，并且对比了没有额外训练（zero-shot）的ChatGPT（基于GPT-3.5）和MTurk在数据标注上的性能。

这项对比基于研究团队此前收集到的2382条推文样本。

ChatGPT和MTurk分别将推文以“相关性、立场、主题、政策、实用性”这五种任务进行标注。

评估的标准有两条：

准确性：ChatGPT和MTurk众包工作者相较于正确标注的百分比；

编码者间的一致性信度：用ChatGPT、MTurk众包工作者以及专业数据标注者任意二者之间的一致性来计算；

结果呢也显而易见，在准确性上，ChatGPT有五分之四的任务都要优于MTurk众包工作者。

在一致性信度上，ChatGPT全部任务都超过了专业数据标注者。

成本方面，开头也已经提过，ChatGPT平均每条比人工便宜20倍，何况AI还能24*7无休。

不过对于研究团队得出的这个结论并不是所有网友都买账，有人表示：

这五条任务都太单一了，难度也是。仅凭这一点就得出这样的结论可靠性存疑。

甚至还有网友嘲讽了起研究样本太少来：

（竟然）只用2382条推文做样本。

“饭碗威胁”不止数据标注

现在，AI会不会完全取代某一类工作还不好说，但它会在一定程度上影响人类工作是毋庸置疑的。

上周，OpenAI就发布过一份分析报告，称有80%的工作都会在一定程度上受到ChatGPT的影响，19%的岗位会受到ChatGPT的严重冲击。

并且薪资越高的职业受到的冲击就越大。

OpenAI还进一步列出了会被影响的具体职业，从大到小依次是：

翻译从业者、文字创作者（包括诗人、作家等）、公关人员、数学家、税务编制人员、区块链工程师、财务工作者、媒体从业者……

△

除此之外，OpenAI的CEO奥特曼也不止在一个场合下说过“AI会取代现有的部分工作”。

前不久，MidjourneyV5大升级也是让不少人类画师直呼饭碗不保。

emmmmmm，你觉得你的饭碗还保得住吗？

论文地址：https://arxiv.org/abs/2303.15056参考链接：https://twitter.com/arankomatsuzaki/status/1640521970608402435

本文来自微信公众号“量子位”（ID:QbitAI），作者：Pine，36氪经授权发布。

近期资讯

资深机长解读韩国737客机失事原因：机长竟然没放起落架！

快科技12月29日消息，29日上午9时7分许，由泰国曼谷起飞的济州航空7C2216号航班在位于全罗南道的务安机场降落时坠落，和机场围栏等发生碰撞后起火爆炸，机上有175名乘客和6名机组人员，共计181人

2024-12-29

鸿蒙 ArkUI实现地图找房

常用的地图找房功能，是在地图上添加区域、商圈、房源等一些自定义 marker，然后配上自己应用的一些筛选逻辑构成，在这里使用鸿蒙 ArkUI 简单实现下怎么添加区域/商圈、房源等 Marker.

儿歌八万首 2024-12-28

宁德时代回应减产磷酸铁锂电池：消息不实需求依旧旺盛

快科技12月29日消息，宁德时代近日对网上关于其计划减少磷酸铁锂产量的传言进行了辟谣，称这些传闻不属实。公司表示，目前新能源市场需求旺盛，宁德时代与供应商保持着良好的合作关系，共同推

2024-12-29

韩国载181人客机起火爆炸：179人遇难 2人生还

2024-12-29

云计算架构学习整理（八）：认证与安全

Paramita 2024-12-28

说出示例代码执行结果（Promise）

Promise 创建后立即执行，resolve 或 reject 函数在同步代码之后执行，等到 resolve 或 reject 执行后，进入 then 或 catch 函数。

南星媛 2024-12-28

手心输入法更新：自动下载360是三年前遗留

快科技12月29日消息，手心输入法在前不久时隔六年后发布了Windows端v3.1版更新，不过此次更新却引发了用户热议。根据用户反馈，新版本似乎会自动下载360弹窗过滤器，这一行为与手心输入法此前

2024-12-29

《探秘前端：页面精修、函数巧用与性能护航》

一、页面雕琢：构建搜索引擎友好的前端基石 1.HTML5 的语义化标签：开启精准语义表达，赋能 SEO 新篇 HTML5 相较于之前的 HTML 版本引入了新的语义化元素，如、

初出茅庐的小藤神 2024-12-28

JavaScript 的作用域

简单来说，作用域就是变量和函数的可访问性和生命周期。它决定了在哪些地方可以访问到某个变量或函数。你可以把它想象成一个“地盘”，变量在这个地盘里有效，出了这个地盘就可能无效或者访问不到了。

KeepCatch 2024-12-28

今晚开播：比亚迪王传福与科大讯飞刘庆峰同台科晚盛典

快科技12月29日消息，央视官方今日宣布，由总台社教节目中心精心筹备的首届《中国科技创新盛典》将于12月29日晚22:30在CCTV-1首播，并于12月30日晚20:30在CCTV-10重播。作为科技企业的杰出代表

2024-12-29

苏黎世大学：ChatGPT标注数据比人类便宜20倍，80%任务上占优势

ChatGPT在80%任务上占优势

“饭碗威胁”不止数据标注

推荐体验

相关资讯

ChatGPT标注数据比人类便宜20倍，80%任务上占优势 | 苏黎世大学

比人类便宜20倍，ChatGPT让数据标注者危矣？

ChatGPT要把数据标注行业干掉了？比人便宜20倍，而且还更准

7 Papers＆Radios｜GPT-4学会反思；ChatGPT数据标注比人便宜20倍

比人类便宜20倍：谷歌DeepMind推出“超人”AI系统

近期资讯

资深机长解读韩国737客机失事原因：机长竟然没放起落架！

鸿蒙 ArkUI实现地图找房

宁德时代回应减产磷酸铁锂电池：消息不实需求依旧旺盛

韩国载181人客机起火爆炸：179人遇难 2人生还

云计算架构学习整理（八）：认证与安全

说出示例代码执行结果（Promise）

手心输入法更新：自动下载360是三年前遗留

《探秘前端：页面精修、函数巧用与性能护航》

JavaScript 的作用域

今晚开播：比亚迪王传福与科大讯飞刘庆峰同台科晚盛典

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响