非洲数据注释员时薪不到2美元，却要筛选大量负面内容以降低ChatGPT毒性

作者：DeepTech深科技发布时间：2023-06-15

最近，我一直在思考人工智能模型背后的人力资源消耗。

让人工智能聊天机器人用起来很智能，并生成更少有毒的废话的秘诀是使用了一种名为基于人类反馈的强化学习的技术，该技术利用人们的输入来改进模型的回答。

它依赖于一小群人工数据标注者，他们负责评估一串文本是否有意义，听起来是否流畅自然。他们将决定是把回答保存在人工智能模型的数据库中，还是将其删除。

即使是最令人印象深刻的人工智能聊天机器人，也需要数千个人类工时才能按照创作者希望的方式行事，即使这样，他们也无法可靠地做到这一点。这项工作可能是残酷和令人不安的，正如我们将在本周 ACM 公平、问责和透明度会议（FAccT，Fairness-Accountability- and Transparency）开始时听到的那样。这个大会，汇集了我喜欢的话题和研究，比如如何使人工智能系统更负责任和更合乎道德。

（来源：ANNA SOROKINA）

我期待的一个小组是由人工智能伦理先驱蒂姆尼特·格布鲁（Timnit Gebru）领导的，她在被解雇前曾共同领导谷歌的人工智能伦理部门。格布鲁讲述了埃塞俄比亚、厄立特里亚和肯尼亚的数据工作者，如何被利用去清除网上的仇恨信息和错误信息。例如，肯尼亚的数据注释员每小时的报酬不到 2 美元，他们要筛选大量关于暴力和性虐待的令人不安的内容，以降低 ChatGPT 的毒性。这些人现在正在加入工会，以获得更好的工作条件。

在 2022 年的《麻省理工科技评论》系列中，我们探讨了人工智能是如何创建一个新的殖民世界秩序的，而数据工作者首当其冲。随着 ChatGPT、Bing 和 Bard 等流行的人工智能聊天机器人以及 DALL-E 2 和 Stable Diffusion 等图像生成人工智能的兴起，揭露人工智能的剥削行为变得更加紧迫和重要。

数据注释员参与了人工智能开发的每个阶段，从训练模型到验证其输出，再到提供反馈，使模型在推出后能够进行微调。英国伦敦城市大学研究数据工作劳动实践的博士研究员斯拉维亚·昌迪拉莫乌里（Srravya Chandhiramowuli）说，他们经常被迫以惊人的速度工作，以满足更高的目标和紧迫的时限。

昌迪拉莫乌里说：“如果有人认为，你可以在没有人为干预的情况下建立这些大规模系统，那他是绝对错误的。”

人工智能模型需要大规模地做出决策，并且这些决策必须尽可能地成熟，而数据注释员为它们提供了重要的背景信息。

昌迪拉莫夫里告诉我一个案例，印度的一位数据注释员必须区分汽水瓶的图像和挑选出看起来像 Dr.Pepper（一种饮料）的图像。但后者并不在印度销售，数据注释者有责任弄清楚这一点。

昌迪拉莫乌里说，人们的期望是注释者找出对公司重要的价值观。她说：“他们不仅在学习这些对他们来说毫无意义的遥远的东西，他们还要弄清楚其它背景信息是什么，以及他们正在构建的系统的优先事项是什么。”

美国加州大学伯克利分校、加州大学戴维斯分校、明尼苏达大学和西北大学的研究人员在 FAccT 发表的一篇新论文中认为，事实上，无论我们是否意识到，我们都是大型科技公司的数据劳工。

文本和图像人工智能模型是使用从互联网上收集的巨大数据集进行训练的。这包括我们的个人数据和艺术家的版权作品，而我们创建的数据现已永远成为人工智能模型的一部分，而这些模型是为了让公司盈利而建立的。我们无意中通过将照片上传到公共网站、在 Reddit 上投票、在 reCAPTCHA 上标记图像或进行在线搜索来免费贡献我们的劳动。

目前，权力失衡严重偏向于世界上一些最大的科技公司。

要改变这一现状，我们只需要一场数据革命和监管。研究人员认为，人们重新控制自己在线生活的一种方法是倡导数据使用方式的透明度，并想出方法让人们有权提供反馈并分享数据使用的收入。

尽管这种数据劳动构成了现代人工智能的支柱，但数据工作在世界各地仍然长期被低估和忽视，注释者的工资仍然很低。

正如昌迪拉莫夫里所说：“人们绝对没有认识到数据工作的贡献。”

支持：Ren

相关资讯

ChatGPT背后的标注人：在非洲只管“鉴黄”，时薪不到两美元

机器之心报道编辑：泽南、小舟最先进的 AI 技术，背后还是原始的劳动。ChatGPT 是去年热度最高的科技创新之一，这种强大的人工智能几乎可以生成任何主题的文本，既可以与人对话聊天，也会编程、参与考试、写诗搞艺术，在上线一周的时间内就拥有了上百万用户。在 ChatGPT 一炮而红之后，OpenAI 现在正在与投资者谈判估值 29...

ChatGPT 人工智能编程艺术融资

机器之心 2023-01-22

腾讯科技 2023-05-10

外媒曝光ChatGPT背后血汗工厂，最低时薪仅1.32美元

驱动中国2023年2月13日消息，据美国《时代周刊》上月中旬的报道，为了训练ChatGPT，OpenAI雇佣了时薪不到2美元的肯尼亚外包劳工，他们所负责的工作就是对庞大的数据库手动进行数据标注。Sama是一家…

ChatGPT OpenAI

驱动中国 2023-02-13

非洲数据注释员时薪不到2美元，却要筛选大量负面内容以降低ChatGPT毒性

推荐体验

相关资讯

ChatGPT背后的标注人：在非洲只管“鉴黄”，时薪不到两美元

ChatGPT背后的“血汗工厂”：最低时薪仅1.32美元

藏在290亿的ChatGPT背后的，是一群时薪2美元的肯尼亚劳工

揭秘ChatGPT背后的“影子人” ：时薪15美元没有任何福利

外媒曝光ChatGPT背后血汗工厂，最低时薪仅1.32美元

近期资讯

OpenHarmony UI动画-recyclerview_animators

荣耀股改已完成：将适时启动IPO流程

如何用WPS AI提高工作效率

日本制造信仰崩塌！多家百年日企又承认造假就是故意的

Android图形框架之SurfaceComposerClient 提交事务过程

智界R7车主调研报告出炉：“华为”成金字招牌

男女款齐全：红妮磨绒保暖内衣套装49元大促（日常109元）

欧美怕吗！我国自研600公斤发动机点火：无人机打击更牛

怕冷的人VS抗冻的人：哪个更健康

卢伟冰谈董明珠炮轰小米空调：企业应与时俱进

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响