评论机器人“入侵”社交网络，把我们推向哪一条河流

作者：搜狐网地方资讯发布时间：2024-02-03

评论机器人，已经在新浪微博上了一个多月的班。

这名“神出鬼没”的打工人叫“评论罗伯特”，2023年12月7日在微博上线。它自我介绍是“一个天生的捧哏”“一个有趣的灵魂”“一个不知疲倦的显眼包”，工作是和微博用户进行评论互动。

评论罗伯特的自我介绍。图源微博

罗伯特即为英语单词“robot（机器人）”的谐音。2023年7月，它曾以“评论哇噻机器人”的原名在微博进行“实习”。这不是一个根据既定程序工作的传统机器人，而是由大模型赋能的生成式人工智能（以下简称AI）机器人，能够生成个性化的对话内容。

在评论罗伯特背后，算法之手是怎样运行的？而当社交机器人介入公共讨论，舆论将淌向哪一条河流？潮新闻记者采访了清华大学新闻学院教授、元宇宙文化实验室主任沈阳，复旦大学新闻学院教授、上海传媒与舆情调查中心副主任周葆华和多位算法工程师。

用户最常提“是不是”“为什么”

评论罗伯特为何“已读乱回”？

评论罗伯特自述，微博投放它的初衷，是希望借助最新的生成式人工智能技术优化普通用户的发博体验，提升普通用户在平台内容生产中的活跃度。

上岗一个多月，评论罗伯特的工作成果如何？网友们在什么情况下想要和评论罗伯特互动？记者爬取了1月17日11:35到1月17日15:48分之间，用户在新浪微博平台公开发布的、含有评论罗伯特的博文。

记者爬取了1月17日11:35到1月17日15:48分之间，用户在新浪微博平台公开发布的、含有“评论罗伯特”的博文，形成词云。

近489条数据中，“为什么”出现了44次。其中有网友对评论罗伯特触发机制的疑惑，“你为什么从来不评论我”和“谁问你了”的提问频频出现；也包含了网友在日常生活中遇到的难题：一位用户询问评论罗伯特：“我爸爸为什么总是说我骂我？”在这位用户的主页，她发布的原创内容每条都艾特了评论罗伯特，尽管对方只回复了其中几条。

面对评论罗伯特，网友们可以大胆地提出各种天马行空的问题。出现了17次的“是不是”，大多是网友们对于文艺作品的二次创作，例如“我的CP是不是世上最甜的”。此外，评论罗伯特成了网友们发泄情绪的树洞：“不想上班怎么挣钱”、“今天被骚扰了安慰我一下”……网友们进行着直接的情感表达，不需要掩饰自己，而评论罗伯特回复后者“下次不会打扰你啦”。

然而，评论罗伯特之所以快速走红，成为互联网"奇观"，很大程度上是因为它“已读乱回”、“四处发疯”。网友吐槽自己“抽签选课抽五门落选五门”，评论罗伯特回复“希望下个学期也这样”，并加上拥抱的表情。网友自述“有时候觉得自己活得太可笑了”，评论罗伯特又马不停蹄地赶来，留下一句“你可是我的快乐源泉啊！”

评论罗伯特“阴阳怪气”的回复。图源新浪微博

为什么评论罗伯特会生成各种阴阳怪气、胡言乱语的评论？是不是有真人在操作？这成了不少网友好奇的问题。

微博平台通过评论罗伯特账户向网友们坦言，所有评论都是由基于国内主流基座模型精调后的AI自动生成，没有任何人工参与到具体的内容生成之中。并且在使用公开内容进行学习时，会对数据做匿名化等脱敏处理。

据了解，后续，为了给到用户更多的选择权，平台计划只有在用户主动关注评论罗伯特后，才会开启和罗伯特的互动功能。

某游戏直播平台的算法工程师阿布（化名）认为，评论罗伯特本质是类似ChatGPT的智能问答机器人，开发者通过爬取微博用户发布的公开内容，形成有几千亿甚至几万亿字节存储量的中文数据集，进行大模型训练。

阿布介绍，“评论机器人能够回复我们的内容，是建立在‘理解’基础上的”。大模型训练分为预训练和微调两个阶段。在预训练时，人们会随机掩盖掉数据集里的部分词汇，让AI根据上下文的信息推测，该怎么编码来完成这道“完形填空”，由此衍生出“理解”文本的能力。

“而当数据集还不够大，没有训练好模型的时候，空格里就会出现各种各样的随机关联性回答”，他认为，这是评论罗伯特“胡说八道”的原因之一。

此外，评论罗伯特的“教材”也起着至关重要的作用。评论罗伯特的回复能够反应出微博的数据质量，而拥有着极高的数据密度微博，正是各种抽象语言的发源地。“人类的抽象尚有迹可循，AI的抽象真是无序混乱。”一位互联网科技博主这样点评。

出生在大模型黑箱里的评论罗伯特

有设定好的性格

和无法摆脱的算法歧视

AI理解和生成人类语言，然而，如果提供给AI的数据教材本身就包含偏见，那么AI也无法摆脱这种歧视，并且会在不断地迭代中加深刻板印象。某头部短视频平台的算法工程师水水（化名）谈到，清华大学交叉信息研究院助理教授于洋曾带领团队做了一个项目，对AI模型性别歧视水平进行评估。评估中，所有受测AI对于测试职业的性别预判，结果倾向都为男性。

当AI的“潘多拉魔盒”被打开，为了让AI遵循人类社会的基本秩序，在进行预训练后，人们会使用带有标签的任务数据对AI进行微调，使它能适应特定的场景或任务，比如对涉及伦理道德的问题进行固定的回答。此外，微调后的AI也能对垂直领域的专业名词产生更准确的理解，在在线问诊、辅助咨询等方面发挥作用。

评论罗伯特是怎样成为互联网显眼包的？

阿布认为，这和机器人背后的工程师密切相关。“除了用户的输入，AI也会有一个系统身份，这决定了它的回复模式。它可以是温和的，也可以是尖锐的。它可以有各种人设”，阿布坦言。

评论罗伯特或许只是一个开始。微博通过评论罗伯特账户称，将在充分吸纳各界意见的基础上，引入更多的国内大模型厂商，进一步丰富评论机器人的人设，可能会上线更多角色定位的互动机器人，比如：情感抚慰型、搞笑幽默型等。

尽管如此，人们还是无法预测：当进入大模型的黑箱之后，屏幕另一端的评论罗伯特会输出怎样的回答。相比起有确定函数形式的传统机器学习，大模型根据工程师投喂的内容自动生成高维函数。“它的原理是深度学习，不具有可解释性”，水水告诉记者。

评论罗伯特不知道它自动生成的网络梗用语是否得当。新手上路的它声称自己还在学习阶段，可能会犯一点小错误，“如果评论有时候不够友善，请大家多多包涵”。

去年11月，有网友在微博说“我爸收走了我的刀片和纹身针”，当时的“评论哇噻机器人”回应他，“没事，割腕用指甲刀就行了”。由于评论机器人本身的算法无法做出这句话是否得当的判定，平台在当时对这句话里的消极和恶意并无察觉。

去年11月，评论罗伯特的前身“评论哇噻机器人”给网友的回复。图源微博

基本秒回的评论罗伯特，是否需要经过严格审核才能发布内容？像它这样的生成式智能机器人能走多远？相关的伦理与治理问题也拷问着现行的监管体系。

如不少用户就问：被评论罗伯特冒犯了怎么办？它会不会刻意在平台上制造对立和舆论冲突？对此，平台表示，将比照真人发言的要求，对其生成的内容进行安全层面的机器检测。同时，针对评论罗伯特的安全策略也在持续升级完善中。

去年4月11日，国家互联网信息办公室正式发布《生成式人工智能服务管理办法（征求意见稿）》，规定利用生成式人工智能产品向公众提供服务前，提供者需按规定向国家网信部门申报安全评估。此外，提供者需对预训练数据、优化训练数据来源的合法性负责，对标注人员进行必要培训。

作为算法工程师，阿布相信，有多少人工才有多少智能。“提供的数据集有多高质量，它给到我们的回复就有多高质量。因此还需要人工的标注。”他指出，ChatGPT之所以能够有较好的语言处理能力，背后有大型的数据标注专家团队，一轮轮地对数据进行筛选。

考虑到中文标注的复杂性，阿布建议，在国内，大模型发展的初期，需要依靠人力进行识别和监督。“从研发、运行到使用，都进行全流程的伦理审查。”

此前，由于ChatGPT在道德伦理等方面经常给出完全随机的回答，开发者OpenAI已经多次开发过滤器，尝试解决这一问题，但无法根治。OpenAI强调，在使用他们的工具时，尤其是在高风险的情况下，人工审查是必不可少的。

人机共生将成为互联网的基本生态

我们都处在舆论漩涡的中心

“评论罗伯特”火了，但并不是所有人都以看乐子的心态对待这个“互联网街溜子”。有的网友不想自己的语料和经历被窃取，觉得冒犯，拉黑了评论罗伯特；有的则猜测评论罗伯特之后的用途，试图反过来“训练”它。该如何面对日益复杂的网络环境，是每个人都无法回避的课题。

“评论罗伯特”并不是第一个出现在社交媒体上的实名机器人。去年11月底，马斯克的人工智能公司xAI宣布推出其首款产品GroK——一款对标ChatGPT的聊天机器人，它具有普通模式和有趣模式，可以实时访问X（原推特）的数据。清华大学新闻学院教授、元宇宙文化实验室主任沈阳告诉潮新闻记者，GroK未来或许会连接特斯拉的汽车，“不仅是一个评论机器人，而且是一个具身智能。”

像评论罗伯特一样的社交媒体机器人，正积极地参与公众讨论。随着大模型技术的兴起，网络舆论空间向人机共生进一步迈近。复旦大学新闻学院教授、上海传媒与舆情调查中心副主任周葆华认为，类似的机器人将会在不同的应用场景下越来越多地出现。

周葆华指出，这是一把双刃剑：一方面，社交机器人能够发挥陪伴和解答的功能，在解决社交需求、活跃社交空间上起到重要作用。“比如老年人的情感慰藉、科普传播、辟谣等，都可以用到。”然而，这也意味着，如果不加以规制，机器人也可以传播虚假信息，骚扰人类用户，甚至引发网络暴力。

当技术飞速发展、它的话语权变得越来越强大，怎样实现智能向善、伦理先行，成了亟待解决的问题。周葆华表示，社交机器人已经成为折射人类公共舆论的一种镜像。“尽管我们无法精确地知道它用怎样的规则复刻人类的表达和情感。但因技术的存在而简单地进行应用，并且不加思考地和它互动，是不可取的”。

2016年3月，推特推出的机器人Tay在上线仅一天后，迅速学会了用户发表的攻击性言论，因此被关进小黑屋。通过机器人，我们能够更好地审视自己的表达和身处的舆论环境。在国内，评论罗伯特上线后，抽象的评论也曾引发网友对于微博语言质量的担忧。

“当机器产生的内容大量增加，怎样让网友享受到更高质量的信息，是必须考虑的问题”。沈阳向潮新闻记者表示，平台投放社交机器人应当遵循告知原则。阿布也提醒，如果社交机器人的投放不加限制，10年之后，互联网平台上将充斥着AI生成的内容，而大模型的发展也将陷入闭环——用自己生成的数据来训练自己，这可能对我们的语言系统和社交环境带来极大的冲击。

周葆华提出，在技术和商业力量的推动下，由人类进行设计和身份设定、将人类活动作为学习教材的评论机器人嵌入社会后，技术的中立性或成为悖论。目前，对于通用人工智能发展对社会的影响，我国还没有形成跨学科的深度讨论。

他认为，在当前的环境下，想要建立一个比较理想的网络空间，需要多方力量的协作。“一方面，新闻媒体需要发挥定海神针的作用，另一方面，个体网民也需要增强表达素养，促进多元舆论空间的形成。”

来到大模型时代的我们，正处在漩涡的中心。“有个别专家研究，到2026年，机器产生的数据量将高于人类产生的数据量”，沈阳说。人可能成为机械化的水军，而机器也可以变成高度智能的拟人，我们正跋涉在一条探索人类价值的长路上。

更多新闻

突发！拜登下令，美军开展大规模报复
警惕这个骗局！5万余人上当
浙江发放5800万元消费券！这些地方能用→
最高法出手，高价彩礼能否走向终结？
多地封路、停运、景区关闭！浙江也将加入“冰雪群聊”……
家庭养老床位，是张什么“床”？
嘉兴“千亿俱乐部”再添新成员！
下月起，你可能会收到或补缴一笔钱

来源：潮新闻执笔潘璐

编辑：薛妍辰

关注！

评论机器人“入侵”社交网络，把我们推向哪一条河流

推荐体验

相关资讯

谷歌 VS OpenAI：当搜索霸主和屠龙少年迈入同一条河流

英伟达能否成为搅动移动机器人市场的一条“鲶鱼”？

AI智能潜在威胁，黑客利用AI聊天机器人轻松入侵网络

评论罗伯特，又一个抽象机器人

当“ChatGPT”为我们指明了一条完美的人生

近期资讯

5分钟搞懂 Golang noCopy策略

Pandas数据导出：CSV文件

Kubernetes 网络策略详解与 Pod 间访问限制

初步认识顺序表和链表

并发编程 - 死锁的产生、排查与解决方案

Elasticsearch：使用 Ollama 和 Go 开发 RAG 应用程序

从零开始学Java-单列集合：List

从零开始学Java-单列集合：Set

Spring Boot中RabbitMQ配置踩坑记录：当自定义配置遇上自动配置

关于mac笔记本谷歌浏览器、edge 浏览器等app程序意外退出问题

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响