当前位置：首页|资讯|GPT-4

「社交达人」GPT-4，解读表情、揣测心理全都会

作者：新智元发布时间：2023-07-13

想象一下，您正在参加一个充满活力的鸡尾酒会，局间充满了热烈的谈话声和玻璃杯碰撞的叮当声。

此时，您作为一个悠闲的观察者，怡然自得地躲在角落里。然而，就算没有处在聚会的中心，您还是可以轻松地弄清楚不同人之间的社会关系，了解正在发生的事情，甚至通过阅读人们的言语和非言语线索来读懂明里暗里的社交信息。

如果一个LLM能够复现这种水平的社交能力呢？这不，Koko Mind就是这么个东西。

随便打开一个视频，该模型就开始分析人物表情，得出人物情绪的结论。

然后，在右侧的prompt栏还可以提出问题，让AI进一步分析视频中暗流涌动的社交谜题。

（说实话对有些人来说这都很难）

Koko Mind包含了150个复杂的多方社交互动以及自由文本问题和答案。

为了确保数据的多样性和可扩展性，并避免数据污染，所有社交互动、问题和答案均由GPT-4生成，并随后由人类专家验证。

分析数据基于三个不同的来源：

GPT-4-only：该子集仅由 GPT-4 通过提示创建。
基于电影：为了避免数据污染，这部分数据基于从2022年之后上映的电影中提取的各种场景。GPT-4负责塑造这些场景，在保留核心本质的同时添加了自己的元素。
基于 ToMi：该部分包含由模拟数据集 ToMi 支持的数据，其中涉及将物理对象移动到不同的地方，这是心理理论的经典测试。当然，这些社交互动还得被GPT-4修饰和扩展一下。

三种数据来源的占比如下：

对于每次社交互动，研究人员都会提出各种问题，旨在探讨以下几个和社交理解息息相关的方面。

心理理论：评估对其他人心理状态和观点的理解的问题。
社会规范：旨在辨别情境中的社会价值观和规范的问题。
情绪识别：旨在识别和理解上下文中的情绪元素的问题。
社会关系：关注人际动态和关系。
反事实问题：旨在探索替代结果或可能性的假设查询。
社会建议：提出与特定情况相关的建议或行动建议的问题。

研究人员以text-davinci-003 作为参考，评估了AlpacaEval后的不同模型。

其中，研究人员从上下文中删除了括号中的非语言线索（例如，紧张地喝咖啡等）。

以下则是一些有趣的要点：

在两个模型中，与Claude相比，GPT-4在识别获胜模型方面表现出更大的确定性和信心。
当上下文没有非语言线索，且交互要么完全由GPT-4生成，要么基于电影时，Claude的表现优于 GPT-4。
而如果上下文包含了非语言线索，那GPT-4总是比Claude更好。

（一种可能的解释是，GPT-4是一种多模态模型可以更好地理解额外的非语言信息。）

在博客中，研究人员绘制了表格，可以清晰的看到各个模型的表现。

结果虽然在很多方面都令人兴奋，但也有一定的局限性。首先， Koko Mind的规模相对较小，这可能会限制研究人员结论的广泛适用性和全面性。

其次， Koko Mind中的所有交互都是由GPT-4生成的，需要人工验证，这使得数据集难以扩展。

另外，虽然Koko Mind在数据集中提供了经过人工验证的答案，研究人员在评估时没有使用这些答案作为参考，并且由于这些答案是由GPT-4生成的，因此它们可能会偏向GPT-4。

未来的研究可以集中在如何评估模型上具有经过人工验证的机器生成的参考答案。

当然，虽说存在这样或那样的限制，研究人员仍将Koko Mind视为未来与社会智能、多模态语言模型等相关的研究的跳板。

参考资料

https://chats-lab.github.io/KokoMind/

本文来自微信公众号“新智元”（ID:AI_era），作者：拉燕，36氪经授权发布。

推荐体验

相关资讯

从生图到生视频全都会，天玑9400太厉害了

联发科最近发布了全新的旗舰芯片天玑9400，成为天玑系列中最新的技术结晶。这款芯片不仅延续了天玑家族的高性能血统，还在手机端首次实现了生成式AI功能。

砍柴网 2024-10-14

高效800V、5C超充、AI大模型、华为智驾，岚图新车全都会有！

日前，岚图汽车在2024春季技术沟通会上发布了800V、5C超充、AI大模型等新技术，并官宣新车型将搭载华为智能座舱、智能驾驶技术。在同样备受关注的补能方面，岚图自研的5C超级快充采用超电网正极技术、石墨快离…

AI大模型华为汽车自动驾驶

VAN有引力 2024-05-22

GPT-4的心理学概述

Q：确定能够产生80%预期结果的那20%心理学知识 A：在心理学中，有一种理论被称为"帕累托原则"或"80/20原则"，它实际上源于经济学，由19世纪的意大利经济学家维尔弗雷多·帕累托提出。这个原则表明，80%的结果通常由20%的投入产生。在心理学领域，我们可以将这个原则应用到一些基本概念和技能上。 1.自我认知（self-awareness）和自我效能感（self-efficacy）：自我认知是对自我性质的理解，对自己的能力和潜力有清晰的认识。自我效能感是个体对自己能否成功完成某项任务的信念。研究

我就是来破站学习的 2023-10-30

AI（GPT-4）如何理解黄龙江一带全都带蓝牙

问题一位韦尼克失语症患者在小区门口，由于小区工作人员对齐进入小区进行阻挠，因此对着小区的工作人员说出下面的话你有这么高速运转的机械进入中国，记住我给出的原理，小的时候。就是研发人，就研发这个东西的一个原理是阴间证权管，你知道为什么会有生灵给他运转，先位。还有还有专门饲养这个，为什么地下产这种东西，他管着他是五世同堂旗下子孙。你以为我在给你闹着玩呢，你不你不你不警察吗，黄龙江一带全部带蓝牙，黄龙江我告诉你在阴间是是那个化名，化名我小舅，亲小舅，张学兰的那个那个嫡子，嫡孙。咋的你跟王守义玩的，他是我儿子。他都

HaQi2015 2024-02-28

GPT-4已达人类资深分析师水平，成本却不到1％

摘要：5月30日消息，随着生成式AI能力的持续提升，越来越多的企业开始引入生成式AI来协助办公，甚至直接替代部分人类员工。 5月30日消息，随着生成式AI能力的持续提升，越来越多的企业开始引入

GPT-4 生成式AI

芯智讯 2023-05-30

近期资讯

“人机料法环测”全面解析-2：有什么价值？

在制造和质量管理领域，"人机料法环测"（5M1E）是一个核心概念，它涵盖了影响产品质量的六大关键因素。人机料法环测（5M1E）是指人（Man）、机器（Machine）、材料（Material）、方法（Method）、环境（Environment）、测量（Measure）。

人人都是产品经理 2024-12-28

如何轻松安装当贝市场到智能电视，获取丰富应用与内容体验

当贝市场作为一个热门的电视应用商城，很多人都想在自己的电视上安装它，以便获取更多的应用和内容。可是，很多人对安装过程感到困惑，不知道从何下手。其实，装当贝市场并不复杂，只要你按照一定的步骤进行，就能轻松搞定。下面，我就来详细讲讲怎么把当贝市场装到电视上。首先，确保你的电视是智能电视，支持安装第三方应用。

新报观察 2024-12-28

蓝色起源 New Glenn 火箭完成最终关键测试，预计 2025 年 1 月 6 日首飞

12月28日消息，杰夫・贝索斯旗下商业航空公司蓝色起源于当地时间周五对其“新格伦”（NewGlenn）运载火箭完成了首次综合静态点火测试，也是其首飞发射前的最后一次关键测试。虽然，蓝色起源顺利完成了本次关键测试，但之前计划的“2024年底发射”似乎已经来不及实现。

IT之家 2024-12-28

iPhone 17标准版将支持高刷，苹果历史首次！

我们知道，苹果的刀法非常精准，标准版机型是不会给配备高刷屏幕的。但据最新爆料，供应链物料基本确认，iPhone17标准版将支持高刷。这是苹果历史上第一次为标准版引入高刷，对于标准版来说堪称史诗级提升，日常体验大大提升。苹果从iPhone13Pro开始引入高刷，经过五年的刻意刀法，终于要在iPhone17上普及。

中关村在线 2024-12-28

嫦娥五号月球样品在北京天文馆展出

我国成为世界上第三个成功带回月球样品的国家后，公众也可以近距离观看由我国自主带回的月球样品了。12月28日下午，“问月——中国探月工程嫦娥五号月球样品展”在北京天文馆B馆一层展厅拉开帷幕。涵盖了月壤各种形态的共计0.6克嫦娥五号月球样品与公众见面，带领公众走进月球的神秘世界，深度解读月壤中的科学奥秘。

北青网 2024-12-28

小米给小米SU7车主送新年礼物：免费领四个Are you OK气门塞

快科技12月28日消息，继小米汽车官宣提前完成年交付13万辆的目标后，官方给13万多的车主发福利了！甚至雷军今年还凭借这首成名曲，成为了《歌手2024》摇人榜第一名，排名甚至超过了韩红、周杰伦等知名歌手，票数超百万。

快科技 2024-12-28

华为 nova 13/Pro、nova 12/Pro 四款手机开启鸿蒙 NEXT Beta招募

IT之家12月28日消息，时隔近四个月，华为再次宣布开启鸿蒙HarmonyOSNEXTBeta版内测用户招募。HUAWEInova13、HUAWEInova13Pro、HUAWEInova12、HUAWEInova12Pro共4款手机的用户可参与报名，截止时间为2025年1月10日15:00。

IT之家 2024-12-28

风起先进，云上制造——先进制造“链”入星辰大海

在第二届中国国际供应链促进博览会（以下简称“链博会”）的先进制造链展区，呈现了一幅群星飞天的壮阔画卷。“精密端齿”具备自定心、精度高、寿命长、重量轻等特点，非常利于发动机转子件的设计、制造、安装和维修，被广泛应用于航空航天发动机、燃气轮机、核电泵、轨道交通等领域，这是雄名航空科工股份有限公司（以下简称“雄名科工”）带来的展品之一。

中国对外贸易杂志 2024-12-28

OV米超大杯影像规格前瞻 | 红米K80宣布OTA 调整性能释放

据爆料达人数码闲聊站暗示，小米15Ultra为后置四摄①50MP一英寸主摄②50MP小底超广角③50MP3X中小底直立长焦④200MP4.3X大底潜望长焦/双微距；而OPPOFindX8Ultra后置为①50MP一英寸主摄②50MP中底超广角③50MP3X大底潜望长焦④50MP6X中底潜望长焦+多光谱摄像头；vivoX200Ultra则是...

小白测评 2024-12-28

赛西科技取得可燃气体泄露检测装置专利，能够快速对不同区域的泄露燃气进行大范围检测

金融界2024年12月28日消息，国家知识产权局信息显示，湖南赛西科技有限公司取得一项名为“一种可燃气体泄露检测装置”的专利，授权公告号CN222212103U，申请日期为2023年12月。

金融界 2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1