Meta AI 的这些新技术，让机器人拥有「触觉」

作者：爱范儿发布时间：2024-11-05

触觉加持

无限类人

人工智能机器人发展到今天，其拥有「视觉」或者「听觉」早已经见怪不怪。毕竟，这两种感官几乎是人类感知物理世界最重要的渠道。

而 Meta AI 的基础人工智能研究团队（FAIR）近日公布的新技术，则为机器人赋予了「触觉」。对此，Meta 的愿景是使 AI 能够「更丰富地了解世界」并「更好地理解和模拟物理世界」。

毫无疑问，这些新技术让机器人又多了一种与世界互动的方式，也让其在「类人」的道路上又向前了一步。

图片来自：NewsBytes

Meta 正在与美国传感器公司 GelSight 和韩国机器人公司 Wonik Robotics 合作，开发了一系列新技术，致力于将触觉传感器商业化，并将其用于人工智能当中。

这些新技术包括三个研究工具——「Sparsh」、「Digit 360」和「Digit Plexus」，专注于触觉感知、机器人灵巧性和人机交互。此外，Meta 还引入了「PARTNR」，这是一种新的基准测试，用于评估人机协作中的规划和推理。

需要注意的是，这些新技术目前并未为消费者推出，而是面向科学家和研究人员的。

图片来自：Techopedia

Sparsh是第一个用于基于视觉的触觉感知的通用编码器模型，由华盛顿大学和卡内基梅隆大学合作开发。

听起来似乎有些抽象，既然是「触觉」，为什么又「基于视觉」呢？

实际上，传统方法依赖于特定任务和传感器的手工模型，其需要将物体的「触摸参数」（例如力量、摩擦等等）打包成「感觉标签」喂给机器人，相当于告诉机器人什么是「轻轻地拿」或者「用力地推」。

然而这种方法比较麻烦，因为需要为每个不同的任务和不同的传感器收集很多这样的标签数据。

Sparsh 则通过自我监督学习（SSL）从经验中自主学习，不需要告诉它每个动作对应的标签。其在一个包含 460000 多个触觉图像的大型数据集上进行预训练，这就像是让机器人看很多不同的物体和场景，然后自己学习如何识别和处理这些物体。

简单来说，Sparsh 就像是让机器人通过看大量的图片和视频来自学如何「感觉」物体，而不是通过人工给它的「感觉」打标签。这样，机器人就更容易学会如何在不同的任务中使用不同的触觉传感器了。

有趣的是，「Sparsh」这个名字源自梵语，意为「触摸或接触感官体验」，这与它处理数字化触觉信号并实现触摸感知的功能非常贴切。

图片来自：Meta

Digit 360是由 Meta 与 GelSight 公司联合开发的一种人造手指形状的触觉传感器，它通过以人类级别的精度对触摸进行数字化，能够提供丰富而详细的触觉数据。

Digit 360 配备超过 18 种传感功能，允许研究人员结合各种传感技术或者分离单个信号以深入分析每种模式。

它可以检测空间细节的微小变化，能够捕获小至 1 毫牛顿的力，并且包含多种传感模式，可以感知振动、热量甚至气味，性能明显优于以前的传感器。

Digit 360 触觉传感器（右）. 图片来自：Meta

Meta AI 团队还为其开发了一种宽视场的触摸感知专用光学系统，由超过 800 万个传感器单元（taxels）组成，用于捕捉指尖表面的全向变形。

此外，借助设备上的人工智能加速器，Digit 360 能够快速处理信息，对触摸刺激做出反应，可以充当机器人的周围神经系统。这一设计的灵感来源于人类和动物的反射弧。

显然，除了提高机器人的灵活性以外，这款传感器在医学、假肢、虚拟现实和远程交互等领域都有广阔的应用前景。

图片来自：Meta

Meta 在博客中说道：

人手非常擅长向大脑发出从指尖到手掌的皮肤触摸信息，这使得其在做出决定时能够激活手部肌肉，例如如何在键盘上打字，或者与过热的物体交互。实现嵌入式人工智能需要机器人手上的触觉传感和电机驱动之间的类似协调。

基于这个理念，Meta AI 与 Wonik Robotics 合作，提出并建立了一个标准化软硬件平台 Digit Plexus。

它允许将各种指尖和皮肤触觉传感器（例如 Digit、Digit 360 和 ReSkin）集成到一个机器人手中，并通过一根电缆将触觉数据编码并传输到主机计算机中，以实现无缝数据收集、控制和分析。

Plexus 系统的设计旨在简化机器人应用的开发，特别是对于那些需要精细触觉反馈的应用。通过使用 Plexus，开发者可以更容易地将触觉传感器技术集成到他们的机器人项目中，从而提高机器人的灵巧性和对物理世界的感知能力。

图片来自：Techcrunch

值得一提的是，Meta 与 Wonik 的下一步合作重点是开发 Wonik 的新一代 Allegro Hand，这是一款配备 Digit 360 等触觉传感器的机器人手，它将在 Digit Plexus 平台上运行。

图片来自：XELA

为了研究家庭活动中的人机协作，Meta 在 Habitat 3.0（一个用于研究家庭环境中人机协作任务的模拟平台）的基础上，发布了人机协作规划和推理任务基准 PARTNR。

PARTNR 是同类中最大的基准，包含 100000 个自然语言任务，涵盖 60 栋房屋和 5800 多个独一无二的对象。该基准的目标是评估大型语言和视觉模型（LLMs / VLM）通过人机交互工具与人类协作的性能。

通过提供标准化基准和数据集，Meta 表示「希望它能使机器人的研究不仅能够独立运行，而且能够围绕人类运行，使它们更加高效、可靠，并且适应每个人的喜好」。

图片来自：LinkedIn

让机器人拥有「触觉」，并不是一座「空中楼阁」。

这些机器人对外界变化拥有远超人类的敏感度，配合高效的软硬件协作系统，他们将会在外科手术或者精密仪器制造场景中大有用武之地。

其实，不仅「视觉」、「听觉」和「触觉」，宾夕法尼亚州立大学的研究人员已经在人工智能模型模拟出了「味觉」；同时，一家名为 Osmo 的公司已经教会人工智能模型如何模仿远优于人类的「嗅觉」。

也许未来的机器人能够在感官方面完全「复刻」人类。只是他们最好不要再拥有逼真的「人形」，否则，恐怖谷效应要犯了。

本文来自微信公众号“爱范儿”，作者：范津瑞，36氪经授权发布。

　在中国有经常居所或者营业所的外国人、外国企业和外国其他组织在专利权的保护上可以享受国民待遇，即与本国国民一样有权申请专利，从而获得专利保护。那么，外国人可在中国申请专利的情况有哪些呢? [图片] 以下情况外国人可以依照《专利法》在我国申请专利： (1)外国人的所属国与我国签订的双边协议规定互相给予对方国民以专利保护的。 (2)外国人的所属国和我国共同参加的国际条约规定互相给予对方国民以专利保护的。 (3)尽管外国人所属国和我国既没有签订双边协议，又没有共同加入国际条约，但对方在专利法中规定或者在实践中依

阿鱼编辑 2024-10-31

以千里续航见证豪华新标杆——别克GL8陆尊PHEV试驾品鉴之旅长沙篇

10月22日，别克GL8 陆尊PHEV与媒体朋友们一起，在长沙开启了一场为期三天两晚的试驾品鉴之旅。作为MPV领域的定义者，别克GL8陆尊PHEV承载着25年豪华MPV的造车底蕴，以及超过200万用户的信赖，踏上了这条极具意义的长续航征程。这趟旅程途径安化、德夯大峡谷及凤凰古城，全程长达1370公里，涵盖多种路况，全面模拟日常用车场景，全方位体验别克GL8陆尊PHEV——长续航插混新豪华公务舱卓越的综合性能。 [图片] 活动嘉宾们在4S店内聆听了产品体验官对别克GL8陆尊PHEV细致的讲解，通过视频和实操

咩鲜森老司机 2024-10-31

期待梯控门禁系统在更多领域发挥作用，为人们的生活和工作带来便捷、高效、安全的体验

多奥门禁梯控系统融入电梯，多重验证保障安全，减轻物业负担。由控制器、读卡器等构成，多样控梯方式适应不同场景，广泛应用于智能小区等，需定期维护更新。梯控门禁系统通过门禁装置管理电梯权限，应用无源干接点技术，支持多元化身份验证，实现楼层控制、数据监控与智能调度。广泛应用于各类建筑，未来将与物联网、大数据融合，提升电梯安全与效率。门禁梯控，即电梯门禁控制系统（Duoao Elevator Door Access Management System），是一种集成在电梯系统中的安全管理系统。以下是多奥对门禁梯控

多奥科技 2024-10-31

4.0高性能发声单元，音质新突破，南卡OE Pro2无线蓝牙耳机

在忙碌的生活中，运动是最好的解压方式，我下班经常到附近公园跑跑步，释放一天工作压力。当然，运动过程肯定缺少不了音乐陪伴，所以最近我就入手南卡OE Pro2开放式耳机，这款耳机不仅音质出色，佩戴起来舒适度也很好，下面我就跟大家分享一下使用感受。打开南卡OE Pro2的包装盒，一股简约而优雅的气息扑面而来。包装采用了以清新白色为主调的设计风格，搭配灰色的装饰带，营造出一种清新雅致、脱俗不凡的视觉感受。包装正面是一幅精美的耳机渲染图，细致的工艺让人一眼就能感受到耳机的独特魅力。顶部的灰色装饰带上印有品牌名称和型

科技陈 2024-10-31

含沙射影说的是一种动物

含沙射影一词，也作“含沙射人”，我们可能都比较熟悉了。这个词，现多用来比喻暗中攻击或陷害别人，是一个不折不扣的令人生厌的贬义词。那你知道含沙射影一词的典故吗？ [图片] 《搜神记》卷十二中曾经提到过： “有物处于江水，其名曰‘蜮’…… 能含沙射人。所中者，则身体筋急，头痛，发热。剧者至死” 在《谷梁传·庄公十八年》也曾提到： “蜮，射人者也” 在《诗经·小雅·何人斯》中也曾提到过：“为鬼为蜮” 在唐代学者陆德明的《经典释文》卷六中也曾提到： “蜮……在水中含沙射人，一云射人影” 蜮，

百科小乱炖 2024-10-31

支持ANC的头戴式蓝牙耳机，更有小金标认证，QCY H3 Pro体验

平时听音乐、看视频，大家都想获得更悦耳的音质体验，这时候蓝牙耳机就是性价比更高的一种方案，同时因其无线束缚、便携性高的特点，随时拿出来就能用。更不用说如今国产品牌的蓝牙耳机升级迭代速度非常快，百元的价位就可以获得非常精彩的音质表现，比如我目前用的这款QCY H3 Pro，作为一款头戴式蓝牙耳机，不仅有着时尚的设计，还兼具ANC、小金标等超规格的配置和认证，成为了我近期的音乐伴侣。 [图片] [图片] [图片] [图片] QCY H3 Pro的外观设计简约大气，且易于收纳，虽然是头戴式耳机，但外出携带会很方

科技思想 2024-10-31

发动机转速表有什么用？忽略了这些，发动机可能随时报废

发动机转速表有什么用？忽略了这些，发动机可能随时报废！在汽车驾驶舱内，两大显著的仪表盘占据了我们的视线：车速指示器与发动机转速显示器。车速指示器，作为驾驶者频繁关注的对象，帮助我们避免超速行驶。相比之下，发动机转速显示器或许常被忽视，尤其对于自动挡车辆驾驶者而言，似乎其存在并无实际意义。编辑搜图转速显示器所揭示的，是发动机每分钟旋转的圈数，这一数据在怠速时通常维持在约700转，而峰值转速可达到六七千转。电动车上未展示电机转速，暗示其非必要性；反观燃油车，转速的明确展示则凸显其重要性，具体体现在以下几个方面

钟先生汽车爱好者 2024-10-31

Meta AI 的这些新技术，让机器人拥有「触觉」

推荐体验

相关资讯

【接入ChatGPT 机器人开始拥有“灵魂”】 #机器人 #人工智能

让工业机器人拥有“AI大脑”，新一代“链主”这样做

Meta发布AI聊天机器人

新的人形AI机器人技术的发展以及最近火爆的ChatGPT为何让人感到

拥有人类情感的机器人，能算人类吗？

近期资讯

高中地理一举拿下全班第一！

样样超Pro，新十年旗舰大作一加13售价 4499 元起

小米15系列辣么多颜色你们选的什么颜色呢？

外国人在中国申请专利有哪些条件？

以千里续航见证豪华新标杆——别克GL8陆尊PHEV试驾品鉴之旅长沙篇

期待梯控门禁系统在更多领域发挥作用，为人们的生活和工作带来便捷、高效、安全的体验

4.0高性能发声单元，音质新突破，南卡OE Pro2无线蓝牙耳机

含沙射影说的是一种动物

支持ANC的头戴式蓝牙耳机，更有小金标认证，QCY H3 Pro体验

发动机转速表有什么用？忽略了这些，发动机可能随时报废

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响