Meta最新触觉机械手登Science子刊封面，操作未知物体精度最高提升94%

作者：量子位发布时间：2024-11-14

现在，随便丢给机械手一个陌生物体，它都可以像人类一样轻松拿捏了——

除了苹果，罐头、乐高积木、大象玩偶、骰子，都不在话下：

这就是来自Meta FAIR团队最新的NeuralFeels技术，通过融合触觉和视觉，机械手可以更精确地操作未知物体，精度最高提升了94%！

这项研究还登上了Science Robotics的封面，团队同时也公开了包含70个实验的新测试基准FeelSight。

如何让机械手精确操作未知物体？

让机械手拿取常见的魔方、水果等早已是基操，但如何让机器人更好地操作未知物体一直是一个研究难题。

一个重要原因是目前的机械手训练都太过于依靠视觉，并且仅限于操作已知的先验物体，而现实中很多时候物体都会受到视觉遮挡，导致训练往往进步缓慢。

对此，团队研发出一种名为NeuralFeels的创新技术，为机器人在复杂环境中的物体感知与操作带来了新的突破。

这究竟是怎么做到的呢？让我们来一起看一下技术细节——

融合了触觉的多模态感知

NeuralFeels技术的创新之处在于结合了视觉和触觉，通过多模态融合的方式，让机器手能够对未知物体持续进行3D建模，更精确地估计手持操作中物体的姿态和形状。

具体的处理流程如下图所示，前端实现了视觉和触觉的鲁棒分割和深度预测，而后端将此信息结合成一个神经场，同时通过体积采样进一步优化姿态。

而在遮挡视角下，视觉与触觉融合有助于提高跟踪性能，还可以从无遮挡的局部视角进行跟踪。团队在摄像机视角的球面上量化了这些收益。

从下图中可以观察到，当视觉严重遮挡时，触觉的作用更大，而在几乎没有遮挡时，触觉会发挥微调作用。

前端深度学习策略

首先来看看NeuralFeels技术的前端（Front end），它采用了基于深度学习的分割策略和触觉Transformer，可以精确提取目标对象深度。

用运动学分割一切

神经优化非常依赖分割对象的输入深度，所以团队将前端设计成能够从视觉中鲁棒地提取对象深度的形式。深度在RGB-D相机中是现成的，但为了应对严重遮挡的问题，团队还引入了一种基于强大视觉基础模型的动力学感知分割策略。

触觉Transformer

最近有研究表明，在自然图像中使用ViT进行密集深度预测更有效，于是团队提出了一种触觉Transformer，用于通过视觉触觉预测接触深度，这个Transformer完全在模拟中训练，可在多个真实世界的DIGIT传感器上通用。机械手可以用嵌入式摄像头直接感知发光的胶垫，通过监督学习获得接触深度。

后端姿势优化

NeuralFeels的后端（Back end）部分通过使用Theseus中的自定义测量因子，将前端的中间输出转化为非线性最小二乘问题进行优化。

形状和姿态优化器

后端模块从前端模块得到中间输出，并在线构对象模型。这个过程将交替使用来自视觉-触觉深度流的样本进行地图和姿态优化步骤。在本研究的地图优化器中，即时NGP模型的权重可以完全描述物体的3D几何结构。

神经SLAM

在现实世界和模拟中，团队构建了一个不断演进的神经SDF，它整合了视觉和触觉，并可以同时跟踪物体。下图展示了对应的RGB-D和触觉图像的输入流，以及相应的姿态重建。

神经跟踪：给定形状的对象姿态估计

当目标对象存在对应的CAD模型时，NeuralFeels可以实现优秀的多模态姿态跟踪能力。此时目标对象的SDF模型是预先计算的，NeuralFeels会冻结神经场的权重，仅使用前端估计进行视觉-触觉跟踪。

NeuralFeels大大提升了机械手性能

为了评估NeuralFeels技术的性能，研究团队在模拟和真实世界环境中进行了多次实验，涉及14种不同物体，相关测试集FeelSight也已发布！

实验中使用了多种评估指标，包括用于评估姿势跟踪误差的对称平均欧几里得距离（ADD-S），以及用于衡量形状重建精度和完整性的F分数等。

结果非常令人惊喜，NeuralFeels技术在以下3个方面都有非常出色的表现：

1.物体重建精度大幅提升

在物体重建方面，研究发现结合触觉信息后，表面重建精度在模拟环境中平均提高了15.3%，在真实世界中提高了 14.6%。

最终重建结果在模拟环境中的中位误差为2.1毫米，真实世界中为3.9毫米。这表明NeuralFeels技术能够有效地利用触觉信息补充视觉信息，更准确地重建物体形状。

2.物体姿态跟踪更加精准

在物体姿态跟踪方面，NeuralFeels技术相比仅使用视觉信息的基线方法有显著改进。

在模拟环境中，姿态跟踪精度提高了21.3%，真实世界中提高了26.6%。

在已知物体形状的姿态跟踪实验中，即使存在不精确的视觉分割和稀疏的触摸信号，该技术也能实现低误差的姿态跟踪，平均姿态误差可降至2毫米左右。

并且，触觉信息在降低平均姿态误差方面发挥了重要作用，在模拟环境中可使误差降低22.29%，在真实世界中降低 3.9%。

3.应对复杂场景表现出色

在面对严重遮挡和视觉深度噪声等具有挑战性的场景时，NeuralFeels技术同样表现非常出色。

在模拟的200个不同相机视角的遮挡实验中，平均跟踪性能提升 21.2%，在严重遮挡情况下提升幅度可达94.1%！

在视觉深度噪声模拟实验中，随着噪声增加，融合触觉信息能有效降低误差分布，使机器人在视觉信息不理想的情况下仍能准确跟踪物体姿态。

研究意义

NeuralFeels技术的创新之处在于它融合了多模态数据、并结合了在线神经场，这些技术让机器人能够在操作未知物体时实现更准确的姿态跟踪和形状重建。

而且，与复杂的传感器相比，团队使用空间感知组合所需的硬件更少，也比端到端感知方法更容易解释。

尽管目前在一些方面仍存在改进空间，如在长期跟踪中由于缺乏闭环检测可能导致小误差累积，但对于提升机械手操作精度的效果非常显著，

未来，研究人员计划进一步优化技术，例如通过基于特征的前端获取更粗略的初始化，加入长期闭环检测以减少姿态误差的累积，通过控制神经SLAM的输出进行通用灵巧性研究等。

这样一来，家庭、仓库和制造业等复杂环境中作业的机器人的性能都有可能得到极大的提升了！

参考资料：[1]https://www.science.org/doi/10.1126/scirobotics.adl0628[2]https://suddhu.github.io/neural-feels/

本文来自微信公众号“量子位”，作者：奇月，36氪经授权发布。

近期资讯

2024年开放式耳机的天花板，南卡OE Pro2蓝牙耳机新体验

当下，随着人们对生活私密性要求越来越高，蓝牙耳机成为了大众必不可少的出行工具，同时随着蓝牙耳机的不断更新迭代，种类款式也是各式各样。我最近几年也是用过不少，有入耳式的、半入耳式的、骨传导和耳夹式的，随着不同耳机的佩戴，体验也是颇多，不同耳机不同痛点，入耳式、半入耳式和耳夹式带久了都会出现耳朵疼，甚至出现头疼的感觉，骨传导有横梁对头型有要求，且不可调节佩戴位置，多多少少都不是很完美。近期刚入手一款开放式耳机南卡OE Pro2，从佩戴的舒适度、音质的效果来看，还是比较满意的，今天就来说一说我的真实感受吧。其实

数码猎鹰 2024-11-08

助力国产汽车芯片“从有到优”，纳芯微出席全球新能源汽车合作发展（上海）论坛

10月31日至11月1日，由中国电动汽车百人会举办的全球新能源汽车合作发展（上海）论坛（GNEV2024•Shanghai）正式召开。论坛以“推动新能源汽车全球合作与可持续发展”为主题，邀请来自全球各国的政府领导、专家学者、企业家，探讨协同共建高度国际化的新能源汽车合作生态的方向和路径。百人会理事成员，纳芯微创始人、董事长、CEO王升杨应邀出席大会，并以“国产芯片公司在全球新能源汽车生态中的破局思考”为话题，发表了精彩演讲，向与会嘉宾分享了国产汽车芯片企业视角下的观点和洞见。 [图片] 纳芯微创始人、

纳芯微电子 2024-11-08

【111】核爆模拟-任何地点/当量模拟核爆威力

核武器作为人类文明现阶段的终极兵器自诞生之日起，就如同达摩克里斯之剑一样高悬于人类头顶。今天分享的网站“Nuke Map”可以展示核爆炸的即时影响，如火球半径和冲击波，还能估算出辐射和热辐射对人类和环境的长期影响。这个网站设计旨在提高公众对核武器潜在破坏性的认识，并通过直观的模拟帮助人们理解核爆炸的严重后果。地址：参见文末长图“Nuke Map”提供了一个交互式的地图，我们可以通过拖动标记或输入城市名称来选择目标地点。接着，再选择合适的核弹当量，以模拟不同规模核武器爆炸的破坏力，网站默认提供了许多历史上有

ONET一站 2024-11-08

C语言数据类型大全（新手必看）

在 C语言的世界里，数据类型就像是各种不同的容器，它们决定了数据的存储方式、取值范围以及能够进行的操作。对于初学者来说，理解和掌握 C语言的数据类型是构建坚实编程基础的关键一步。 C语言提供了丰富多样的数据类型，以满足不同的编程需求。首先要明确的是，数据类型可以分为【基本数据类型】和【复合数据类型】两大类：基本数据类型是构成程序的基石；复合数据类型则是在基本数据类型的基础上构建起来的，使我们能够更有效地组织和处理数据。C语言基本数据类型首先，让我们来了解一下 C 语言中的基本数据类型。基本数据类型

数据结构教程C语言版 2024-11-08

打印机驱动无法使用，多个方法教你解决（含打印机驱动修复教程）

打印机是我们日常办公中常用到的设备之一，它可以帮助我们将合同、课件、简历等文件打印出来，作为纸质版的资料。电脑连接打印机，需要安装对应的打印机驱动，但如果出现异常情况的话，那么是无法正常使用的，如果你检测到你的打印机或打印机异常，无法正常使用，那么可以参考以下内容进行分析与解决！打印机驱动异常原因一：驱动程序不兼容打印机驱动需要结合自己的电脑系统版本和打印机型号进行下载与安装，如果你下载安装的驱动程序不兼容，那么也会导致打印机驱动无法使用解决方法：确定自己的电脑系统版本和打印机型号，前往打印机制造商的官方

金舟软件 2024-11-08

中国歼-15T舰载战斗机

2024年11月6日，歼-15T重型多功能舰载机飞抵珠海，参加将于11月12日至17日举行的珠海航展，这也是海军战斗机首次参加航展。 [图片] 歼-15T属四代半重型舰载机，机载设备先进，作战能力强，将成为中国海军航母编队主力战机。歼-15T与歼15的区别：起落架歼-15T具备弹射起飞和滑跃起飞两种起飞方式（弹滑一体），歼-15T前起落架比歼-15更加粗壮，前起落架上增加了弹射拖曳杆和用于安装牵引限位杆的部件。 [图片] 牵引限位杆用于固定准备弹射的舰载机，防止舰载机解除刹车后发生位移。在完成弹射前检

洪庭说航空 2024-11-08

2024年法国乘用车销量下滑，国产品牌在法国车市的接受度如何？

[图片] 2024年法国乘用车市场持续呈现出销量下滑的态势。10月，法国乘用车销量约为13.6万辆，同比下降11.1%；1至10月累计销量约140.1万辆，同比下降2.8%。 [图片] 自2024年5月至10月，法国乘用车销量已连续6个月同比下降，10月的13.6万辆销量处于这一阶段的波动之中，前 10个月的月均销量为14.0万辆，其中6月最高达到18.2万辆，8月最低仅8.6万辆。 [图片] 从更长期的视角来看，2017至 2019年法国乘用车销量均值约222.5万辆，2020至2023年销量均值约16

NV77 2024-11-08

金舟软件 2024-11-08