为什么给机器人装上昂贵的触觉传感器，反而让它变笨了？

春翌岍 • 2025年12月04日 07:59 • 综合 • 阅读 1

这项工作由伊利诺伊大学香槟分校 (UIUC)、哈佛大学、哥伦比亚大学和麻省理工学院 (MIT) 的合作完成。论文标题：Multi-Modal Manipulation via...

这项工作由伊利诺伊大学香槟分校 (UIUC) 、哈佛大学、哥伦比亚大学和麻省理工学院 (MIT) 的合作完成。

论文标题：Multi-Modal Manipulation via Policy Consensus
论文链接：https://arxiv.org/pdf/2509.23468
主页链接：https://policyconsensus.github.io/

为什么特征拼接 (Feature Concatenation)会在机器人感知和决策中失效？

想象一下，你在黑漆漆的背包里找钥匙。你的眼睛此时毫无用处，全靠指尖的触觉，这对你来说轻而易举，但在机器人领域，这却是一个非常困难的问题。

残酷的真相：目前的机器人学习主流的多传感器融合的算法（Feature Concatenation）在处理这种任务时彻底失败了。我们的实验数据显示，当你给机器人加上触觉数据试图让它更聪明时，它的抓取成功率竟然从 35% 暴跌至 5%！为什么？因为传统的方法把偶尔出现的关键触觉信号当作了 “噪音” 直接过滤掉了。

当前方法的局限性

目前的多模态机器人学习方法通常使用特征拼接 (Feature Concatenation)：提取所有传感器的嵌入 (embeddings)，将其拼接成一个大向量，然后输入到一个单一的神经网络策略中。

这种方法看似合理，但存在两个根本缺陷：

问题 1：稀疏模态被视为噪声

例如，一个机器人从不透明袋子中取记号笔的任务。90% 的过程中依靠视觉接近，但一旦进入袋子，视觉变得无用，触觉变得至关重要。
特征拼接会将统计上罕见的信号（触觉）视为噪声。在训练中，网络会降低触觉信息的权重，专注于总是活跃的视觉特征。
我们的实验结果：在遮挡抓取任务中，RGB + 触觉的拼接基线仅达到 5% 的成功率，而仅使用 RGB 却有 35%。增加触觉信息反而因其被视为干扰噪声而降低了性能！

问题 2：无法灵活添加或移除模态

特征拼接缺乏模块化。如果想添加新传感器或移除故障传感器，必须从头开始重新训练整个策略，因为所有模态在特征层面紧密耦合。
这导致了昂贵的重训练成本，且系统在单个传感器故障时会发生灾难性故障。

我们的解决方案：组合策略 (Compositional Policies)

我们的解决方案是重新思考模态的结合方式。我们不将所有传感器强制输入单一网络，而是为每个模态训练单独的专家策略，并学习如何在策略层面组合它们的动作预测。

工作原理

模态特定专家 (Modality-Specific Experts)：为每个感官模态（RGB、触觉、点云等）训练作为扩散策略实例化的基于能量的策略表示。每个专家专注于自己的感官流，互不干扰。即使是 “稀疏 ” 模态（如触觉）也有自己的专用网络，使其能高度专注于接触动力学。
模态内分解 (Intra-Modality Factorization)：在模态内部进一步分解为互补的子策略。例如，视觉可分为粗略几何推理和细粒度细节；触觉可分为初始接触检测和持续力控制。
学习共识权重 (Learn Consensus Weights)：一个路由器网络 (Router) 学习预测共识权重，决定每个模态对最终动作的影响程度。

组合式策略框架概述

为什么这能解决问题

解决稀疏性：每个专家学习自己的动作分布，互不干扰。触觉专家不再与视觉竞争表示模型的表征能力，从而在富含接触的操作中变得高度专业化。

模块化设计：专家是独立训练的。添加新传感器只需训练一个新的专家，并使用固定权重或快速微调将其与现有专家组合，无需重训练整个系统。

简单的实现（implementation）方式：组合多个策略对应于概率分布相乘，在扩散模型（基于分数的能量模型）中，这等同于简单的分数函数相加 (summing score functions) 。

增量学习：即插即用的传感器

为了展示模块化，我们完全独立地训练了 RGB 和触觉策略，然后使用固定的相等权重将它们组合，没有进行任何联合训练 。

尽管从未一起训练，组合后的策略成功完成了单独策略都无法处理的遮挡记号笔抓取任务。这对于现实世界的部署（传感器逐步添加或更换）具有深远的意义。

鲁棒性与自适应性

运行时扰动：在执行过程中突然抢走物体，机器人能适应并完成任务。

传感器损坏：遮挡一个摄像头模拟故障，路由器简单地将权重转移到剩余的功能传感器上，表现保持稳定。

物体重新定位：移动任务相关物体，策略能成功泛化。

统计结果对比

我们使用了配备双 RealSense 摄像头和 FlexiTac 触觉传感器的 UR5e 机器人进行验证。

RLBench 模拟任务：在四个操作任务上，我们的方法平均成功率为 66%，显著优于单模态策略 (49%) 和特征拼接 (56%) 。

真实世界：

遮挡记号笔抓取（occluded marker picking）：我们的方法成功率为 65% ，而 RGB-only 为 35%，拼接方法仅为 5%（拼接方法反而没法很好的利用触觉确定物体是否被抓住）。
勺子重定向 (Spoon Reorientation)：一种灵巧的手内操作任务。我们的方法成功率为 75%，拼接方法仅为 21% 。
拼图插入 (Puzzle Insertion)：需要毫米级精度。我们的方法任务成功率为 52%，拼接方法为 40% 。

总结

通过从特征级拼接转向策略级组合，我们为模态稀疏性问题提供了一个系统性的解决方案，同时实现了增量学习和鲁棒部署。我们的 core insights 很简单：让每个模态拥有自己的 “专家” 并学习各自的相对影响力，而不是将所有传感器强制输入单一网络。

本文来自作者[春翌岍]投稿，不代表视听号立场，如若转载，请注明出处：https://m.stddy.com/zheh/202512-61708.html

1 4

本文作者

春翌岍签约作者

329 文章

3973673 评论

1 粉丝

我是视听号的签约作者[春翌岍],本篇文章《为什么给机器人装上昂贵的触觉传感器，反而让它变笨了？》主要讲述了:这项工作由伊利诺伊大学香槟分校 (UIUC)、哈佛大学、哥伦比亚大学和麻省理工学院 (MIT) 的合作完成。论文标题：Multi-Modal Manipulation via...

百科栏目

沈阳疫情最新数据消息/沈阳疫情最新情况?

沈阳疫情如何?沈阳能否正常进出：近来沈阳仍然可以正常进出，但由于当前存在疑似病例且正在排查中，建议非必要不要前往沈阳。对于需要进出沈阳的人员，应密切关注疫情动态和防控政策，遵守相关规定，做好个人防护。综上所述，沈阳当下并未封城，但疫情形势仍然需要密切关注。建议广大市民和游客保持警惕，做好个人防护，

妙白
2025年07月08日
106
生活经验

胜率设置方法“微乐手机麻将助赢神器（专用辅牌神器免安装）

速来体验神器!人人燕赵麻将有什么规律(辅牌器插件购买)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”人人燕赵麻将有什么规律是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的

晁訾言
2025年08月29日
84
百科栏目

实测辅助“程序麻将app下载安装（助赢神器通用版）

速来试试神器!长乐互娱麻将有没有猫腻(有什么规律)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”长乐互娱麻将有没有猫腻是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户

静风
2025年08月31日
69
作者专栏

终于发现了“麻将机按程序多少钱（助赢神器通用版）

这软件超厉害!微乐甘肃麻将怎么可以胡牌几率高(怎么调胜率)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐甘肃麻将怎么可以胡牌几率高是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神

尔安
2025年09月05日
64
百科栏目

胜率设置方法“家用麻将机可以调程序吗（助赢神器通用版）

这软件太神了!微乐双扣怎么能分到好牌(怎么才有好牌)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐双扣怎么能分到好牌是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用

初阳
2025年09月06日
63
作者专栏

实测辅助“微信微乐小程序怎么提高胜率（助赢神器通用版）

软件神器登场!同城游打拱确实真的有挂(发牌有什么规律吗)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”同城游打拱确实真的有挂是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要

雁风
2025年09月24日
59
生活经验

教你爆炒猪肝的家常做法，口感鲜嫩香辣入味，下酒又下饭

爆炒猪肝。·清洗干净的猪肝放入辣椒面、料酒、生抽、胡椒粉、酱油、鸡粉、姜片，搅拌均匀腌制15分钟。·锅中的油烧热放入猪肝爆炒一分钟，放入自己腌制的泡菜，放小米辣、姜片、蒜末继续爆炒七上八下，再放入酱油和白糖爆炒2分钟起锅。

哀静
2025年10月14日
49
游戏攻略

适当的运动有益于生的长寿

生活就像一场马拉松，每个人都在奋力奔跑。有人一马当先，有人后来居上。2023年，全球有超过10亿人参与各类运动，其中跑步爱好者占比高达30%。这组数据背后，隐藏着怎样的健康码？跑步，究竟给普通人带来了什么改变？清晨五点，城市还在沉睡，公园里已经响起脚步声。张先生，一位普通上班族，坚持晨跑三年。体重下

仍红会
2025年10月31日
43
新闻资讯

卡其色呢子大衣长裙气质

都被你看光了，点点小爱心吧！

幼琴
2025年11月23日
20
知识分享

实测分析“微乐福建麻将怎么提升赢的概率”（详细辅助教程）-今日头条

神器功能超凡!微信小程序广东雀神麻将辅助器下载(有没有猫腻)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微信小程序广东雀神麻将辅助器下载是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅

神都未醒
2025年11月06日
38

发表回复

本站作者后才能评论

评论列表（4条）

春翌岍 2025年12月04日

我是视听号的签约作者“春翌岍”！

回复
春翌岍 2025年12月04日

希望本篇文章《为什么给机器人装上昂贵的触觉传感器，反而让它变笨了？》能对你有所帮助！

回复
春翌岍 2025年12月04日

本站[视听号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
春翌岍 2025年12月04日

本文概览：这项工作由伊利诺伊大学香槟分校 (UIUC)、哈佛大学、哥伦比亚大学和麻省理工学院 (MIT) 的合作完成。论文标题：Multi-Modal Manipulation via...

回复

为什么给机器人装上昂贵的触觉传感器，反而让它变笨了？

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们