横扫6个SOTA,谷歌行为克隆算法登CoRL顶会,机器人干活10倍速( 三 )

文章图片
机器人受到干扰时 , 隐式BC模型的稳健行为
总的来说 , GoogleAI发现 , 与跨多个不同任务领域的最先进的离线强化学习方法相比 , ImplicitBC策略可以获得更好的结果 。
ImplicitBC可以完成很多具有挑战性的任务 , 比如演示次数少(少至19次) , 基于图像的观察具有高观察维度 , 还有高达30维的高动作维度 , 这就需要机器人充分利用自身具有的大量致动器 。

文章图片
隐式策略学习结果与跨多个域的基线进行了比较
尽管ImplicitBC目前还有其局限性 , 但使用监督学习的行为克隆仍然是机器人从人类行为例子中学习的最简单方法之一 。
该工作表明 , 在进行行为克隆时 , 用隐式策略替换显式策略可以让机器人克服「犹犹豫豫」 , 使它们能够模仿更加复杂和精确的行为 。
虽然ImplicitBC取得的实验结果来自机器人学习问题上 , 但是隐式函数对尖锐不连续性和多模态标签建模的能力可能在机器学习的其他领域也有更广泛的应用 。
参考资料:
【横扫6个SOTA,谷歌行为克隆算法登CoRL顶会,机器人干活10倍速】https://ai.googleblog.com/2021/11/decisiveness-in-imitation-learning-for.html
- VR|微信有6个设置需及时关闭,否则个人隐私可能暴露在外?别不当回事
- 物联网|微信有6个设置需及时关闭,否则个人隐私可能暴露在外?别不当回事
- IBM研发“电子舌头”,16个传感器替代上千味蕾,能辨假酒
- 全世界最小的电机,材料仅16个原子,一次充电能跑几百公里
- 小米科技|消失3年 Intel发烧U终于重出江湖:才16个核心
- 动车组|新一批复兴号智能动车组下线 在16个方面增设智能配置
- 消失3年 Intel发烧处理器终于重出江湖:才16个核心
- Intel|消失3年 Intel发烧处理器终于重出江湖:才16个核心
- |PCB板质量好坏如何判断? 分辨PCB板好坏的6个方法
- 小米科技|没有华为之后,小米的618简直全面开花,1000-6000价位,6个第一
