雷锋网AI科技评论按:对于机器人强化学习来说,基于视觉的物块堆叠和推动是最常见的任务,为了减小训练过程的成本和安全问题,我们希望最小化训练过程中与环境交互的次数。但从相机这样复杂的图像传感器中进行高效学习却十分困难。为了解决这一问题,伯克利的研究人员提出了一种新型基于模型的强化学习方法并发表了相关文章介绍了这一成果,雷锋网AI科技评论将其编译如下。概述想象一下这样的场景:一个机器人试图通过相机影像的视觉输入来学习堆叠物块和推动物体。为了最大限度地降低成本和安全问题,我们希望能够最小化机器人的交互学习时间,但从相机这样复杂的图像传感器中进行高效学习依旧十分困难。因此本工作提出了SOLAR——一种新的基于模型的增强学习(RL)方法,它直接从视觉输入和不到一小时的交互中学习技能,包括在真正的Sawyer机械臂上执行高难度任务。据我们所知,SOLAR是解决机器人在现实世界中基于图像完成任务的最有效的RL方法。机器人使用SOLAR一个小时内学会了如何堆积木和推杯子在RL设置中,机器人通过反复试错从自己的经验中学习,以最大限度地降低与当前任务相对应的成本函数。近年来,许多具有挑战性的任务都是通过RL方法解决的,但这些成功案例大多来自无模型(model-free)的RL方法,与基于模型(model-based)的方法相比,这些方法通常需要更多的数据。然而,基于模型的方法往往依赖于精准预测未来的能力,以便规划主体的操作。对于基于图像学习的机器人来说,预测未来的图像本身需要大量的交互训练,因此我们需要解决这个问题。一些基于模型的RL方法不需要精准的未来预测,但这些方法通常会对状态进行严格的假设。LQR-FLM(linear-quadraticregulatorfittedlinearmodels,
转载请注明:
http://www.aideyishus.com/lkyy/6227.html