近日,加州大学伯克利分校 BAIR 实验室的 Sergey Levine 研究团队提出了一种名为 HIL-SERL 的强化学习框架,旨在解决机器人在现实世界中学习复杂操作技能的难题。

这项新技术将人类演示和纠正与高效的强化学习算法相结合,使机器人能够在短短1到2.5小时内掌握各种精密灵巧的操作任务,例如动态操作、精密装配和双臂协作。

以前,让机器人学习新技能,那叫一个费劲,就像教一个熊孩子写作业,得手把手地教,还得一遍遍地纠正。更让人头疼的是,现实世界里各种情况复杂多变,机器人往往学得慢、忘得快,一不小心就翻车。

而 HIL-SERL 这个框架,就像给机器人请了个“家教”,不仅有详细的“教材”,也就是人类的演示和纠正,还配备了高效的学习算法,帮助机器人快速掌握各种技能。

你只需要示范几次,机器人就能像模像样地完成各种操作,从玩积木、翻煎饼,到组装家具、安装电路板,简直无所不能!

为了让机器人学得更快、更好,HIL-SERL 还引入了一种人机交互的纠正机制。简单来说,就是当机器人犯错的时候,人类操作员可以及时介入,进行纠正,并把这些纠正信息反馈给机器人。这样一来,机器人就能不断从错误中学习,避免重复犯错,最终成为一个真正的高手。

经过一系列实验,HIL-SERL 的效果那是杠杠的。在各种任务中,机器人都在短短1到2.5小时内达到了接近100% 的成功率,而且操作速度也比以前快了近2倍。

更重要的是,HIL-SERL 是第一个在现实世界中使用强化学习实现基于图像输入的双臂协调的系统,也就是说,它可以让两个机器人手臂协同工作,完成更复杂的任务,比如组装同步带这种需要高度配合的操作。

HIL-SERL 的出现,不仅让我们看到了机器人学习的巨大潜力,也为未来的工业应用和研究指明了方向。说不定,以后我们每个人家里都会有一个这样的机器人“学徒”,帮我们做家务、组装家具,甚至还能陪我们玩游戏,想想就觉得很爽啊!

当然,HIL-SERL 也有一些局限性。比如,对于一些需要长期规划的任务,它可能就显得力不从心了。 另外,目前 HIL-SERL 主要是在实验室环境中进行测试,还没有经过大规模的现实场景验证。 不过,相信随着技术的进步,这些问题都会逐步得到解决。

论文地址:https://hil-serl.github.io/static/hil-serl-paper.pdf

项目地址:https://hil-serl.github.io/