麻省理工学院本周展示了一种训练机器人的新模型,旨在解决模仿学习在引入小挑战时可能会失败的问题。研究人员指出,模仿学习在照明、不同环境或新障碍等情况下可能会失败,因为机器人根本没有足够的数据来适应。

该团队寻求像 GPT-4这样的模型来寻找一种强力数据方法来解决问题。他们引入了一种名为异构预训练变压器(HPT)的新架构,该架构将来自不同传感器和不同环境的信息汇集在一起。然后使用变压器将数据汇总到训练模型中。变压器越大,输出越好。

用户可以输入机器人设计、配置和他们想要完成的工作,然后使用新模型训练机器人。研究人员表示,这种方法可以实现机器人策略方面的突破,就像大型语言模型一样。

这项研究的部分资金来自丰田研究院。去年,丰田研究院在 TechCrunch Disrupt 上首次展示了一种一夜之间训练机器人的方法。最近,该公司达成了一项具有里程碑意义的合作伙伴关系,将把其机器人学习研究与波士顿动力硬件结合起来。

卡内基梅隆大学副教授戴维·赫尔德表示:“我们的梦想是拥有一个通用的机器人大脑,你可以下载它并使用它,而无需任何训练。虽然我们还处于早期阶段,但我们将继续努力,希望规模化能带来机器人策略方面的突破,就像大型语言模型一样。”