机器人初创公司1X Technologies 开发了一种新的生成模型,可以提高仿真中训练机器人系统的效率。该公司在一篇新的博客文章中宣布了该模型,解决了机器人技术的重要挑战之一,即学习“世界模型(1X World Model)”,该模型可以预测世界如何响应机器人的动作而变化。
当机器人从相同的起始图像序列出发时,这个世界模型可以根据不同的动作提议,想象出多种未来场景。
这种能力使其能够预测复杂的物体互动,比如刚体的运动、物体掉落的效果、以及与可变形物体(如窗帘、衣物)和关节物体(如门、抽屉)的交互。
评估是构建通用机器人时一个非常实际却常常被忽视的挑战。如果一个机器人被训练去完成1000个独特的任务,那么很难判断一个新模型是否在所有1000个任务上都有所提升。环境的微小变化,比如背景和光线的变化,会让老旧的实验结果失去参考价值,尤其是在动态的家庭或办公室环境中,这种问题更加严重。
为了克服这个问题,1X采用了一种全新的方法,通过从真实传感器数据中学习,直接构建模拟器,以便在数百万种场景中评估1X的机器人政策。这种模拟器不仅可以重复测试,还能够全面吸收现实世界的复杂性。
在1X的训练过程中,1X收集了数千小时关于人形机器人在家庭和办公室中进行多种移动操作任务的数据。通过这些数据,1X的世界模型能够根据观察和动作预测未来的视频。
在不同的动作指令下,这个模型能够生成多样化的结果,展示了其对物体交互的强大模拟能力。即使不提供具体动作,该模型也能生成符合逻辑的视频,如在驾驶时识别并避免人和障碍物。
此外,模型还能够生成较长时间的任务视频,例如折叠 T 恤。
当然,1X的模型也面临一些挑战,比如在物体互动中可能无法维持物体的形状和颜色,或者在某些情况下物体会消失。
同时,对于物理定律的理解也存在一定的局限性,例如有时生成的视频中物体会悬浮在空中。
为了推动这个领域的研究,1X发布了超过100小时的矢量量化视频和预训练的基线模型,并推出了1X 世界模型挑战赛,包括多个阶段和现金奖励,旨在促进更多的研究。
划重点:
🌟 世界模型是能够预测机器人行为与环境互动的虚拟模拟器。
🤖 通过真实数据学习,模型能够在数百万种场景中进行评估,增强了机器人智能。
💰 为推动研究,推出了1X 世界模型挑战赛,并提供奖金激励。