挪威的初创公司1X Technologies 最近宣称,他们在为机器人开发基于人工智能的世界模型方面取得了重大进展。简单来说,这些模型就像是机器人的虚拟试验场,能够让机器在各种情境中进行测试和改进,完全不需要真刀真枪的实地测试。

1X 认为,这正是解决 “机器人难题” 的关键所在 —— 也就是如何在不断变化的环境中,可靠地评估为多种任务而训练的机器人。以一台能折叠 T 恤的机器人为例,它在50天的时间里表现不一,成就感常常转瞬即逝。

1X 表示,即便是同样的机器人型号,在环境变化时也会出现巨大的表现波动,这让进行严格的现实评估变得异常困难。

为了训练他们的世界模型,1X 收集了数千小时的视频资料,记录了他们的人形机器人 EVE 在家庭和办公室中执行各种任务的过程。通过机器学习,模型现在能够合理预测物体和环境在机器人行动下的反应。即使是那些未被明确编程的行为,模型也能生成可信的影像输出,比如学习到应避免接触人类和物体。

目前,1X 的模型已经能够处理一些复杂的物理交互,例如抓取和举起物体、打开门和抽屉,以及处理像衣物这样的可变形材料,甚至能折叠 T 恤。

他们的世界模型的核心价值在于模拟物体的互动。例如,在接下来的几代中,模型将获得相同的初始画面以及三组不同的动作来抓取箱子。在每种情况下,抓取的箱子会随着机械手的动作被提起并移动,而其他箱子则保持原位。

尽管如此,1X 也承认了一些限制。比如,模型有时难以保持物体颜色和形状的一致性,或者准确模拟物理现象。在镜子中自我识别的能力也依旧不太可靠。

尽管面临挑战,1X 依然将这些世界模型视为开发和训练通用机器人的一个里程碑。为了加速进展,该公司还通过 “1X 世界模型挑战赛” 提供数据集、预训练模型和奖金。

1X 的长远目标是直接利用世界模型进行机器人训练,这将比真实测试带来巨大的效率提升。为了实现这一目标,他们正在积极招募人工智能领域的专家。今年早些时候,1X 还成功筹集了1亿美元的资金,以推动其家用人形机器人 Neo 的市场推出,这笔资金得到了像 OpenAI 这样的行业领军人物的支持,充分展现了对1X 技术的高期待。

除了1X,英伟达也在对人形机器人进行大量投资。该公司最近推出了一种使用苹果 Vision Pro 的训练方法,英伟达的研究员 Jim Fan 认为,在未来几年内,机器人技术将迎来一个 “GPT-3时刻”。