李飞飞公司World Lab分享通过单张图像生成三维世界

单张图像生成三维世界

（中国AI网 2024年12月03日）由华裔科学家李飞飞创办的空间智能公司World Lab日前分享了一项成果：只需单张图像即可生成三维世界。团队研发的人工智能系统可以允许用户进入任何图像，并以三维方式进行探索其中的世界。

除了图片本身之外，所生成的3D世界的一切都是由AI生成，而且所述项目的重点在于：生成的3D世界具有交互性。尽管目前是用WASD方向键和鼠标进行探索，但不难想象，以后用户或许可以直接通过XR头显进行探索。

李飞飞公司World Lab分享通过单张图像生成三维世界第1张

场景在浏览器中实时渲染，配备了可控的camera效果和可调节的模拟景深。你甚至可以改变其中的颜色，动态调整背景光影，在场景中插入其他对象。

在过去，之前大多数生成模型预测的是像素，而这个AI系统直接预测3D场景。所以场景在生成后就会一直存在。你回头看，背后的场景不会改变。

所生成的世界遵循3D几何的基本物理规则。它们有一种坚实和深度的感觉，与其他人工智能生成的视频的梦幻性质形成鲜明对比。

当然，目前只是早期预览，而李飞飞团队正在努力优化所生成世界的大小和保真度，并尝试提供用户与它们交互的新方法。

更多信息及效果演示请访问这个页面。