单张图像生成三维世界
(中国AI网 2024年12月03日)由华裔科学家李飞飞创办的空间智能公司World Lab日前分享了一项成果:只需单张图像即可生成三维世界。团队研发的人工智能系统可以允许用户进入任何图像,并以三维方式进行探索其中的世界。
除了图片本身之外,所生成的3D世界的一切都是由AI生成,而且所述项目的重点在于:生成的3D世界具有交互性。尽管目前是用WASD方向键和鼠标进行探索,但不难想象,以后用户或许可以直接通过XR头显进行探索。
场景在浏览器中实时渲染,配备了可控的camera效果和可调节的模拟景深。你甚至可以改变其中的颜色,动态调整背景光影,在场景中插入其他对象。
在过去,之前大多数生成模型预测的是像素,而这个AI系统直接预测3D场景。所以场景在生成后就会一直存在。你回头看,背后的场景不会改变。
所生成的世界遵循3D几何的基本物理规则。它们有一种坚实和深度的感觉,与其他人工智能生成的视频的梦幻性质形成鲜明对比。
当然,目前只是早期预览,而李飞飞团队正在努力优化所生成世界的大小和保真度,并尝试提供用户与它们交互的新方法。
更多信息及效果演示请访问这个页面。