HyperAI超神经
2 days ago

重建4D空间智能:一项综述

Yukang Cao, Jiahao Lu, Zhisheng Huang, Zhuowei Shen, Chengfeng Zhao, Fangzhou Hong, Zhaoxi Chen, Xin Li, Wenping Wang, Yuan Liu, Ziwei Liu
重建4D空间智能:一项综述
摘要

从视觉观察中重建4D空间智能一直是计算机视觉领域一个核心但具有挑战性的任务,并具有广泛的实际应用。这些应用涵盖从娱乐领域(如电影)到具身人工智能(embodied AI)等多个方面,其中前者通常关注于重建基本的视觉元素,而后者则强调交互建模与物理真实感。在3D表示方法和深度学习架构快速发展的推动下,该领域发展迅速,已超越了以往综述的范围。此外,现有的综述很少对4D场景重建的层次结构进行系统的分析。为填补这一空白,我们提出了一种新的视角,将现有方法组织为五个逐步递进的4D空间智能层次:(1)第1层——低级3D属性的重建(如深度图、姿态图和点云图);(2)第2层——3D场景组件的重建(如物体、人物和结构);(3)第3层——4D动态场景的重建;(4)第4层——场景组件之间的交互建模;(5)第5层——引入物理定律和约束。在综述的最后,我们讨论了每一层面临的关键挑战,并指出了推动实现更丰富的4D空间智能的潜在研究方向。为了追踪该领域的最新进展,我们维护了一个持续更新的项目页面:https://github.com/yukangcao/Awesome-4D-Spatial-Intelligence。