
摘要
在深度学习革命之前,许多感知算法都是基于运行时优化并结合强大的先验/正则化惩罚。计算机视觉中的一个典型例子就是光流和场景流。监督学习在很大程度上取代了显式正则化的需要。相反,它们依赖大量标注数据来捕捉先验统计信息,而这些数据并不总是容易获得的,尤其是在许多问题中。尽管优化被用于学习神经网络,但该网络的权重在运行时是固定的。因此,这些学习解决方案具有领域特定性,难以推广到其他统计上不同的场景。本文重新探讨了主要依赖于运行时优化和强正则化的场景流问题。其中的核心创新点是引入了一种神经场景流先验(Neural Scene Flow Prior),利用神经网络的架构作为新型隐式正则化器。与基于学习的场景流方法不同,我们的方法在运行时进行优化,并且不需要离线数据集——这使其非常适合部署于新的环境,如自动驾驶。我们展示了仅基于多层感知机(Multilayer Perceptrons, MLPs)的架构可以作为场景流先验使用。我们的方法在场景流基准测试中取得了竞争性的——甚至更好的——结果。此外,我们提出的神经先验通过隐式和连续的场景流表示,能够估计点云序列中的密集长期对应关系。密集的运动信息由场景流场表示,其中点可以通过积分运动向量随时间传播。我们通过累积一系列激光雷达点云展示了这一能力。