Priorité du Flux Scène Neural

Avant la révolution de l'apprentissage profond, de nombreux algorithmes de perception étaient basés sur l'optimisation en temps d'exécution associée à une forte pénalité a priori/régularisation. Un exemple typique dans le domaine de la vision par ordinateur est le flux optique et le flux de scène. L'apprentissage supervisé a largement éliminé la nécessité d'une régularisation explicite. Au lieu de cela, il repose sur de grandes quantités de données étiquetées pour capturer les statistiques a priori, qui ne sont pas toujours facilement disponibles pour de nombreux problèmes. Bien que l'optimisation soit utilisée pour apprendre le réseau neuronal, les poids de ce réseau sont figés en temps d'exécution. Par conséquent, ces solutions d'apprentissage sont spécifiques à un domaine et ne généralisent pas bien à d'autres scénarios statistiquement différents. Cet article revisite le problème du flux de scène qui repose principalement sur l'optimisation en temps d'exécution et une forte régularisation. Une innovation centrale ici est l'introduction d'un prior de flux de scène neuronal, qui utilise l'architecture des réseaux neuronaux comme un nouveau type de régulariseur implicite (neural scene flow prior). Contrairement aux méthodes basées sur l'apprentissage pour le flux de scène, l'optimisation se produit en temps d'exécution, et notre approche n'a besoin d'aucun jeu de données hors ligne -- ce qui la rend idéale pour être déployée dans des environnements nouveaux tels que la conduite autonome. Nous montrons qu'une architecture exclusivement fondée sur des perceptrons multicouches (MLPs) peut être utilisée comme prior de flux de scène. Notre méthode obtient des résultats compétitifs -- voire meilleurs -- sur les benchmarks du flux de scène. De plus, la représentation implicite et continue du flux de scène fournie par notre prior neuronal nous permet d'estimer des correspondances dense à long terme au sein d'une séquence de nuages de points. Les informations mouvement dense sont représentées par des champs de flux de scène où les points peuvent être propagés dans le temps en intégrant des vecteurs mouvement. Nous démontrons cette capacité en accumulant une séquence de nuages de points Lidar.注释:在法语文本中,“neural scene flow prior” 作为不常见的术语,已保留英文并在首次出现时进行了标注。其他科技术语如“multilayer perceptrons (MLPs)” 使用了通用译法并标注了英文缩写。