il y a 2 mois

Détection d'objets 3D cinématiques dans une vidéo monoculaire

Garrick Brazil; Gerard Pons-Moll; Xiaoming Liu; Bernt Schiele

Résumé

La perception du monde physique en 3D est fondamentale pour les applications de conduite autonome. Bien que le mouvement temporel soit une ressource inestimable pour la vision humaine en termes de détection, de suivi et de perception de la profondeur, ces caractéristiques n'ont pas été pleinement exploitées dans les détecteurs d'objets 3D modernes. Dans ce travail, nous proposons une nouvelle méthode pour la détection d'objets 3D basée sur des vidéos monoculaires, qui utilise soigneusement le mouvement cinématique afin d'améliorer la précision de la localisation 3D. Plus précisément, nous proposons tout d'abord une nouvelle décomposition de l'orientation des objets ainsi qu'une confiance 3D auto-équilibrée. Nous montrons que ces deux composantes sont cruciales pour permettre à notre modèle cinématique de fonctionner efficacement. Collectivement, en utilisant un seul modèle, nous exploitons efficacement les cinématiques 3D issues des vidéos monoculaires pour améliorer la précision globale de la localisation dans la détection d'objets 3D tout en produisant des sous-produits utiles dynamiques de la scène (mouvement égocentrique et vitesse par objet). Nous obtenons des performances d'état de l'art pour la détection d'objets 3D monoculaire et les tâches de vue du haut oiseau (Bird's Eye View) au sein du jeu de données KITTI pour la conduite autonome.