HyperAIHyperAI

Command Palette

Search for a command to run...

Détection d'objets 3D cinématiques dans une vidéo monoculaire

Garrick Brazil Gerard Pons-Moll Xiaoming Liu Bernt Schiele

Résumé

La perception du monde physique en 3D est fondamentale pour les applications de conduite autonome. Bien que le mouvement temporel soit une ressource inestimable pour la vision humaine en termes de détection, de suivi et de perception de la profondeur, ces caractéristiques n'ont pas été pleinement exploitées dans les détecteurs d'objets 3D modernes. Dans ce travail, nous proposons une nouvelle méthode pour la détection d'objets 3D basée sur des vidéos monoculaires, qui utilise soigneusement le mouvement cinématique afin d'améliorer la précision de la localisation 3D. Plus précisément, nous proposons tout d'abord une nouvelle décomposition de l'orientation des objets ainsi qu'une confiance 3D auto-équilibrée. Nous montrons que ces deux composantes sont cruciales pour permettre à notre modèle cinématique de fonctionner efficacement. Collectivement, en utilisant un seul modèle, nous exploitons efficacement les cinématiques 3D issues des vidéos monoculaires pour améliorer la précision globale de la localisation dans la détection d'objets 3D tout en produisant des sous-produits utiles dynamiques de la scène (mouvement égocentrique et vitesse par objet). Nous obtenons des performances d'état de l'art pour la détection d'objets 3D monoculaire et les tâches de vue du haut oiseau (Bird's Eye View) au sein du jeu de données KITTI pour la conduite autonome.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp