HyperAIHyperAI

Command Palette

Search for a command to run...

CubifAE-3D : Cubification d'espace monoculaire pour la détection d'objets 3D basée sur un auto-encodeur

Shubham Shrivastava Punarjay Chakravarty

Résumé

Nous présentons une méthode de détection d'objets 3D à partir d'une seule image monoculaire. Partant d'un ensemble de données synthétiques, nous pré-entraînons un Auto-Encodeur (AE) RGB-to-Depth. L'embedding appris par cet AE est ensuite utilisé pour entraîner un réseau neuronal convolutif (CNN) de détection d'objets 3D (3DOD), qui est utilisé pour régresser les paramètres des poses d'objets 3D après que l'encodeur de l'AE a généré un embedding latent à partir de l'image RGB. Nous montrons qu'il est possible de pré-entraîner l'AE une fois à l'aide d'images RGB et profondeur couplées provenant de données de simulation, puis d'entraîner uniquement le réseau 3DOD avec des données réelles, composées d'images RGB et de labels de pose d'objets 3D (sans nécessiter une profondeur dense). Notre réseau 3DOD utilise une `cubification’ particulière de l'espace 3D autour de la caméra, où chaque cuboïde est chargé de prédire N poses d'objets, ainsi que leur classe et leurs valeurs de confiance. Le pré-entraînement de l'AE et cette méthode de division de l'espace 3D autour de la caméra en cuboïdes donnent leur nom à notre méthode - CubifAE-3D. Nous présentons des résultats pour la détection monoculaire d'objets 3D dans le cas d'utilisation des véhicules autonomes (AV) avec les ensembles de données Virtual KITTI 2 et KITTI.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
CubifAE-3D : Cubification d'espace monoculaire pour la détection d'objets 3D basée sur un auto-encodeur | Articles | HyperAI