HyperAIHyperAI

Command Palette

Search for a command to run...

Détection d'objets 3D à partir d'images monochromatiques par fusion multi-niveaux

Zhenzhong Chen Bin Xu

Résumé

Dans cet article, nous présentons un cadre fondé sur l'apprentissage profond, entièrement end-to-end, pour la détection d'objets 3D à partir d'une seule image monochrome. Nous introduisons un réseau neuronal convolutif profond capable de réaliser simultanément la détection 2D et 3D. Tout d'abord, des propositions de régions 2D sont générées via un réseau de propositions de régions. Ensuite, des caractéristiques partagées sont apprises à l'intérieur de ces propositions afin de prédire la probabilité de classe, la boîte englobante 2D, l'orientation, les dimensions et la position 3D. Nous utilisons un module indépendant pour prédire la disparité et extraire des caractéristiques à partir du nuage de points calculé. Ainsi, les caractéristiques provenant de l'image d'origine et du nuage de points sont fusionnées à différents niveaux afin d'assurer une localisation 3D précise. La disparité estimée est également utilisée pour une encodage des caractéristiques en vue avant, améliorant ainsi l'image d'entrée, ce processus étant considéré comme une fusion en entrée. L'algorithme proposé permet de produire directement, de manière end-to-end, à partir d'une seule image RGB, à la fois les résultats de détection 2D et 3D. Les résultats expérimentaux sur le défi KITTI démontrent que notre méthode surpasse significativement les états de l'art existants, même lorsqu'elle n'utilise que des images monochromes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Détection d'objets 3D à partir d'images monochromatiques par fusion multi-niveaux | Articles | HyperAI