Les objets sont différents : détection 3D monoculaire flexible d'objets

La localisation précise d'objets 3D à partir d'une seule image sans information de profondeur constitue un problème extrêmement difficile. La plupart des méthodes existantes appliquent une approche unique à tous les objets, indépendamment de leurs distributions variées, ce qui limite leur performance pour les objets tronqués. Dans ce travail, nous proposons un cadre flexible pour la détection monocabulaire d'objets 3D, qui décompose explicitement les objets tronqués et combine de manière adaptative plusieurs approches pour l'estimation de la profondeur des objets. Plus précisément, nous décomposons les bords de la carte de caractéristiques afin de prédire les objets tronqués à distribution en queue longue, garantissant ainsi que l'optimisation des objets normaux n'est pas affectée. En outre, nous formulons l'estimation de la profondeur des objets comme un ensemble guidé par l'incertitude combinant la profondeur directement régressée et les profondeurs résolues à partir de différents groupes de points clés. Les expériences montrent que notre méthode surpasser la méthode de l’état de l’art de 27 % au niveau modéré et de 30 % au niveau difficile sur le jeu de test du benchmark KITTI, tout en maintenant une efficacité en temps réel. Le code sera disponible à l’adresse suivante : \url{https://github.com/zhangyp15/MonoFlex}.