HyperAIHyperAI
il y a 2 mois

Réseaux de neurones convolutionnels volumétriques et multi-vues pour la classification d'objets sur des données 3D

Charles R. Qi; Hao Su; Matthias Niessner; Angela Dai; Mengyuan Yan; Leonidas J. Guibas
Réseaux de neurones convolutionnels volumétriques et multi-vues pour la classification d'objets sur des données 3D
Résumé

Les modèles de formes 3D deviennent de plus en plus accessibles et faciles à capturer, rendant l'information 3D cruciale pour les progrès dans la classification d'objets. Les méthodes actuelles de pointe s'appuient sur des réseaux de neurones convolutifs (CNN) pour aborder ce problème. Récemment, deux types de CNN ont été développés : les CNN basés sur des représentations volumétriques et les CNN basés sur des représentations multivues. Les résultats empiriques issus de ces deux types de CNN montrent un écart important, indiquant que les architectures et approches existantes des CNN volumétriques ne parviennent pas à pleinement exploiter le potentiel des représentations 3D. Dans cet article, nous visons à améliorer à la fois les CNN volumétriques et les CNN multivues grâce à une analyse approfondie des approches existantes. À cette fin, nous introduisons deux architectures distinctes de CNN volumétriques. De plus, nous examinons les CNN multivues, où nous introduisons un filtrage multi-résolution en 3D. Dans l'ensemble, nous sommes capables de surpasser les méthodes actuelles de pointe pour les deux types de CNN. Nous fournissons également une série d'expériences conçues pour évaluer les choix de conception sous-jacents, offrant ainsi une meilleure compréhension de l'espace des méthodes disponibles pour la classification d'objets sur des données 3D.