Point2Sequence : Apprentissage de la représentation de forme des nuages de points 3D avec un réseau séquence à séquence basé sur l'attention

L'exploration des informations contextuelles dans la région locale est cruciale pour la compréhension et l'analyse de formes. Les études existantes utilisent souvent des méthodes manuellement conçues ou explicites pour coder les informations contextuelles des régions locales. Cependant, il est difficile de capturer des informations contextuelles fines de manière manuelle ou explicite, comme la corrélation entre différentes zones d'une région locale, ce qui limite la capacité discriminante des caractéristiques apprises. Pour résoudre ce problème, nous proposons un nouveau modèle d'apprentissage profond pour les nuages de points 3D, nommé Point2Sequence, visant à apprendre des caractéristiques de forme 3D en capturant des informations contextuelles fines de manière implicite et innovante. Point2Sequence utilise un nouveau modèle d'apprentissage séquentiel pour les nuages de points afin de capturer les corrélations en agrégeant des zones multi-échelles de chaque région locale avec une mécanique d'attention. Plus précisément, Point2Sequence apprend d'abord la caractéristique de chaque échelle de zone dans une région locale. Ensuite, il capture la corrélation entre les échelles de zone lors du processus d'agrégation de toutes les échelles de zone à l'aide d'une structure encodeur-décodeur basée sur un réseau neuronal récurrent (RNN), où un mécanisme d'attention est proposé pour mettre en avant l'importance des différentes échelles de zone. Les résultats expérimentaux montrent que Point2Sequence atteint des performances au niveau de l'état de l'art dans les tâches de classification et segmentation de formes.