HyperAIHyperAI
il y a 16 jours

Tous les grains, un schéma (AGOS) : apprentissage de la représentation d'instance à multi-grains pour la classification des scènes aériennes

Qi Bi, Beichen Zhou, Kun Qin, Qinghao Ye, Gui-Song Xia
Tous les grains, un schéma (AGOS) : apprentissage de la représentation d'instance à multi-grains pour la classification des scènes aériennes
Résumé

La classification des scènes aériennes reste un défi en raison de deux principaux facteurs : 1) la taille des objets clés déterminant le schéma de la scène varie considérablement ; 2) de nombreux objets sans rapport avec le schéma de la scène sont fréquemment présents dans l’image. Ainsi, la capacité à percevoir efficacement les régions d’intérêt (RoIs) de différentes tailles et à construire une représentation plus discriminative à partir d’une distribution d’objets aussi complexe est essentielle pour comprendre une scène aérienne. Dans cet article, nous proposons un cadre novateur, appelé AGOS (All Grains, One Scheme), pour relever ces défis. À notre connaissance, il s’agit du premier travail à étendre la méthode classique d’apprentissage par instances multiples (Multiple Instance Learning, MIL) à une formulation multi-grain. Plus précisément, notre architecture AGOS se compose d’un module de perception multi-grain (MGP), d’un module de représentation multi-branche par apprentissage par instances multiples (MBMIR) et d’un module d’alignement sémantique auto-adaptatif (SSF). Premièrement, notre MGP préserve les caractéristiques convolutives dilatées différenciées extraites par le modèle principal (backbone), amplifiant ainsi l’information discriminative à plusieurs échelles. Ensuite, notre MBMIR met en évidence les instances clés dans les représentations multi-grain sous la formulation MIL. Enfin, notre SSF permet à notre cadre d’apprendre le même schéma de scène à partir de représentations multi-grain d’instances et de les fusionner, assurant ainsi une optimisation globale du modèle. Notons que notre AGOS est hautement flexible et peut être facilement intégré aux réseaux de neurones convolutifs (CNN) existants de manière plug-and-play. Des expériences étendues sur les benchmarks UCM, AID et NWPU montrent que notre AGOS atteint des performances comparables aux méthodes de pointe.

Tous les grains, un schéma (AGOS) : apprentissage de la représentation d'instance à multi-grains pour la classification des scènes aériennes | Articles de recherche récents | HyperAI