CoMFormer : Apprentissage continu dans la segmentation sémantique et panoptique

L'apprentissage continu pour la segmentation a récemment suscité un intérêt croissant. Cependant, toutes les études précédentes se concentrent sur la segmentation sémantique restreinte et négligent la segmentation panoptique, une tâche importante avec des impacts dans le monde réel. Dans cet article, nous présentons le premier modèle d'apprentissage continu capable de fonctionner à la fois pour la segmentation sémantique et panoptique. Inspirés par les approches récentes basées sur les transformers qui considèrent la segmentation comme un problème de classification de masques, nous avons conçu CoMFormer. Notre méthode exploite soigneusement les propriétés des architectures de transformers pour apprendre de nouvelles classes au fil du temps. Plus précisément, nous proposons une nouvelle perte de distillation adaptative associée à une technique de pseudo-étiquetage basée sur les masques afin de prévenir efficacement l'oubli des connaissances antérieures. Pour évaluer notre approche, nous introduisons un nouveau benchmark d'apprentissage continu en segmentation panoptique sur le jeu de données complexe ADE20K. Notre CoMFormer surpassе tous les modèles existants en oubliant moins les anciennes classes tout en apprenant plus efficacement les nouvelles classes. De plus, nous rapportons également une évaluation exhaustive dans le scénario de segmentation sémantique continue à grande échelle, montrant que CoMFormer dépasse également significativement les méthodes actuelles de pointe.