Techniques d'apprentissage incrémentiel pour la segmentation sémantique

Les architectures d'apprentissage profond (deep learning) montrent une baisse critique de performance due à l'oubli catastrophique lorsqu'elles sont appelées à apprendre de nouvelles tâches de manière incrémentielle. Les cadres d'apprentissage incrémentiel contemporains se concentrent sur la classification d'images et la détection d'objets, tandis que dans ce travail, nous introduisons formellement le problème d'apprentissage incrémentiel pour la segmentation sémantique, où une étiquetage pixel par pixel est considéré. Pour aborder cette tâche, nous proposons de distiller les connaissances du modèle précédent afin de conserver les informations sur les classes déjà apprises, tout en mettant à jour le modèle actuel pour apprendre les nouvelles classes. Nous proposons diverses approches travaillant tant sur les logits de sortie que sur les caractéristiques intermédiaires. Contrairement à certains cadres récents, nous ne stockons aucune image des classes précédemment apprises et seul le dernier modèle est nécessaire pour maintenir une haute précision sur ces classes. L'évaluation expérimentale sur l'ensemble de données Pascal VOC2012 démontre l'efficacité des approches proposées.