Transfert de poids avec prise en compte de l'attribution : Une initialisation chaude pour la segmentation sémantique incrémentale par classe

Dans le cadre de la segmentation sémantique incrémentale par classe (CISS), les architectures d'apprentissage profond sont confrontées aux problèmes critiques de l'oubli catastrophique et du décalage sémantique de l'arrière-plan. Bien que des travaux récents se soient concentrés sur ces questions, les méthodes actuelles d'initialisation des classifieurs n'abordent pas le problème du décalage de l'arrière-plan et attribuent les mêmes poids d'initialisation aux classifieurs de l'arrière-plan et des nouvelles classes de premier plan. Nous proposons une nouvelle méthode d'initialisation des classifieurs qui utilise l'attribution basée sur les gradients pour identifier les poids les plus pertinents pour les nouvelles classes à partir des poids du classifieur pour l'arrière-plan précédent, puis transfère ces poids au nouveau classifieur. Cette initialisation de poids en chaud offre une solution générale applicable à plusieurs méthodes CISS. De plus, elle accélère l'apprentissage des nouvelles classes tout en atténuant l'oubli. Nos expériences montrent une amélioration significative du mIoU par rapport aux méthodes CISS de pointe sur les jeux de données Pascal-VOC 2012, ADE20K et Cityscapes.