Marquage pour la détection de distribution hors domaine

La détection de données hors distribution (OOD) vise à identifier les données OOD à partir des représentations extraites de modèles profonds bien entraînés. Toutefois, les méthodes existantes ignorent largement la propriété de réprogrammation des modèles profonds, et ne parviennent donc pas à exploiter pleinement leur potentiel intrinsèque : sans modifier les paramètres d’un modèle bien entraîné, il est possible de réprogrammer ce modèle pour une nouvelle tâche via une manipulation au niveau des données (par exemple, en ajoutant une perturbation spécifique à certaines caractéristiques des données). Cette propriété nous inspire à réprogrammer un modèle de classification afin qu’il excelle dans la détection OOD (une nouvelle tâche), et c’est ainsi que nous proposons dans cet article une méthodologie générale nommée watermarking. Plus précisément, nous apprenons un motif unifié qui est superposé aux représentations des données d’origine, ce qui permet une amélioration significative de la capacité de détection du modèle après application du watermarking. Des expériences étendues confirment l’efficacité du watermarking, mettant en évidence l’importance cruciale de la propriété de réprogrammation des modèles profonds dans la détection OOD.