Détection des données hors distribution à l’aide de méthodes de détection d’outliers

La détection d’entrées hors distribution (OOD) concerne la gestion des entrées anormales dans les réseaux de neurones. Par le passé, des méthodes spécialisées ont été proposées pour rejeter les prédictions sur des entrées anormales. De manière similaire, il a été démontré que les modèles d’extraction de caractéristiques combinés à des algorithmes de détection d’outliers sont particulièrement adaptés à la détection d’entrées anormales. Nous utilisons des algorithmes de détection d’outliers pour détecter les entrées anormales avec une fiabilité comparable aux méthodes spécialisées du domaine OOD. Aucune adaptation du réseau de neurones n’est nécessaire ; la détection repose uniquement sur le score de softmax du modèle. Notre approche fonctionne de manière non supervisée grâce à une forêt d’isolation (Isolation Forest) et peut être améliorée davantage en utilisant une méthode d’apprentissage supervisé telle que le Gradient Boosting.