Modèles hybrides pour la reconnaissance en ensemble ouvert

La reconnaissance en ensemble ouvert exige qu’un classificateur détecte des échantillons n’appartenant à aucune des classes présentes dans son ensemble d’entraînement. Les méthodes existantes ajustent une distribution de probabilité aux échantillons d’entraînement dans leur espace d’embeddings, puis détectent les valeurs aberrantes en fonction de cette distribution. L’espace d’embeddings est généralement obtenu à partir d’un classificateur discriminatif. Toutefois, une telle représentation discriminative se concentre uniquement sur les classes connues, ce qui peut être insuffisant pour distinguer efficacement les classes inconnues. Nous proposons que l’espace de représentation doive être appris conjointement à partir du classificateur de données normales (inliers) et de l’estimateur de densité (utilisé comme détecteur d’anomalies). Nous introduisons le cadre OpenHybrid, composé d’un encodeur qui projette les données d’entrée dans un espace d’embeddings partagé, d’un classificateur chargé de catégoriser les échantillons parmi les classes connues, et d’un estimateur de densité basé sur des flows pour détecter si un échantillon appartient à une catégorie inconnue. Un problème classique des modèles basés sur les flows est qu’ils peuvent attribuer une probabilité plus élevée aux échantillons aberrants. Toutefois, nous observons empiriquement que ce phénomène ne se produit pas dans nos expériences lorsque l’on apprend une représentation conjointe pour les composants discriminatifs et génératifs. Des expériences sur des benchmarks standards de reconnaissance en ensemble ouvert montrent que le modèle OpenHybrid entraîné de manière end-to-end surpasse significativement les méthodes de pointe ainsi que les baselines basées sur les flows.