Segmentation sémantique simultanée et détection d'outliers en présence de décalage de domaine

Le succès récent sur des ensembles de données de conduite routière réaliste a suscité un intérêt croissant pour l'exploration d'une performance robuste dans les applications du monde réel. L'un des principaux problèmes non résolus est d'identifier le contenu des images qui ne peut pas être reconnu de manière fiable avec un moteur d'inférence donné. Nous étudions donc des approches permettant de récupérer une carte dense d'éléments aberrants en parallèle de la tâche principale, en une seule passe avant, en nous appuyant sur des caractéristiques convolutionnelles partagées. Nous considérons la segmentation sémantique comme la tâche principale et effectuons une validation approfondie sur WildDash val (éléments non aberrants), LSUN val (éléments aberrants) et des objets collés provenant de Pascal VOC 2007 (éléments aberrants). Nous obtenons les meilleures performances de validation en formant le modèle à discriminer les éléments non aberrants du contenu ImageNet-1k collé, bien que ImageNet-1k contienne de nombreux pixels liés à la conduite routière et échoue, au moins nominativement, à prendre en compte toute la diversité du monde visuel. Le modèle à deux têtes proposé performe aussi bien que le modèle multiclasses C-voies formé pour prédire une distribution uniforme dans les éléments aberrants, tout en surpassant plusieurs autres approches validées. Nous évaluons nos deux meilleurs modèles sur l'ensemble de données de test WildDash et établissons un nouveau niveau d'excellence sur le benchmark WildDash.