Apprentissage de métriques et frontière adaptative pour la détection hors domaine

Les agents conversationnels sont généralement conçus pour des environnements à monde fermé. Malheureusement, les utilisateurs peuvent se comporter de manière imprévisible. Dans un environnement à monde ouvert, nous rencontrons souvent la situation où les données d'entraînement et de test sont échantillonnées à partir de distributions différentes. Les données provenant de ces distributions différentes sont alors appelées hors domaine (out-of-domain, OOD). Un agent conversationnel robuste doit réagir adéquatement à ces énoncés OOD. Par conséquent, l'importance d'une détection OOD robuste est soulignée. Malheureusement, la collecte de données OOD est une tâche difficile. Nous avons conçu un algorithme de détection OOD indépendant des données OOD qui surpasse une large gamme d'algorithmes actuels de pointe sur des ensembles de données publiquement disponibles. Notre algorithme repose sur une approche simple mais efficace qui combine l'apprentissage par métrique avec une frontière de décision adaptative. De plus, par rapport aux autres algorithmes, nous avons constaté que notre algorithme proposé améliore considérablement les performances OOD dans un scénario avec un nombre inférieur de classes tout en préservant la précision pour les classes à domaine (in-domain, IND).