HyperAIHyperAI
il y a 11 jours

DH-FBK à SemEval-2022 Tâche 4 : Exploitation du désaccord des annotateurs et de plusieurs vues de données pour la détection du langage patronizing

{Elisa Leonardelli, Alan Ramponi}
DH-FBK à SemEval-2022 Tâche 4 : Exploitation du désaccord des annotateurs et de plusieurs vues de données pour la détection du langage patronizing
Résumé

L’utilisation subtile et généralement inconsciente de langage patronisant et condescendant (PCL) dans les médias à large audience alimente de manière indésirable des stéréotypes et renforce les rapports de pouvoir-savoir, perpétuant ainsi la discrimination envers les communautés vulnérables. En raison de sa nature subjective et subtile, la détection du PCL constitue un problème ouvert et difficile, tant pour les méthodes computationnelles que pour les annotateurs humains. Dans cet article, nous décrivons les systèmes soumis par l’équipe DH-FBK au SemEval-2022 Task 4, dont l’objectif est la détection du PCL visant les communautés vulnérables dans des textes médiatiques en anglais. Motivés par la subjectivité des interprétations humaines, nous proposons d’exploiter l’incertitude et les désaccords des annotateurs afin de mieux capturer les nuances du PCL au sein d’un cadre d’apprentissage multi-tâches et multi-vues. Notre approche obtient des résultats compétitifs, dépassant largement les modèles de base et se classant en haut à gauche du classement pour les deux tâches d’identification et de classification du PCL. Notamment, notre méthode ne repose sur aucune donnée externe ni sur un ensemble de modèles (ensemble learning), ce qui en fait une solution viable et attrayante pour une application en situation réelle.

DH-FBK à SemEval-2022 Tâche 4 : Exploitation du désaccord des annotateurs et de plusieurs vues de données pour la détection du langage patronizing | Articles de recherche récents | HyperAI