HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

DH-FBK à SemEval-2022 Tâche 4 : Exploitation du désaccord des annotateurs et de plusieurs vues de données pour la détection du langage patronizing

{Elisa Leonardelli Alan Ramponi}

DH-FBK à SemEval-2022 Tâche 4 : Exploitation du désaccord des annotateurs et de plusieurs vues de données pour la détection du langage patronizing

Résumé

L’utilisation subtile et généralement inconsciente de langage patronisant et condescendant (PCL) dans les médias à large audience alimente de manière indésirable des stéréotypes et renforce les rapports de pouvoir-savoir, perpétuant ainsi la discrimination envers les communautés vulnérables. En raison de sa nature subjective et subtile, la détection du PCL constitue un problème ouvert et difficile, tant pour les méthodes computationnelles que pour les annotateurs humains. Dans cet article, nous décrivons les systèmes soumis par l’équipe DH-FBK au SemEval-2022 Task 4, dont l’objectif est la détection du PCL visant les communautés vulnérables dans des textes médiatiques en anglais. Motivés par la subjectivité des interprétations humaines, nous proposons d’exploiter l’incertitude et les désaccords des annotateurs afin de mieux capturer les nuances du PCL au sein d’un cadre d’apprentissage multi-tâches et multi-vues. Notre approche obtient des résultats compétitifs, dépassant largement les modèles de base et se classant en haut à gauche du classement pour les deux tâches d’identification et de classification du PCL. Notamment, notre méthode ne repose sur aucune donnée externe ni sur un ensemble de modèles (ensemble learning), ce qui en fait une solution viable et attrayante pour une application en situation réelle.

Benchmarks

BenchmarkMéthodologieMétriques
binary-condescension-detection-on-dpmMTMW (UNC+SPAN)
F1-score: 57.89
multi-label-condescension-detection-on-dpmMTMW (AGR+COU+SPAN)
Macro-F1: 37.35

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DH-FBK à SemEval-2022 Tâche 4 : Exploitation du désaccord des annotateurs et de plusieurs vues de données pour la détection du langage patronizing | Articles de recherche | HyperAI