HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

HopeEDI : Un jeu de données de détection de discours d’espoir multilingue pour l’égalité, la diversité et l’inclusion

{Bharathi Raja Chakravarthi}

HopeEDI : Un jeu de données de détection de discours d’espoir multilingue pour l’égalité, la diversité et l’inclusion

Résumé

Au cours des dernières années, des systèmes ont été développés pour contrôler le contenu en ligne et éliminer les messages abusifs, offensants ou haineux. Toutefois, les individus détenant le pouvoir peuvent parfois exploiter cette forme de censure afin d’entraver le droit démocratique à la liberté d’expression. Il est donc impératif que la recherche adopte une approche de renforcement positif visant à promouvoir les contenus encourageants, positifs et solidaires. Jusqu’à présent, la plupart des études se sont concentrées sur la détection de la négativité dans la langue anglaise, bien que le problème dépasse largement la simple présence de contenu nuisible. En outre, ce phénomène est multilingue. Ainsi, nous avons construit un jeu de données intitulé Hope Speech dataset for Equality, Diversity and Inclusion (HopeEDI), comprenant des commentaires générés par les utilisateurs sur la plateforme YouTube, avec respectivement 28 451, 20 198 et 10 705 commentaires en anglais, tamoul et malayalam, manuellement étiquetés comme contenant ou non du « hope speech » (discours d’espoir). À notre connaissance, il s’agit de la première étude de ce type à annoter le discours d’espoir en faveur de l’égalité, de la diversité et de l’inclusion dans un cadre multilingue. Nous avons évalué l’entente inter-annotateurs de notre jeu de données à l’aide du coefficient alpha de Krippendorff. Par ailleurs, nous avons établi plusieurs modèles de référence (baselines) afin de benchmark le jeu de données, et les résultats ont été exprimés en termes de précision, de rappel et de score F1. Le jeu de données est désormais disponible publiquement pour la communauté scientifique. Nous espérons que cette ressource stimulera des recherches ultérieures sur la promotion d’un discours inclusif et réactif, renforçant ainsi la positivité en ligne.

Benchmarks

BenchmarkMéthodologieMétriques
hope-speech-detection-for-english-on-hopeediDecision Tree Classifier
Weighted Average F1-score: 0.90
hope-speech-detection-for-malayalam-onDecision Tree Classifier
Weighted Average F1-score: 0.73
hope-speech-detection-for-tamil-on-hopeediLogistic Regression
Weighted Average F1-score: 0.56
hope-speech-detection-on-hopeediDecision Tree Classifier
Weighted Average F1-score: 0.90

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
HopeEDI : Un jeu de données de détection de discours d’espoir multilingue pour l’égalité, la diversité et l’inclusion | Articles de recherche | HyperAI