HyperAIHyperAI
il y a 8 jours

HopeEDI : Un jeu de données de détection de discours d’espoir multilingue pour l’égalité, la diversité et l’inclusion

{Bharathi Raja Chakravarthi}
HopeEDI : Un jeu de données de détection de discours d’espoir multilingue pour l’égalité, la diversité et l’inclusion
Résumé

Au cours des dernières années, des systèmes ont été développés pour contrôler le contenu en ligne et éliminer les messages abusifs, offensants ou haineux. Toutefois, les individus détenant le pouvoir peuvent parfois exploiter cette forme de censure afin d’entraver le droit démocratique à la liberté d’expression. Il est donc impératif que la recherche adopte une approche de renforcement positif visant à promouvoir les contenus encourageants, positifs et solidaires. Jusqu’à présent, la plupart des études se sont concentrées sur la détection de la négativité dans la langue anglaise, bien que le problème dépasse largement la simple présence de contenu nuisible. En outre, ce phénomène est multilingue. Ainsi, nous avons construit un jeu de données intitulé Hope Speech dataset for Equality, Diversity and Inclusion (HopeEDI), comprenant des commentaires générés par les utilisateurs sur la plateforme YouTube, avec respectivement 28 451, 20 198 et 10 705 commentaires en anglais, tamoul et malayalam, manuellement étiquetés comme contenant ou non du « hope speech » (discours d’espoir). À notre connaissance, il s’agit de la première étude de ce type à annoter le discours d’espoir en faveur de l’égalité, de la diversité et de l’inclusion dans un cadre multilingue. Nous avons évalué l’entente inter-annotateurs de notre jeu de données à l’aide du coefficient alpha de Krippendorff. Par ailleurs, nous avons établi plusieurs modèles de référence (baselines) afin de benchmark le jeu de données, et les résultats ont été exprimés en termes de précision, de rappel et de score F1. Le jeu de données est désormais disponible publiquement pour la communauté scientifique. Nous espérons que cette ressource stimulera des recherches ultérieures sur la promotion d’un discours inclusif et réactif, renforçant ainsi la positivité en ligne.

HopeEDI : Un jeu de données de détection de discours d’espoir multilingue pour l’égalité, la diversité et l’inclusion | Articles de recherche récents | HyperAI