Sollicitation pour la classification multimodale des mémos haineux

La classification des mémos haineux est une tâche multimodale complexe qui nécessite un raisonnement élaboré et une connaissance de contexte et de fond culturel. Idéalement, nous pourrions utiliser une base de connaissances externe explicite pour compléter les informations contextuelles et culturelles contenues dans les mémos haineux. Cependant, il n’existe aucune base de connaissances externe explicite connue capable de fournir ce type d’informations sur le discours haineux. Pour combler cette lacune, nous proposons PromptHate, un modèle basé sur des prompts simple mais efficace qui sollicite des modèles linguistiques pré-entraînés (PLMs) pour la classification des mémos haineux. Plus précisément, nous construisons des prompts simples et fournissons quelques exemples en contexte afin d’exploiter les connaissances implicites du modèle linguistique RoBERTa pré-entraîné pour la classification des mémos haineux. Nous menons des expériences approfondies sur deux jeux de données publics contenant des mémos haineux et offensants. Nos résultats expérimentaux montrent que PromptHate est capable d’atteindre un AUC élevé de 90,96, surpassant les méthodes de référence actuelles dans la tâche de classification des mémos haineux. Nous effectuons également des analyses détaillées et des études de cas sur diverses configurations de prompts, démontrant ainsi l’efficacité des prompts dans la classification des mémos haineux.