Détection de l'ironie à l'aide de séparateurs de contexte dans les discours en ligne

Le sarcasme est une forme complexe de langage, dans laquelle le sens est transmis de manière implicite. En tant que forme d’expression intricate, la détection du sarcasme constitue un problème exigeant. La difficulté à reconnaître le sarcasme comporte de nombreux pièges, notamment des malentendus dans les échanges quotidiens, ce qui explique l’intérêt croissant porté à la détection automatisée du sarcasme. Lors de la deuxième édition du atelier sur le traitement du langage figuré (Figurative Language Processing, FigLang 2020), une tâche partagée sur la détection du sarcasme a été lancée, mettant à disposition deux jeux de données comprenant des réponses accompagnées de leur contexte, extraits respectivement de Twitter et de Reddit.Dans ce travail, nous utilisons RoBERTa_large pour détecter le sarcasme sur les deux jeux de données. Nous soulignons également l’importance du contexte pour améliorer les performances des modèles basés sur des embeddings contextuels de mots, en testant trois types d’entrée différents : réponse seule, contexte-réponse, et contexte-réponse (séparés). Nous montrons que notre architecture proposée obtient des résultats compétitifs sur les deux jeux de données. En outre, nous démontrons que l’ajout d’un jeton de séparation entre le contexte et la réponse cible entraîne une amélioration de 5,13 % du score F1 sur le jeu de données Reddit.