CASCADE : Détection contextuelle de l'ironie dans les forums de discussion en ligne

La littérature sur la détection automatique de l'ironie s'est principalement concentrée sur l'analyse lexicale, syntaxique et sémantique du texte. Cependant, une phrase ironique peut être exprimée à travers des présuppositions contextuelles, des connaissances de fond et des connaissances de sens commun. Dans cet article, nous proposons CASCADE (un Détecteur d'Ironie Contextuel) qui adopte une approche hybride combinant la modélisation basée sur le contenu et celle basée sur le contexte pour la détection de l'ironie dans les discussions en ligne des médias sociaux. Pour ce qui concerne la modélisation contextuelle, CASCADE vise à extraire des informations contextuelles à partir du discours d'un fil de discussion. De plus, étant donné que la nature et la forme d'expression ironiques peuvent varier d'une personne à l'autre, CASCADE utilise des plongements utilisateur (user embeddings) qui codent les caractéristiques stylistiques et de personnalité des utilisateurs. Lorsqu'ils sont utilisés en conjonction avec des extracteurs de caractéristiques basés sur le contenu tels que les Réseaux Neuronaux Convolutifs (CNNs), nous constatons une amélioration significative des performances de classification sur un grand corpus Reddit.