CASCADE: Kontextuelle Sarkasmuserkennung in Online-Diskussionsforen

Die Literatur zur automatischen Erkennung von Sarkasmus hat sich bisher hauptsächlich auf die lexikalische, syntaktische und semantische Analyse von Text konzentriert. Allerdings kann ein sarkastischer Satz durch kontextuelle Annahmen, Hintergrundwissen und allgemeine Menschenkenntnis ausgedrückt werden. In dieser Arbeit schlagen wir CASCADE (ContextuAl SarCasm DEtector) vor, einen Ansatz, der sowohl inhalts- als auch kontextgesteuerte Modellierung für die Sarkasmuserkennung in Online-Sozialmedien-Diskussionen kombiniert. Dabei strebt CASCADE an, kontextuelle Informationen aus dem Diskurs eines Diskussionsthreads zu extrahieren. Da die sarkastische Natur und die Form des Ausdrucks von Person zu Person variieren können, nutzt CASCADE Benutzerembeddings, die stilometrische und persönliche Merkmale der Nutzer kodieren. Wenn diese zusammen mit inhaltsbasierten Feature-Extraktoren wie Faltungsneuronalen Netzen (CNNs) eingesetzt werden, beobachten wir eine erhebliche Steigerung der Klassifikationsleistung auf einem großen Reddit-Korpus.