HyperAIHyperAI
vor 11 Tagen

DH-FBK bei SemEval-2022 Aufgabe 4: Ausnutzung der Uneinigkeit von Annotatoren und mehrerer Datensichten für die Erkennung von herablassendem Sprachgebrauch

{Elisa Leonardelli, Alan Ramponi}
DH-FBK bei SemEval-2022 Aufgabe 4: Ausnutzung der Uneinigkeit von Annotatoren und mehrerer Datensichten für die Erkennung von herablassendem Sprachgebrauch
Abstract

Die subtile und typischerweise unbewusste Verwendung von herablassendem und herabwürdigendem Sprachgebrauch (PCL) in Medien mit großer Öffentlichkeitswirkung verstärkt unerwünschterweise Stereotypen und festigt Macht-Wissen-Beziehungen, wodurch Diskriminierung gegenüber verletzlichen Gemeinschaften weiterhin perpetuiert wird. Aufgrund ihrer subjektiven und fein abgestuften Natur stellt die Erkennung von PCL sowohl für rechnergestützte Methoden als auch für menschliche Annotationen eine offene und herausfordernde Aufgabe dar. In diesem Paper beschreiben wir die von der DH-FBK-Gruppe für die SemEval-2022-Aufgabe 4 eingereichten Systeme, die darauf abzielen, PCL gegenüber verletzlichen Gemeinschaften in englischsprachigen Medientexten zu detektieren. Getrieben von der Subjektivität menschlicher Interpretation schlagen wir vor, die Unsicherheit und Unstimmigkeit der Annotationen gezielt zu nutzen, um die Feinheiten von PCL in einem mehrfachen, mehrperspektivischen Lernansatz besser zu erfassen. Unser Ansatz erzielt wettbewerbsfähige Ergebnisse, übertrifft die Baseline-Modelle deutlich und erreicht auf der Leaderboard-Platzierung sowohl bei der PCL-Erkennung als auch bei der Klassifikation eine Position im oberen linken Bereich. Auffällig ist, dass unser Ansatz auf keine externen Daten oder Modell-Ensembles angewiesen ist, was ihn zu einer praktikablen und attraktiven Lösung für den Einsatz in der realen Welt macht.

DH-FBK bei SemEval-2022 Aufgabe 4: Ausnutzung der Uneinigkeit von Annotatoren und mehrerer Datensichten für die Erkennung von herablassendem Sprachgebrauch | Neueste Forschungsarbeiten | HyperAI