Ein heuristikgestützter Ensemble-Framework zur Erkennung von Falschinformationen über COVID-19

Die Bedeutung sozialer Medien ist in den letzten Jahrzehnten erheblich gestiegen, da sie Menschen aus den abgelegensten Winkeln der Welt miteinander verbinden. Während der COVID-19-Pandemie ist die Relevanz und Nutzung sozialer Medien noch weiter gestiegen, wodurch auch ein erneuter Anstieg von Falschinformationen und viralen Tweets entstanden ist, die dringende Aufmerksamkeit erfordern. In diesem Paper beschreiben wir unser System zur Erkennung von Falschinformationen, das automatisch ermittelt, ob ein Tweet im Zusammenhang mit COVID-19 „echt“ oder „falsch“ ist, als Teil der CONSTRAINT COVID19 Fake News Detection in English Challenge. Wir haben ein Ensemble-Modell eingesetzt, das auf vortrainierten Modellen basiert, und erreichten damit eine gemeinsame Platzierung auf Rang 8 der Rangliste. Unser F1-Score betrug 0,9831 gegenüber einem Spitzenwert von 0,9869. Nach Abschluss der Challenge konnten wir unser System durch die Integration eines neuartigen heuristischen Algorithmus, der Benutzerhandles und Link-Domains in Tweets berücksichtigt, erheblich verbessern und erreichten einen F1-Score von 0,9883, wodurch wir state-of-the-art-Ergebnisse auf dem gegebenen Datensatz erzielen konnten.