SEMI-FND: Stack-Ensemble-basierte multimodale Inferenz für eine schnellere Detektion von Fake News

Die Erkennung von Falschmeldungen (Fake News Detection, FND) ist ein zentraler Bereich im Bereich der natürlichen Sprachverarbeitung, der darauf abzielt, die Richtigkeit wesentlicher Behauptungen in einer Nachrichtenmeldung zu identifizieren und zu überprüfen, um die Authentizität der Nachricht zu bewerten. Die FND findet Anwendung bei der Verhinderung sozialer, politischer und nationaler Schäden, die durch die Verfälschung von Tatsachen verursacht werden können und bestimmte Bevölkerungsgruppen beeinträchtigen können. Darüber hinaus hat die explosionsartige Verbreitung von Falschmeldungen über soziale Medien – sowohl in Text- als auch in Bildform – die dringende Notwendigkeit geschaffen, Falschmeldungen schneller und präziser zu erkennen. Um dieses Problem anzugehen, untersucht diese Arbeit einen neuartigen multimodalen, gestapelten Ensemble-Ansatz (SEMIFND) zur Falschmeldenerkennung. Dabei wird besonderes Augenmerk darauf gelegt, eine schnellere Leistung mit weniger Parametern zu gewährleisten. Um die multimodale Leistung weiter zu verbessern, wird eine tiefgreifende Einmodalanalyse der Bilddaten durchgeführt, wodurch NasNet Mobile als am besten geeignetes Modell für diese Aufgabe identifiziert wird. Für den Textmodus wird ein Ensemble aus BERT und ELECTRA eingesetzt. Der Ansatz wurde an zwei Datensätzen evaluiert: Twitter MediaEval und Weibo Corpus. Das vorgeschlagene Framework erzielte Genauigkeiten von 85,80 % auf dem Twitter-Datensatz und 86,83 % auf dem Weibo-Datensatz. Diese gemeldeten Metriken erweisen sich im Vergleich zu ähnlichen jüngeren Arbeiten als überlegen. Zudem wird eine Reduktion der Anzahl der Trainingsparameter im Vergleich zu aktuellen relevanten Arbeiten berichtet. SEMIFND bietet insgesamt eine Parameterreduktion von mindestens 20 %, wobei die Reduktion bei der Einmodusanalyse im Textbereich bei 60 % liegt. Aufgrund der vorgestellten Untersuchungen lässt sich schlussfolgern, dass die Anwendung eines gestapelten Ensembles die Falschmeldenerkennung signifikant verbessert, sowohl hinsichtlich Genauigkeit als auch Geschwindigkeit, im Vergleich zu anderen Ansätzen.