HyperAIHyperAI
vor einem Monat

Kombination von Ähnlichkeitsmerkmalen und tiefem Repräsentationslernen für die Stance-Erkennung im Kontext der Überprüfung von Falschmeldungen

Luís Borges; Bruno Martins; Pável Calado
Kombination von Ähnlichkeitsmerkmalen und tiefem Repräsentationslernen für die Stance-Erkennung im Kontext der Überprüfung von Falschmeldungen
Abstract

Falsche Nachrichten stellen heutzutage ein dringliches Problem dar, insbesondere aufgrund ihres jüngsten Anstiegs als potenzielle Bedrohung für hochwertige Journalistik und gut informierte öffentliche Diskurse. Die Fake News Challenge (FNC-1) wurde 2017 organisiert, um die Entwicklung von maschinelles Lernen basierenden Klassifizierungssystemen zur Stance-Detektion (d.h., zur Identifikation, ob ein bestimmter Nachrichtenartikel einer bestimmten Nachrichtenüberschrift zustimmt, widerspricht, sich damit auseinandersetzt oder nicht in Beziehung steht) zu fördern, wodurch die Erkennung und Analyse möglicher Fälle von Falschnachrichten unterstützt werden soll. Dieser Artikel präsentiert einen neuen Ansatz zur Bewältigung dieses Stance-Detektionsproblems, der auf der Kombination von Stringähnlichkeitsmerkmalen mit einer tiefen neuronalen Architektur basiert, die Ideen nutzt, die bereits im Kontext des effizienten Textrepräsentationslernens, Dokumentklassifizierung und natürlichsprachlicher Inferenz vorgeschlagen wurden. Insbesondere verwenden wir bidirektionale Rekurrente Neuronale Netze (RNNs), zusammen mit Max-Pooling über die zeitliche/sequentielle Dimension und neuronaler Aufmerksamkeit, um (i) die Überschrift, (ii) die ersten beiden Sätze des Nachrichtenartikels und (iii) den gesamten Nachrichtenartikel zu repräsentieren. Diese Repräsentationen werden dann kombiniert/verglichen, ergänzt durch Ähnlichkeitsmerkmale, die sich an anderen FNC-1-Ansätzen orientieren, und an eine Endschicht weitergeleitet, die die Einstellung des Artikels zur Überschrift vorhersagt. Wir untersuchen auch den Einsatz externer Informationsquellen, insbesondere großer Datensätze von Satzpaaren, die ursprünglich für das Training und die Bewertung von Methoden zur natürlichsprachlichen Inferenz vorgeschlagen wurden, um spezifische Komponenten der neuronalen Netzarchitektur (z.B., die RNNs zur Kodierung von Sätzen) vorab zu trainieren. Die erzielten Ergebnisse belegen die Effektivität der vorgeschlagenen Ideen und zeigen, dass unser Modell insbesondere bei Berücksichtigung des Vorabtrainings und der Kombination neuronaler Repräsentationen mit Ähnlichkeitsmerkmalen leicht besser abschneidet als der bisherige Stand der Technik.

Kombination von Ähnlichkeitsmerkmalen und tiefem Repräsentationslernen für die Stance-Erkennung im Kontext der Überprüfung von Falschmeldungen | Neueste Forschungsarbeiten | HyperAI