HyperAI

MCFEND Ein Multi-Source-Benchmark-Datensatz Zur Erkennung Von Fake News in China

Datum

vor einem Jahr

Größe

96.32 MB

Organisation

HKBU Hong Kong Baptist University

Veröffentlichungs-URL

trustworthycomp.github.io

Lizenz

CC BY-SA 4.0

特色图像

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Der MCFEND-Datensatz ist ein aus mehreren Quellen bestehender Benchmark-Datensatz zur Erkennung chinesischer Fake News, der gemeinsam von der Hong Kong Baptist University, der Chinese University of Hong Kong und anderen Institutionen erstellt wurde.

Die Verbreitung von Fake News aus verschiedenen Online-Quellen hat erhebliche Auswirkungen auf die Öffentlichkeit. Vorhandene chinesische Datensätze zur Erkennung gefälschter Nachrichten sind ausschließlich auf Nachrichten von Weibo beschränkt. Allerdings weisen Fake News aus unterschiedlichen Quellen in vielerlei Hinsicht eine Vielfalt auf, unter anderem in Bezug auf Inhalt und sozialen Kontext. Methoden, die ausschließlich auf einer einzigen Nachrichtenquelle trainiert werden, lassen sich nur schwer auf reale Szenarien anwenden. Die Pilotexperimente des Forschungsteams zeigten, dass der F1-Score der hochmodernen Methode, die aus dem umfangreichen chinesischen Datensatz zur Erkennung von Fake News Weibo-21 erlernt wurde, signifikant von 0,943 auf 0,470 sank, als die Testdaten auf Nachrichtendaten aus mehreren Quellen umgestellt wurden. Damit konnte mehr als ein Drittel der aus mehreren Quellen stammenden Fake News nicht identifiziert werden.

Um diese Einschränkung zu beheben, hat das Forschungsteam den ersten Multi-Source-Benchmark-Datensatz zur Erkennung chinesischer Fake News namens MCFEND erstellt, der aus Nachrichten besteht, die das Forschungsteam aus verschiedenen Quellen wie sozialen Plattformen, Messaging-Anwendungen und traditionellen Online-Nachrichtenmedien gesammelt hat.Der Datensatz enthält 23.974 Nachrichten aus unterschiedlichen Quellen wie sozialen Plattformen, Instant-Messaging-Anwendungen und traditionellen Online-Nachrichtenmedien, die alle von 14 internationalen, maßgeblichen Faktencheck-Organisationen überprüft wurden. Die Nachrichteninhalte decken den Zeitraum von März 2015 bis März 2023 ab und umfassen multimodale Informationen wie Text, Bilder und Metadaten sowie soziale Kontextdaten wie Posts, Kommentare, Emoticons und Benutzerprofile. MCFEND dient als Benchmark-Datensatz mit dem Ziel, die Methoden zur Erkennung chinesischer Fake News in realen Szenarien zu verbessern.

MCFEND.torrent
Seeding 1Herunterladen 1Abgeschlossen 250Gesamtdownloads 896
  • MCFEND/
    • README.md
      2.2 KB
    • README.txt
      4.39 KB
      • data/
        • MCFEND.zip
          96.32 MB