HyperAI

MCFEND Un Ensemble De Données De Référence Multi-sources Pour La Détection Des Fausses Nouvelles En Chine

Date

il y a un an

Taille

96.32 MB

Organisation

HKBU Université baptiste de Hong Kong

URL de publication

trustworthycomp.github.io

Licence

CC BY-SA 4.0

特色图像

* Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.

L'ensemble de données MCFEND est un ensemble de données de référence de détection de fausses nouvelles chinoises multi-sources construit conjointement par l'Université baptiste de Hong Kong, l'Université chinoise de Hong Kong et d'autres institutions.

La prévalence des fausses nouvelles provenant de diverses sources en ligne a eu un impact significatif sur le public. Les ensembles de données de détection de fausses nouvelles chinoises existants sont limités aux nouvelles provenant uniquement de Weibo. Cependant, les fausses nouvelles provenant de sources multiples présentent une diversité sous divers aspects, notamment en termes de contenu et de contexte social. Les méthodes qui s’appuient uniquement sur une seule source d’information sont difficiles à appliquer à des scénarios réels. Les expériences pilotes de l'équipe de recherche ont montré que le score F1 de la méthode de pointe apprise à partir de l'ensemble de données de détection de fausses nouvelles chinoises à grande échelle Weibo-21 a chuté de manière significative de 0,943 à 0,470 lorsque les données de test ont été modifiées en données d'actualités multi-sources, ne parvenant pas à identifier plus d'un tiers des fausses nouvelles multi-sources.

Pour remédier à cette limitation, l’équipe de recherche a construit le premier ensemble de données de référence multi-sources pour la détection des fausses nouvelles chinoises, appelé MCFEND, qui se compose de nouvelles collectées par l’équipe de recherche à partir de différentes sources telles que les plateformes sociales, les applications de messagerie et les médias d’information en ligne traditionnels.L'ensemble de données recueille 23 974 éléments d'actualité provenant de diverses sources telles que les plateformes sociales, les applications de messagerie instantanée et les médias d'information en ligne traditionnels, qui ont tous été vérifiés par 14 organisations internationales de vérification des faits faisant autorité. Le contenu des actualités couvre la période de mars 2015 à mars 2023, comprenant des informations multimodales telles que du texte, des images et des métadonnées, ainsi que des données contextuelles sociales telles que des publications, des commentaires, des émoticônes et des profils d'utilisateurs. MCFEND sert d'ensemble de données de référence, visant à faire progresser les méthodes de détection des fausses nouvelles chinoises dans des scénarios réels.

MCFEND.torrent
Partage 1Téléchargement 1Terminés 250Téléchargements totaux 896
  • MCFEND/
    • README.md
      2.2 KB
    • README.txt
      4.39 KB
      • data/
        • MCFEND.zip
          96.32 MB