HyperAI초신경

MCFEND 중국의 가짜 뉴스 감지를 위한 다중 소스 벤치마크 데이터 세트

날짜

일 년 전

크기

96.32 MB

기관

HKBU 홍콩 침례대학교

라이선스

CC BY-SA 4.0

特色图像

* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

MCFEND 데이터 세트는 홍콩 침례대학교, 홍콩 중국대학교 및 기타 기관이 공동으로 구축한 다중 소스 중국 가짜 뉴스 탐지 벤치마크 데이터 세트입니다.

다양한 온라인 출처에서 나오는 가짜 뉴스의 만연은 대중에게 상당한 영향을 미쳤습니다. 기존의 중국 가짜 뉴스 탐지 데이터 세트는 Weibo의 뉴스에만 국한되어 있습니다. 그러나 다양한 출처에서 나온 가짜 뉴스는 내용과 사회적 맥락을 포함한 다양한 측면에서 다양성을 보입니다. 단일 뉴스 소스에만 기반하여 학습된 방법은 실제 상황에 적용하기 어렵습니다. 연구팀의 시범 실험 결과, 대규모 중국 가짜 뉴스 탐지 데이터 세트인 Weibo-21에서 학습한 최첨단 방법의 F1 점수는 테스트 데이터를 다중 소스 뉴스 데이터로 바꾸었을 때 0.943에서 0.470으로 크게 떨어져 다중 소스 가짜 뉴스의 3분의 1 이상을 식별하지 못했습니다.

이러한 한계를 해결하기 위해 연구팀은 중국 가짜 뉴스 감지를 위한 최초의 다중 소스 벤치마크 데이터 세트인 MCFEND를 구축했습니다. 이 데이터 세트는 연구팀이 소셜 플랫폼, 메시징 애플리케이션, 기존 온라인 뉴스 미디어 등 다양한 소스에서 수집한 뉴스로 구성됩니다.이 데이터 세트는 소셜 플랫폼, 인스턴트 메시징 애플리케이션, 전통적인 온라인 뉴스 미디어 등 다양한 출처에서 수집한 23,974개의 뉴스 항목을 포함하고 있으며, 이 모든 항목은 14개의 국제적인 권위 있는 사실 확인 기관에서 검증을 거쳤습니다. 뉴스 콘텐츠는 2015년 3월부터 2023년 3월까지의 기간을 다루며, 텍스트, 이미지, 메타데이터와 같은 다중 모드 정보와 게시물, 댓글, 이모티콘, 사용자 프로필과 같은 소셜 맥락 데이터를 포함합니다. MCFEND는 벤치마크 데이터 세트 역할을 하며, 실제 시나리오에서 중국의 가짜 뉴스 감지 방법을 발전시키는 것을 목표로 합니다.

MCFEND.torrent
시딩 1다운로드 중 1완료됨 250총 다운로드 횟수 896
  • MCFEND/
    • README.md
      2.2 KB
    • README.txt
      4.39 KB
      • data/
        • MCFEND.zip
          96.32 MB