8일 전

코로나19 가짜 뉴스 탐지를 위한 휴리스틱 기반 앙상블 프레임워크

Sourya Dipta Das, Ayan Basak, Saikat Dutta
코로나19 가짜 뉴스 탐지를 위한 휴리스틱 기반 앙상블 프레임워크
초록

지난 수십 년간 소셜미디어의 중요성은 세계 어느 지역에 있든 사람들을 연결해주는 도구로서 급격히 증가해왔다. 코로나19 팬데믹이 지속되면서 소셜미디어는 이전 어느 때보다도 더 중요한 역할을 하게 되었으며, 그와 함께 가짜 뉴스와 즉각적인 주의가 필요한 트윗의 유통이 다시 급증하고 있다. 본 논문에서는 CONSTRAINT COVID19 Fake News Detection in English 챌린지의 일환으로, 코로나19 관련 트윗이 ‘진실’인지 ‘가짜’인지 자동으로 식별하는 가짜 뉴스 탐지 시스템을 제시한다. 우리는 사전 훈련된 모델들을 결합한 앙상블 모델을 사용하여 리더보드에서 공동 8위의 성과를 달성하였다. 최고 점수인 0.9869 대비 F1 스코어 0.9831을 기록하였다. 챌린지 종료 후, 트윗 내 사용자명(유저네임 핸들)과 링크 도메인 정보를 기반으로 한 새로운 히우리스틱 알고리즘을 도입함으로써 시스템 성능을 크게 향상시켰으며, F1 스코어는 0.9883으로 개선되어 주어진 데이터셋에서 최신 기술 수준(소위 state-of-the-art)의 성과를 달성하였다.

코로나19 가짜 뉴스 탐지를 위한 휴리스틱 기반 앙상블 프레임워크 | 최신 연구 논문 | HyperAI초신경