11일 전

페르시아어 루머 검증을 위한 심층 콘텐츠 기반 모델

{Arash Sharifi, Mohammad-Reza Feizi-Derakhshi, Zoleikha Jahanbakhsh-Nagadeh}
초록

소셜 미디어의 발전 과정에서 사회적 소통 방식은 큰 변화를 겪었다. 소셜 미디어는 인간 간의 상호작용 및 뉴스 확산에 긍정적인 역할을 하면서도, 동시에 허위 정보(루머) 확산에 이상적인 플랫폼을 제공하고 있다. 루머는 평상시나 위기 상황에서 사회의 안전을 위협할 수 있다. 따라서 루머가 확산되기 시작하는 초기 단계에서 이를 탐지하고 검증하는 것이 매우 중요하다. 기존의 많은 연구들은 소셜 네트워크 내의 사회적 특성에 초점을 맞추어 루머 탐지 및 검증 문제를 해결하려 했으나, 콘텐츠 특성에 대한 관심은 상대적으로 낮았다. 루머의 사회적 및 구조적 특성은 시간이 지남에 따라 형성되며, 초기 단계에서는 제공되지 않는 특성들이다. 이에 따라 본 연구는 트위터와 텔레그램에서 페르시아어로 작성된 루머에 대해 초기 단계에서 검증할 수 있는 콘텐츠 기반 모델을 제안한다. 제안된 모델은 루머 확산 과정에서 콘텐츠의 중요성을 강조하며, 의미적, 의도적, 문법적 정보를 융합함으로써 각 루머 문서에 대해 보다 통합된 표현을 생성한다. 먼저, 파르스베르트(ParsBERT)와 병렬 캡스넷(CapsNets)을 기반으로 한 하이브리드 모델을 이용해 루머의 문맥 기반 단어 임베딩을 생성한다. 이후 루머의 의도적 및 문법적 특성을 추출하여 임베딩과 결합함으로써 루머 검증을 위한 풍부한 정보를 포착한다. 실제 데이터셋을 이용한 실험 결과, 제안된 모델은 기존 최고 수준의 모델들보다 초기 루머 검증 작업에서 유의미하게 뛰어난 성능을 보였다. 또한, 트위터에서는 분류기 성능을 2%에서 11%로, 텔레그램에서는 5%에서 23%로 향상시켰다. 이러한 결과는 콘텐츠 정보가 제한적인 상황에서도 본 모델의 효과성이 입증됨을 보여준다.

페르시아어 루머 검증을 위한 심층 콘텐츠 기반 모델 | 최신 연구 논문 | HyperAI초신경