SEMI-FND: 더 빠른 가짜 뉴스 탐지 위한 스택드 앙상블 기반 다중모달 추론

가짜 뉴스 탐지(Fake News Detection, FND)는 자연어 처리 분야에서 뉴스 기사 내 주요 주장의 진위를 식별하고 검증함으로써 뉴스의 진위 여부를 판단하는 데 목적이 있는 핵심 분야이다. FND는 사실의 왜곡으로 인해 사회적, 정치적, 국가적 피해가 발생할 수 있음을 방지하는 데 활용되며, 특히 소셜 미디어를 통해 이미지와 텍스트를 포함한 가짜 뉴스가 급속도로 확산되고 있는 상황에서, 보다 빠르고 정확하게 가짜 뉴스를 탐지할 필요성이 절실해지고 있다. 이러한 문제를 해결하기 위해 본 연구는 새로운 다중모달 스택형 앙상블 기반 접근법(SEMIFND)을 제안한다. 동시에 더 적은 파라미터로 빠른 성능을 보장하는 것도 중요한 목표로 삼았다. 또한 다중모달 성능 향상을 위해 이미지 모달리티에 대해 깊은 유니모달 분석을 수행한 결과, 이 작업에 가장 적합한 모델로 NasNet Mobile을 선정하였다. 텍스트 모달리티에서는 BERT와 ELECTRA의 앙상블을 사용하였다. 제안된 방법은 Twitter MediaEval 및 Weibo Corpus 두 가지 데이터셋에서 평가되었으며, 각각 Twitter 데이터셋에서 85.80%, Weibo 데이터셋에서 86.83%의 정확도를 기록하였다. 이는 최근 유사한 연구들과 비교했을 때 우수한 성능으로 평가되었다. 또한, 최근 관련 연구들과 비교해 학습 시 사용된 파라미터 수가 감소함을 보고하였다. SEMI-FND는 전체적으로 최소 20% 이상의 파라미터 감소를 제공하며, 텍스트 모달리티의 경우 파라미터 감소율이 60%에 이른다. 따라서 본 연구에서 제시된 분석 결과를 바탕으로, 스택형 앙상블 기법의 적용이 기존 방법보다 가짜 뉴스 탐지 성능을 크게 향상시키며 동시에 처리 속도도 개선함을 결론지을 수 있다.