18일 전

소셜 미디어에서 디지털 DNA 압축을 이용한 봇 행동 탐지

{Conor Hayes, Nivranshu Pasricha}
초록

페이스북과 트위터와 같은 온라인 소셜 네트워크가 직면한 주요 과제 중 하나는 최근 몇 년간 가짜 계정 및 자동화된 봇 계정의 급격한 증가이다. 이러한 계정 중 일부는 스팸 발송, 정치 캠페인 활동, 플랫폼 내 허위 정보 확산과 같은 부정적 활동에 관여한 것으로 보고되고 있다. 본 연구에서는 트위터 계정의 과거 트윗 활동을 분석함으로써 봇과 유사한 행동을 탐지하는 방법을 제안한다. 우리는 기존의 트위터 계정 분석 기법인 '디지털 DNA(Digital DNA)' 기법을 기반으로 한다. 디지털 DNA는 사용자 계정의 게시 이력(포스트 기록)을 실제 DNA 서열과 유사한 문자열로 인코딩함으로써 트위터 계정의 행동 패턴을 모델링한다. 본 연구에서는 이러한 디지털 DNA 서열에 손실 없는 압축 알고리즘을 적용하고, 압축 통계량을 기반으로 한 계정 그룹의 행동 예측 가능성(예측 가능성)을 측정한다. 압축 통계량이 전달하는 정보를 활용하여, 단순한 2차원 산점도(스캐터 플롯)를 통해 계정의 게시 행동을 시각화하며, 사전 구현된 로지스틱 회귀 분류 알고리즘을 사용하여 사용자 계정을 봇과 정상 사용자로 분류한다.