2달 전

봇 감지용 딥 뉴럴 네트워크

Sneha Kudugunta; Emilio Ferrara
봇 감지용 딥 뉴럴 네트워크
초록

봇을 감지하는 문제, 즉 소프트웨어에 의해 제어되지만 인간 사용자로 위장하는 자동화된 소셜 미디어 계정의 감지는 강력한 의미를 지니고 있습니다. 예를 들어, 봇은 온라인 담론을 왜곡하여 정치 선거를 좌우하거나, 주식 시장을 조작하거나, 건강 유행병을 일으킨 백신 반대 음모론을 확산시키는 데 사용되었습니다. 지금까지 제안된 대부분의 기술은 대량의 소셜 미디어 게시물을 처리하고 네트워크 구조, 시간적 동역학, 감성 분석 등의 정보를 활용하여 계정 단위로 봇을 감지합니다.본 논문에서는 트윗 단위로 봇을 감지하기 위해 콘텍스트 기반 장단기 기억(LSTM) 아키텍처를 활용한 딥 신경망을 제안합니다. 콘텍스트 특징은 사용자 메타데이터에서 추출되어 LSTM 딥 넷이 트윗 텍스트를 처리할 때 보조 입력으로 제공됩니다.또 다른 기여점은 최소한의 라벨링 데이터(약 3,000개의 고도화된 트위터 봇 예제)로부터 딥 넷 학습에 적합한 큰 규모의 라벨링 데이터셋을 생성하기 위한 합성 소수 클래스 과다 샘플링 기술을 제안하는 것입니다. 우리는 단 하나의 트윗만으로도 봇과 인간을 구분하는 높은 분류 정확도(AUC > 96%)를 달성할 수 있음을 입증하였습니다.계정 단위 봇 감지에도 동일한 아키텍처를 적용하여 거의 완벽한 분류 정확도(AUC > 99%)를 달성하였습니다. 우리의 시스템은 이전 최신 연구보다 우수한 성능을 보이며, 해석 가능한 작은 특징 세트를 활용하면서도 최소한의 학습 데이터가 필요합니다.