要約
フェイスブックやツイッターなどのオンラインソーシャルネットワークが直面している主要な課題の一つは、ここ数年間で偽アカウントおよび自動化されたボットアカウントの著しい増加である。これらのアカウントの一部は、スパム投稿、政治キャンペーン、誤情報の拡散といった不適切な活動に従事していると報告されている。本研究では、ツイッター利用者の過去の投稿行動を分析することで、ボット的行動を検出する手法を提示する。この手法は、既存のツイッターアカウント分析技術「デジタルDNA(Digital DNA)」を基盤としている。デジタルDNAは、ユーザーの投稿履歴を実際のDNA配列に類似した文字列として符号化することで、ツイッターアカウントの行動様式をモデル化する。本研究では、このデジタルDNA文字列に対して無損失圧縮アルゴリズムを適用し、圧縮統計量を用いてツイッターアカウント群の行動の予測可能性を測定する。さらに、これらの圧縮統計量が示す情報を活用し、単純な二次元散布図によって投稿行動を視覚的に表現するとともに、既存のロジスティック回帰分類アルゴリズムの実装を用いて、ユーザーアカウントをボットと本物のユーザーに分類する。