HyperAIHyperAI
vor 2 Monaten

Tiefe Neuronale Netze für die Erkennung von Bots

Sneha Kudugunta; Emilio Ferrara
Tiefe Neuronale Netze für die Erkennung von Bots
Abstract

Das Problem der Erkennung von Bots, automatisierten Social-Media-Konten, die durch Software gesteuert werden, aber sich als menschliche Nutzer ausgeben, hat weitreichende Implikationen. Zum Beispiel wurden Bots verwendet, um politische Wahlen durch Verzerrung des Online-Diskurses zu beeinflussen, den Aktienmarkt zu manipulieren oder Anti-Impf-Verschwörungstheorien zu verbreiten, die Gesundheitsepidemien verursachten. Die meisten bisher vorgeschlagenen Methoden erkennen Bots auf Kontoebene, indem sie große Mengen an Social-Media-Beiträgen verarbeiten und Informationen aus der Netzwerkstruktur, zeitlichen Dynamik, Sentiment-Analyse usw. nutzen.In dieser Arbeit schlagen wir ein tiefes neuronales Netzwerk vor, das auf einer kontextuellen Long Short-Term Memory (LSTM)-Architektur basiert und sowohl Inhalt als auch Metadaten nutzt, um Bots auf Tweet-Ebene zu erkennen: Kontextuelle Merkmale werden aus den Benutzer-Metadaten extrahiert und als zusätzliche Eingabe in die LSTM-Tiefenetze gefüttert, die den Tweet-Text verarbeiten.Ein weiterer Beitrag besteht darin, eine Technik auf Basis synthetischen Minderheitenübersamplings vorzuschlagen, um aus einer minimalen Menge an etikettierten Daten (ungefähr 3.000 Beispiele komplexer Twitter-Bots) einen großen etikettierten Datensatz zu generieren, der für das Training von Tiefenetzen geeignet ist. Wir zeigen, dass unser Architektur bereits aus einem einzelnen Tweet heraus eine hohe Klassifikationsgenauigkeit (AUC > 96 %) bei der Unterscheidung zwischen Bots und Menschen erreichen kann.Wir wenden dieselbe Architektur auch auf die Kontoebene an und erreichen fast perfekte Klassifikationsgenauigkeit (AUC > 99 %). Unser System übertrifft den bisherigen Stand der Technik und nutzt dabei ein kleines und interpretierbares Merkmalsset sowie erfordert nur minimale Trainingsdaten.