Command Palette
Search for a command to run...
Tiefe Neuronale Netze für die Erkennung von Bots
Tiefe Neuronale Netze für die Erkennung von Bots
Sneha Kudugunta Emilio Ferrara
Zusammenfassung
Das Problem der Erkennung von Bots, automatisierten Social-Media-Konten, die durch Software gesteuert werden, aber sich als menschliche Nutzer ausgeben, hat weitreichende Implikationen. Zum Beispiel wurden Bots verwendet, um politische Wahlen durch Verzerrung des Online-Diskurses zu beeinflussen, den Aktienmarkt zu manipulieren oder Anti-Impf-Verschwörungstheorien zu verbreiten, die Gesundheitsepidemien verursachten. Die meisten bisher vorgeschlagenen Methoden erkennen Bots auf Kontoebene, indem sie große Mengen an Social-Media-Beiträgen verarbeiten und Informationen aus der Netzwerkstruktur, zeitlichen Dynamik, Sentiment-Analyse usw. nutzen.In dieser Arbeit schlagen wir ein tiefes neuronales Netzwerk vor, das auf einer kontextuellen Long Short-Term Memory (LSTM)-Architektur basiert und sowohl Inhalt als auch Metadaten nutzt, um Bots auf Tweet-Ebene zu erkennen: Kontextuelle Merkmale werden aus den Benutzer-Metadaten extrahiert und als zusätzliche Eingabe in die LSTM-Tiefenetze gefüttert, die den Tweet-Text verarbeiten.Ein weiterer Beitrag besteht darin, eine Technik auf Basis synthetischen Minderheitenübersamplings vorzuschlagen, um aus einer minimalen Menge an etikettierten Daten (ungefähr 3.000 Beispiele komplexer Twitter-Bots) einen großen etikettierten Datensatz zu generieren, der für das Training von Tiefenetzen geeignet ist. Wir zeigen, dass unser Architektur bereits aus einem einzelnen Tweet heraus eine hohe Klassifikationsgenauigkeit (AUC > 96 %) bei der Unterscheidung zwischen Bots und Menschen erreichen kann.Wir wenden dieselbe Architektur auch auf die Kontoebene an und erreichen fast perfekte Klassifikationsgenauigkeit (AUC > 99 %). Unser System übertrifft den bisherigen Stand der Technik und nutzt dabei ein kleines und interpretierbares Merkmalsset sowie erfordert nur minimale Trainingsdaten.