Über das automatische Parsen von Log-Einträgen

Die Analyse von Software-Logs hilft dabei, die Funktionsfähigkeit von Softwarelösungen aufrechtzuerhalten und Compliance sowie Sicherheit zu gewährleisten. Bestehende Software-Systeme bestehen aus heterogenen Komponenten, die Logs in verschiedenen Formaten erzeugen. Eine übliche Lösung besteht darin, die Logs mithilfe manuell erstellter Parser zu vereinheitlichen, was sehr aufwendig ist.Stattdessen untersuchen wir die Möglichkeit, den Parsing-Prozess durch den Einsatz von maschinellen Übersetzungen (MT) zu automatisieren. Wir entwickeln ein Tool, das synthetische Apache-Log-Einträge generiert, mit denen wir rekurrent neuronale Netzwerke basierende MT-Modelle trainieren. Die Bewertung der Modelle anhand realer Logs zeigt, dass diese in der Lage sind, das Format von Apache-Logs zu lernen und einzelne Log-Einträge zu parsen. Der Median des relativen Edit-Distances zwischen einem tatsächlichen realen Log-Eintrag und der MT-Vorhersage beträgt weniger als oder gleich 28 %. Somit weisen wir nach, dass das Parsen von Logs mittels einer MT-Methode vielversprechend ist.