BRITS: Bidirektionale rekurrente Imputation für Zeitreihen

Zeitreihen werden als Signale in vielen Klassifikations- und Regressionsaufgaben eingesetzt. Es ist weit verbreitet, dass Zeitreihen viele fehlende Werte enthalten. Angesichts mehrerer korrelierter Zeitreihendaten stellt sich die Frage, wie man diese fehlenden Werte auffüllt und ihre Klassenlabels vorhersagt. Bestehende Auffüllmethoden legen oft starke Annahmen über den zugrundeliegenden Datenerzeugungsprozess auf, wie zum Beispiel lineare Dynamik im Zustandsraum. In dieser Arbeit schlagen wir BRITS vor, eine neuartige Methode zur Auffüllung von fehlenden Werten in Zeitreihendaten, die auf rekurrenten neuronalen Netzen basiert. Unser vorgeschlagener Ansatz lernt die fehlenden Werte direkt in einem bidirektionalen rekurrenten dynamischen System, ohne spezifische Annahmen zu treffen. Die augefüllten Werte werden als Variablen des RNN-Graphen behandelt und können während der Rückwärtspropagation effektiv aktualisiert werden.BRITS hat drei Vorteile: (a) es kann mehrere korrelierte fehlende Werte in Zeitreihen verarbeiten; (b) es verallgemeinert sich auf Zeitreihen mit nichtlinearen zugrundeliegenden Dynamiken; (c) es bietet ein datengestütztes Auffüllverfahren und ist auf allgemeine Szenarien mit fehlenden Daten anwendbar. Wir evaluieren unser Modell anhand dreier realweltlicher Datensätze, darunter ein Luftqualitätsdatensatz, Gesundheitsdaten und Ortsbestimmungsdaten für menschliche Aktivität. Die Experimente zeigen, dass unser Modell sowohl in Bezug auf die Auffüllgenauigkeit als auch auf die Genauigkeit der Klassifikation und Regression den Stand der Technik übertreffen kann.