SOM-VAE: Interpretierbares Lernen diskreter Repräsentationen in Zeitreihen

Hochdimensionale Zeitreihen sind in vielen Bereichen üblich. Da die menschliche Kognition nicht dafür optimiert ist, gut in hochdimensionalen Räumen zu arbeiten, könnten diese Bereiche von interpretierbaren niedrigdimensionalen Darstellungen profitieren. Die meisten Darstellungslernalgorithmen für Zeitreihendaten sind jedoch schwer zu interpretieren. Dies liegt an nicht intuitiven Abbildungen von Datenmerkmalen auf wesentliche Eigenschaften der Darstellung und an einer Nichtglätte über die Zeit hinweg. Um dieses Problem anzugehen, schlagen wir einen neuen Darstellungslernrahmen vor, der auf Ideen aus interpretierbarer diskreter Dimensionsreduktion und tiefen generativen Modellierung basiert. Dieser Rahmen ermöglicht es uns, diskrete Darstellungen von Zeitreihen zu erlernen, die glatte und interpretierbare Einbettungen mit überlegenen Clustereigenschaften hervorbringen. Wir stellen eine neue Methode zur Überwindung der Nichtdifferenzierbarkeit in der diskreten Darstellungslernung vor und präsentieren eine gradientenbasierte Version des traditionellen Selbstorganisierenden Kartenalgorithmus (Self-Organizing Map), die leistungsfähiger als die ursprüngliche ist. Des Weiteren ermöglicht es uns die Integration eines Markov-Modells im Darstellungsraum, eine wahrscheinlichkeitstheoretische Interpretation unserer Methode zuzulassen. Dieses Modell deckt die zeitliche Übergangsstruktur auf, verbessert die Clustereigenschaften noch weiter und bietet zusätzliche erklärende Erkenntnisse sowie eine natürliche Darstellung von Unsicherheit. Wir evaluieren unser Modell hinsichtlich der Clustereigenschaften und Interpretierbarkeit anhand statischer (Fashion-)MNIST-Daten, einer Zeitreihe linear interpolierter (Fashion-)MNIST-Bilder, eines chaotischen Lorenz-Attraktorsystems mit zwei Makrozuständen sowie einer anspruchsvollen realweltlichen medizinischen Anwendung auf dem eICU-Datensatz. Unsere gelernten Darstellungen erweisen sich als vergleichsweise günstig gegenüber Konkurrentenmethoden und erleichtern nachgelagerte Aufgaben bei den realweltlichen Daten.请注意,虽然您提到“使其更符合法语读者的阅读习惯”,但根据您的要求,我已将文本翻译成德语。如果您需要法语翻译,请告知我。