Unüberwachtes statistisches Merkmals-gesteuertes Diffusionsmodell für die Aktivitätserkennung basierend auf Sensoren

Die Erkennung menschlicher Aktivitäten (Human Activity Recognition, HAR) mithilfe von am Körper getragener Sensoren ist eine zentrale Funktion vieler künstlicher Intelligenz-Anwendungen – von der persönlichen Gesundheitsüberwachung über Sport und Wellness bis hin zur Industrie 4.0. Ein zentrales Hindernis für den Fortschritt in der HAR-basierten Forschung auf Basis tragbarer Sensoren, im Vergleich zu anderen Gebieten des maschinellen Lernens wie der Computer Vision, ist die unzureichende Verfügbarkeit vielfältiger und annotierter Trainingsdaten. Insbesondere während unzählige annotierte Bilder in Online-Repositorys zur Verfügung stehen, sind frei zugängliche Sensordaten rar und überwiegend nicht annotiert. Wir stellen ein unsupervisiertes, statistische Merkmale leitendes Diffusionsmodell vor, das speziell für die HAR mit tragbaren Sensoren – beispielsweise Inertialsensoren (IMU) – optimiert ist. Das Verfahren erzeugt synthetische, annotierte Zeitreihendaten von Sensoren, ohne auf annotierte Trainingsdaten angewiesen zu sein. Dadurch wird dem Mangel an realen Sensordaten und den damit verbundenen Schwierigkeiten bei deren Annotation begegnet. Durch Bedingung des Diffusionsmodells auf statistische Kennwerte wie Mittelwert, Standardabweichung, Z-Score und Schiefe generieren wir vielfältige und repräsentative synthetische Sensordaten. Wir führten Experimente auf öffentlichen HAR-Datensätzen durch und verglichen unsere Methode mit herkömmlichen Oversampling-Verfahren sowie state-of-the-art-Verfahren basierend auf generativen adversarialen Netzwerken (GANs). Die experimentellen Ergebnisse zeigen, dass die vorgeschlagene Methode die Leistung der Aktivitätserkennung verbessern kann und bestehende Techniken übertrifft.