Effiziente tiefe Clustering menschlicher Aktivitäten und Möglichkeiten zur Verbesserung der Evaluation

In den letzten Jahren ist eine erhebliche Forschungsaktivität im Bereich der menschlichen Aktivitätserkennung (Human Activity Recognition, HAR) zu verzeichnen, getrieben durch die Verbreitung von tragbaren Sensoren in Uhren und Smartphones sowie durch Fortschritte in der tiefen Lernmethoden, die die manuelle Extraktion von Merkmalen aus Rohsensorignalen überflüssig machen. Ein wesentlicher Nachteil der Anwendung tiefer Lernverfahren auf HAR besteht jedoch in der Notwendigkeit von manuell annotierten Trainingsdaten, die insbesondere für HAR-Datensätze besonders schwer zu beschaffen sind. Inzwischen werden erste Fortschritte im unsupervisierten Bereich erzielt, insbesondere durch tiefgreifende HAR-Clustering-Modelle, die Daten ohne vorgegebene Labels zuordnen können, ohne jemals mit gelabelten Daten trainiert worden zu sein. Allerdings bestehen erhebliche Probleme bei der Bewertung solcher tiefen HAR-Clustering-Modelle, was die Beurteilung des Forschungsfeldes und die Entwicklung neuer Methoden erschwert. In diesem Artikel beleuchten wir mehrere grundlegende Probleme bei der Bewertung tiefgreifender HAR-Clustering-Modelle, beschreiben diese detailliert und führen sorgfältige Experimente durch, um die Auswirkungen dieser Probleme auf die Ergebnisse zu verdeutlichen. Anschließend diskutieren wir mögliche Lösungen und schlagen standardisierte Evaluierungsszenarien für zukünftige tiefe HAR-Clustering-Modelle vor. Zudem präsentieren wir ein neues tiefes Clustering-Modell für HAR. Getestet unter unseren vorgeschlagenen Evaluierungsszenarien, erzielt unser Modell eine Leistung, die entweder besser ist als die bestehender Modelle oder zumindest auf dem gleichen Niveau liegt – gleichzeitig ist es jedoch effizienter und besser skalierbar auf komplexere Datensätze, da es auf einen Autoencoder verzichtet.