Hierarchisches zeitliches Faltungsnetzwerk: Ein Schritt hin zu einer datenschutzorientierten Aktivitätserkennung
Angesichts der gesundheitlichen Herausforderungen, die mit einer alternden Bevölkerung einhergehen, werden derzeit verschiedene Technologien des ambient assisted living (AAL) entwickelt. Um Datenschutzbedenken im Zusammenhang mit der Verarbeitung von Daten in der Cloud zu mindern, haben sich jüngere Ansätze zunehmend auf die Nutzung von Edge-Geräten zur lokalen Datenverarbeitung verlagert. Trotz der vermeintlichen Vorteile stellen die begrenzten Rechenressourcen dieser Edge-Geräte eine erhebliche Herausforderung für die Echtzeitleistung dar, die häufig eine zwingende Anforderung ist. Insbesondere neuere, auf Computer Vision basierende Methoden zur Erkennung von Aktivitäten des täglichen Lebens bei älteren Menschen weisen bei der Erfassung des mehrskaligen zeitlichen Kontexts – einer entscheidenden Voraussetzung für eine präzise Aktivitätserkennung – eine zunehmende rechnerische Komplexität auf. In diesem Kontext stellen wir HT-ConvNet (Hierarchical Temporal Convolution Network) vor, um mehrskalige zeitliche Informationen zu erfassen, ohne die rechnerische Komplexität zu erhöhen. HT-ConvNet nutzt exponentiell wachsende Rezeptivfelder über aufeinanderfolgende Faltungs-Schichten, um eine effiziente hierarchische Extraktion zeitlicher Merkmale zu ermöglichen. Darüber hinaus bietet HT-ConvNet eine adaptiv gewichtete Fusion, um die wichtigsten Merkmale stärker zu betonen. Experimentelle Ergebnisse zeigen, dass sowohl die mehrskalige zeitliche Merkmalsextraktion als auch der gewichtete Merkmalsfusion die Leistung bestehender Methoden übertrifft, ohne die Modellkomplexität zu erhöhen. Der Quellcode ist öffentlich zugänglich unter: https://github.com/Gbouna/HT-ConvNet.