Schnelle und robuste Merkmalsauswahl: Die Stärke energieeffizienter sparser Training für Autoencoder

Hauptprobleme ergeben sich aus der jüngsten Zunahme hochdimensionaler Daten, insbesondere hohe Rechenkosten und erhebliche Speicheranforderungen. Zur Lösung dieses Problems wurde die Merkmalsauswahl eingeführt, die die relevantesten und informativsten Merkmale eines Datensatzes identifiziert. Die meisten etablierten Methoden zur Merkmalsauswahl sind rechentechnisch ineffizient; ineffiziente Algorithmen führen zu hohem Energieverbrauch, was für Geräte mit begrenzten Rechen- und Energieressourcen unerwünscht ist. In diesem Artikel wird eine neuartige und flexible Methode zur unüberwachten Merkmalsauswahl vorgestellt. Diese Methode, QuickSelection genannt, nutzt die Stärke von Neuronen in sparsen neuronalen Netzwerken als Kriterium zur Bewertung der Merkmalsbedeutung. Dieses Kriterium wird in Verbindung mit sparsen, rauschunterdrückenden Autoencodern, die mittels des sparsen evolutionären Trainingsverfahrens trainiert wurden, verwendet, um die Bedeutung aller Eingabemerkmale gleichzeitig zu ermitteln. Im Gegensatz zum üblichen Ansatz, bei dem Sparsität durch eine binäre Maske über die Verbindungen simuliert wird, wird QuickSelection rein spars in der Implementierung realisiert. Dies führt zu einer erheblichen Beschleunigung und erheblicher Speicherreduzierung. Bei Tests auf mehreren Benchmark-Datensätzen – darunter fünf niedrigdimensionale und drei hochdimensionale Datensätze – erreicht die vorgeschlagene Methode das beste Verhältnis zwischen Klassifizierungs- und Clusteringgenauigkeit, Laufzeit und maximaler Speicherauslastung im Vergleich zu etablierten Methoden der Merkmalsauswahl. Darüber hinaus verbraucht unsere Methode im Vergleich zu anderen state-of-the-art-Verfahren basierend auf Autoencodern die geringste Energiemenge.