Scattering Transform-basierte Bildclusterung mittels Projektion auf das orthogonale Komplement

In den letzten Jahren wurden durch die jüngsten Fortschritte im Bereich des tiefen Lernens erhebliche Verbesserungen bei der Bildclustering erreicht. Aufgrund der architektonischen Komplexität tiefer neuronaler Netze existiert jedoch bislang keine mathematische Theorie, die den Erfolg tiefen Clustering-Verfahren erklären könnte. In dieser Arbeit stellen wir Projected-Scattering Spectral Clustering (PSSC) vor, einen modernen, stabilen und schnellen Algorithmus für das Bildclustering, der zudem mathematisch interpretierbar ist. PSSC integriert eine neuartige Methode zur Ausnutzung der geometrischen Struktur des Streuungstransforms kleiner Bilder. Diese Methode wird durch die Beobachtung motiviert, dass sich in dem Streuungstransform-Domäne die durch die Eigenvektoren der wenigen größten Eigenwerte der Datenmatrizen einzelner Klassen aufgespannten Teilräume unter verschiedenen Klassen nahezu gemeinsam zeigen. Durch Projektion auf die orthogonalen Komplemente dieser gemeinsamen Teilräume wird die intra-klassische Variabilität reduziert, was die Clustering-Leistung erheblich steigert. Wir bezeichnen diese Methode als Projection onto Orthogonal Complement (POC). Unsere Experimente zeigen, dass PSSC im Vergleich zu allen bisherigen shallow Clustering-Algorithmen die besten Ergebnisse erzielt. Zudem erreicht PSSC eine vergleichbare Clustering-Leistung wie neuere state-of-the-art-Clustering-Techniken, während die Ausführungszeit um mehr als eine Größenordnung reduziert wird. Im Sinne nachvollziehbarer Forschung veröffentlichen wir zusammen mit dem Artikel eine hochwertige Code-Repository.