DLME: Deep Local-flatness Manifold Embedding

Manifold Learning (ML) zielt darauf ab, aus hochdimensionalen Daten eine niederdimensionale Einbettung zu finden. Dieses Problem ist bei realen Datensätzen besonders herausfordernd, insbesondere bei unterrepräsentierten (under-sampled) Daten, wobei wir feststellen, dass herkömmliche Methoden in diesem Fall schlechte Leistungen erbringen. Generell transformieren ML-Methoden die Eingabedaten zunächst in einen niederdimensionalen Einbettungsraum, um die geometrische Struktur der Daten zu bewahren, und führen anschließend daraufhin abgeleitete Aufgaben durch. Die schlechte lokale Zusammenhangseigenschaft (lokalen Connectivity) unterrepräsenterter Daten im ersten Schritt sowie ungeeignete Optimierungsziele im zweiten Schritt führen zu zwei zentralen Problemen: struktureller Verzerrung und unterbestimmter Einbettung. In dieser Arbeit wird ein neuartiger ML-Framework namens Deep Local-flatness Manifold Embedding (DLME) vorgestellt, um diese Probleme zu lösen. Der vorgeschlagene DLME konstruiert semantische Mannigfaltigkeiten durch Datenaugmentation und beseitigt das Problem der strukturellen Verzerrung mittels einer Glättungsbedingung, die auf der Annahme der lokalen Flachheit der Mannigfaltigkeit basiert. Um das Problem der unterbestimmten Einbettung zu überwinden, wird eine spezielle Verlustfunktion entworfen, deren theoretische Analyse zeigt, dass sie eine geeignetere Einbettung aufgrund der lokalen Flachheit ermöglicht. Experimente an drei Arten von Datensätzen (Künstliche, biologische und Bilddaten) für verschiedene nachgelagerte Aufgaben (Klassifikation, Clustering und Visualisierung) zeigen, dass das vorgeschlagene DLME state-of-the-art-Methoden im Bereich des Manifold Learning und des kontrastiven Lernens übertrifft.