Command Palette
Search for a command to run...
Oracle-basiertes aktives Mengenverfahren für skalierbares Elastisches Netz-Unterraumclustering
Oracle-basiertes aktives Mengenverfahren für skalierbares Elastisches Netz-Unterraumclustering
Chong You; Chun-Guang Li; Daniel P. Robinson; Rene Vidal
Zusammenfassung
Zustandsderkunst-Methoden für Subraumclustering basieren auf der Darstellung jedes Datenpunkts als lineare Kombination anderer Datenpunkte, wobei die Koeffizientenmatrix mit ℓ1, ℓ2 oder nuklearen Normen regularisiert wird. Die Regularisierung mit ℓ1-Norm garantiert unter weitreichenden theoretischen Bedingungen eine subraum-bewahrende Affinität (d.h., es gibt keine Verbindungen zwischen Punkten aus verschiedenen Subräumen), aber die Clusters können unverbunden sein. Die Regularisierung mit ℓ2- und nuklearen Normen verbessert oft die Verbundenheit, bietet jedoch eine subraum-bewahrende Affinität nur für unabhängige Subräume. Gemischte Regularisierungen mit ℓ1, ℓ2 und nuklearen Normen bieten einen Kompromiss zwischen den Eigenschaften der Subraumbewahrung und der Verbundenheit, was jedoch zu erhöhter rechnerischer Komplexität führt. In dieser Arbeit wird die Geometrie des Elastic Net-Regularisierers (eine Mischung aus ℓ1- und ℓ2-Norm) untersucht und verwendet, um eine beweisbar korrekte und skalierbare Active Set-Methode zur Bestimmung der optimalen Koeffizienten abzuleiten. Unsere geometrische Analyse liefert auch eine theoretische Begründung sowie eine geometrische Interpretation für das Gleichgewicht zwischen den Eigenschaften der Verbundenheit (aufgrund der ℓ2-Regularisierung) und der Subraumbewahrung (aufgrund der ℓ1-Regularisierung) beim Elastic Net-Subraumclustering. Unsere Experimente zeigen, dass die vorgeschlagene Active Set-Methode nicht nur den Stand der Technik in Bezug auf Clusterverbesserung erreicht, sondern auch effizient große Datensätze verarbeitet.