Nichtnegativer Matrixfaktor
Nicht-negative Matrixfaktorisierung(NMF) ist eine Matrixzerlegungsmethode unter der Bedingung, dass alle Elemente die nicht-negative Einschränkung erfüllen. Es wurde erstmals 1999 von Lee und Seung im Magazin Nature vorgeschlagen.
Mathematische Definition von NMF
Für jede gegebene nicht-negative Matrix V kann der NMF-Algorithmus eine nicht-negative Matrix finden W und eine nicht-negative Matrix H , so dass Zufriedenheit V = W X H , wodurch eine nicht-negative Matrix in das Produkt zweier nicht-negativer Matrizen zerlegt wird.
Lösung von NMF
Es gibt viele Möglichkeiten, W und H zu finden, von denen die Verdoppelungsaktualisierungsmethode von Lee und Seung aufgrund ihrer einfachen Implementierung die gebräuchlichste ist.
Darüber hinaus basieren einige Algorithmen auf alternierenden nicht-negativen kleinsten Quadraten: In jedem Schritt wird zuerst H festgelegt und W durch eine nicht-negative kleinste Quadrate-Lösung ermittelt, und dann wird W festgelegt und H auf die gleiche Weise gelöst.
Die Methoden zum Lösen von W oder H können gleich oder unterschiedlich sein, ebenso können W oder H normalisiert werden (um eine Überanpassung zu verhindern).
Zu den spezifischen Lösungsmethoden gehören: die projizierten Gradientenabstiegsmethoden, die Active-Set-Methode und die Block-Principal-Pivoting-Methode.
Vorteile und Nachteile von NMF
- Vorteil:
- Die Verarbeitung großer Datenmengen ist schneller und bequemer;
- Dadurch wird Einfachheit und Interpretierbarkeit der Zerlegungsform und der Zerlegungsergebnisse erreicht und weniger Speicherplatz benötigt.
- Mangel:
- In NMF wird nur eine Schicht zur Darstellung latenter Variablen verwendet, die komplexe Lernprobleme nicht bewältigen kann.
- NMF schränkt nur die Nichtnegativität von W und H ein (dies ist die einzige Vorhersage und erfordert nur, dass diese erfüllt ist), berücksichtigt jedoch nicht die Korrelation zwischen den internen Elementen von H für diese Vorhersage.
Anwendungsgebiete von NMF:
- Bildanalyse
- Textclustering/Data-Mining
- Sprachverarbeitung
- Robotersteuerung
- Biomedizintechnik
- Chemieingenieurwesen
- Signalverarbeitung
- Mustererkennung
- Computer Vision