HyperAI

Nichtnegativer Matrixfaktor

Nicht-negative Matrixfaktorisierung(NMF) ist eine Matrixzerlegungsmethode unter der Bedingung, dass alle Elemente die nicht-negative Einschränkung erfüllen. Es wurde erstmals 1999 von Lee und Seung im Magazin Nature vorgeschlagen.

Mathematische Definition von NMF

Für jede gegebene nicht-negative Matrix V kann der NMF-Algorithmus eine nicht-negative Matrix finden W und eine nicht-negative Matrix H , so dass Zufriedenheit V = W X H , wodurch eine nicht-negative Matrix in das Produkt zweier nicht-negativer Matrizen zerlegt wird.

Lösung von NMF

Es gibt viele Möglichkeiten, W und H zu finden, von denen die Verdoppelungsaktualisierungsmethode von Lee und Seung aufgrund ihrer einfachen Implementierung die gebräuchlichste ist.

Darüber hinaus basieren einige Algorithmen auf alternierenden nicht-negativen kleinsten Quadraten: In jedem Schritt wird zuerst H festgelegt und W durch eine nicht-negative kleinste Quadrate-Lösung ermittelt, und dann wird W festgelegt und H auf die gleiche Weise gelöst.

Die Methoden zum Lösen von W oder H können gleich oder unterschiedlich sein, ebenso können W oder H normalisiert werden (um eine Überanpassung zu verhindern).

Zu den spezifischen Lösungsmethoden gehören: die projizierten Gradientenabstiegsmethoden, die Active-Set-Methode und die Block-Principal-Pivoting-Methode.

Vorteile und Nachteile von NMF

  • Vorteil:
  1. Die Verarbeitung großer Datenmengen ist schneller und bequemer;
  2. Dadurch wird Einfachheit und Interpretierbarkeit der Zerlegungsform und der Zerlegungsergebnisse erreicht und weniger Speicherplatz benötigt.
  • Mangel:
  1. In NMF wird nur eine Schicht zur Darstellung latenter Variablen verwendet, die komplexe Lernprobleme nicht bewältigen kann.
  2. NMF schränkt nur die Nichtnegativität von W und H ein (dies ist die einzige Vorhersage und erfordert nur, dass diese erfüllt ist), berücksichtigt jedoch nicht die Korrelation zwischen den internen Elementen von H für diese Vorhersage.

Anwendungsgebiete von NMF:

  • Bildanalyse
  • Textclustering/Data-Mining
  • Sprachverarbeitung
  • Robotersteuerung
  • Biomedizintechnik
  • Chemieingenieurwesen
  • Signalverarbeitung
  • Mustererkennung
  • Computer Vision