HyperAI초신경

음이 아닌 행렬 계수

음이 아닌 행렬 분해(NMF)는 모든 원소가 음이 아닌 제약 조건을 만족한다는 조건 하에서 이루어지는 행렬 분해 방법입니다. 이는 1999년 Nature 잡지에서 이와 승이 처음 제안했습니다.

NMF의 수학적 정의

주어진 음이 아닌 행렬에 대해 다섯 , NMF 알고리즘은 음이 아닌 행렬을 찾을 수 있습니다. 그리고 음이 아닌 행렬 시간 , 그래서 만족하다 다섯 = 엑스 시간 즉, 음이 아닌 행렬을 두 개의 음이 아닌 행렬의 곱으로 분해합니다.

NMF의 솔루션

W와 H를 구하는 방법은 여러 가지가 있는데, 그 중에서도 Lee와 Seung의 두 배 업데이트 방법이 구현이 간단하기 때문에 가장 많이 사용됩니다.

또한, 일부 알고리즘은 교대로 음이 아닌 최소 제곱법을 기반으로 합니다. 각 단계에서 먼저 H를 고정하고 W를 음이 아닌 최소 제곱법으로 구한 다음, W를 고정하고 H를 같은 방식으로 풉니다.

W 또는 H를 해결하는 방법은 동일하거나 다를 수 있으며, W 또는 H를 정규화할 수도 있습니다(과도한 적합을 방지하기 위해).

구체적인 해결 방법으로는 투영 경사 하강법, 활성 집합법, 블록 원칙 피벗법 등이 있습니다.

NMF의 장점과 단점

  • 이점:
  1. 대규모 데이터 처리가 더 빠르고 편리해졌습니다.
  2. 이 방법을 사용하면 분해 형태와 분해 결과의 해석이 간편해지고 저장 공간도 적게 차지합니다.
  • 결점:
  1. NMF에서는 잠재 변수를 표현하는 데 하나의 계층만 사용하므로 복잡한 학습 문제를 처리할 수 없습니다.
  2. NMF는 W와 H의 비음성성만 제한합니다(이것은 유일한 사전 조건이며 이것만 충족하면 됩니다). 그러나 이 사전에 대한 H의 내부 요소 간의 상관관계는 고려하지 않습니다.

NMF의 적용 분야:

  • 이미지 분석
  • 텍스트 클러스터링/데이터 마이닝
  • 음성 처리
  • 로봇 제어
  • 생체공학
  • 화학공학
  • 신호 처리
  • 패턴 인식
  • 컴퓨터 비전