음이 아닌 행렬 계수
음이 아닌 행렬 분해(NMF)는 모든 원소가 음이 아닌 제약 조건을 만족한다는 조건 하에서 이루어지는 행렬 분해 방법입니다. 이는 1999년 Nature 잡지에서 이와 승이 처음 제안했습니다.
NMF의 수학적 정의
주어진 음이 아닌 행렬에 대해 다섯 , NMF 알고리즘은 음이 아닌 행렬을 찾을 수 있습니다. 여 그리고 음이 아닌 행렬 시간 , 그래서 만족하다 다섯 = 여 엑스 시간 즉, 음이 아닌 행렬을 두 개의 음이 아닌 행렬의 곱으로 분해합니다.
NMF의 솔루션
W와 H를 구하는 방법은 여러 가지가 있는데, 그 중에서도 Lee와 Seung의 두 배 업데이트 방법이 구현이 간단하기 때문에 가장 많이 사용됩니다.
또한, 일부 알고리즘은 교대로 음이 아닌 최소 제곱법을 기반으로 합니다. 각 단계에서 먼저 H를 고정하고 W를 음이 아닌 최소 제곱법으로 구한 다음, W를 고정하고 H를 같은 방식으로 풉니다.
W 또는 H를 해결하는 방법은 동일하거나 다를 수 있으며, W 또는 H를 정규화할 수도 있습니다(과도한 적합을 방지하기 위해).
구체적인 해결 방법으로는 투영 경사 하강법, 활성 집합법, 블록 원칙 피벗법 등이 있습니다.
NMF의 장점과 단점
- 이점:
- 대규모 데이터 처리가 더 빠르고 편리해졌습니다.
- 이 방법을 사용하면 분해 형태와 분해 결과의 해석이 간편해지고 저장 공간도 적게 차지합니다.
- 결점:
- NMF에서는 잠재 변수를 표현하는 데 하나의 계층만 사용하므로 복잡한 학습 문제를 처리할 수 없습니다.
- NMF는 W와 H의 비음성성만 제한합니다(이것은 유일한 사전 조건이며 이것만 충족하면 됩니다). 그러나 이 사전에 대한 H의 내부 요소 간의 상관관계는 고려하지 않습니다.
NMF의 적용 분야:
- 이미지 분석
- 텍스트 클러스터링/데이터 마이닝
- 음성 처리
- 로봇 제어
- 생체공학
- 화학공학
- 신호 처리
- 패턴 인식
- 컴퓨터 비전