
초록
우리는 감독되지 않은 다중 모드 부분 공간 클러스터링을 위한 컨볼루션 신경망(CNN) 기반 접근법을 제시합니다. 제안된 프레임워크는 다중 모드 인코더, 자기 표현층, 그리고 다중 모드 디코더로 구성된 세 가지 주요 단계를 포함합니다. 인코더는 다중 모드 데이터를 입력으로 받아 잠재 공간 표현으로 융합합니다. 자기 표현층은 데이터 포인트에 해당하는 친화성 행렬을 획득하기 위해 자기 표현 특성을 강제하는 역할을 합니다. 디코더는 원래 입력 데이터를 재구성합니다. 네트워크는 학습 과정에서 디코더의 재구성 결과와 원래 입력 간의 거리를 사용합니다. 우리는 초기, 후기 및 중간 융합 기술을 조사하고 이들에 대응하는 세 가지 다른 스페이셜 인코더를 제안합니다. 자기 표현층과 다중 모드 디코더는 다양한 스페이셜 융합 기반 접근법에서 본질적으로 동일합니다. 다양한 스페이셜 융합 기반 방법 외에도, 서로 다른 모달리티에 대한 자기 표현층이 동일하도록 강제하는 친화성 융합 기반 네트워크도 제안됩니다. 세 개의 데이터셋에 대한 광범위한 실험 결과, 제안된 방법들이 최신 다중 모드 부분 공간 클러스터링 방법보다 크게 우수함을 보여주었습니다.