11일 전

DHOG: 딥 하이어라키컬 오브젝트 그룹핑

Luke Nicholas Darlow, Amos Storkey
DHOG: 딥 하이어라키컬 오브젝트 그룹핑
초록

최근 들어, 다양한 경쟁적인 방법들이 증강 기법으로부터 생성된 표현 간의 상호정보량(mutual information)을 최대화함으로써 비지도 표현 학습을 해결해 왔다. 이러한 방법을 통해 얻어진 표현은 확률적 증강 전략에 대해 불변(invariant)이 되며, 클러스터링이나 분류와 같은 하류 작업에 활용될 수 있다. 그러나 데이터 증강 기법은 이미지의 많은 특성을 유지하므로, 데이터 내에서 쉽게 찾을 수 있는 특징에 의존하는 비최적의 표현 선택 가능성이 존재한다. 본 연구에서는 상호정보량을 최대화하는 탐욕적 또는 국소적 방법(예: 확률적 경사 최적화)이 상호정보량 기준의 국소 최적해(local optima)를 탐색함을 보여주며, 이러한 표현은 복잡한 하류 작업에 덜 적합함을 확인하였다. 이전의 연구들은 이러한 문제를 명확히 식별하거나 해결하지 못했다. 본 연구에서는 계층적으로 이미지에 대한 여러 개의 고유한 이산 표현을 계산하는 딥 계층적 객체 그룹화(Deep Hierarchical Object Grouping, DHOG)를 제안한다. 이는 결국 상호정보량 목적함수를 더 효과적으로 최적화하는 표현을 생성한다. 또한 이러한 표현이 실제 객체 클래스로의 그룹화라는 하류 작업과 더 잘 일치함을 발견하였다. DHOG는 비지도 클러스터링에 대해 평가되었으며, 이는 목표 표현이 데이터의 이산 레이블링인 자연스러운 하류 테스트로 적합하다. 우리는 전처리나 소벨 엣지 검출(Sobel-edge detection)과 같은 사전 필터링 기법 없이도, 세 가지 주요 벤치마크에서 기존 최고 성능을 초월하는 새로운 최고 성능을 달성하였다. 특히 CIFAR-10에서 4.3%, CIFAR-100-20에서 1.5%, SVHN에서 7.2%의 정확도 향상을 기록하였다.

DHOG: 딥 하이어라키컬 오브젝트 그룹핑 | 최신 연구 논문 | HyperAI초신경