
초록
자기지도 시각적 표현 학습은 큰 연구 관심을 끌고 있다. 일반적으로 자기지도 표현을 평가하는 가장 흔한 방법은 다양한 후속 작업에 전이하는 것이지만, 본 연구에서는 표현의 해석 가능성(즉, 원시 표현에 인코딩된 의미를 이해하는 능력)을 측정하는 문제를 탐구한다. 이를 위해 표현과 수동으로 레이블링된 개념들의 공간 사이의 상호정보량을 추정하는 문제로 공식화한다. 이를 정량화하기 위해 복원형 선형 탐색(decoding bottleneck)을 도입한다. 이는 간단한 예측 모델이 표현 공간에서 형성된 데이터 클러스터에 개념을 매핑해야 하며, 정보를 효과적으로 포착해야 함을 의미한다. 본 연구에서 제안하는 이 접근법을 ‘역방향 선형 탐색(reverse linear probing)’이라 부르며, 표현의 의미적 특성을 민감하게 반영하는 단일 수치를 제공한다. 이 측정 방법은 레이블링된 개념들의 조합(예: “빨간 사과”)과 관련된 표현을 탐지할 수 있으며, 단일 속성(예: “빨간색”과 “사과” 각각)만을 반영하는 경우와 구분할 수 있다. 마지막으로, 본 연구는 감독 학습 분류기들을 활용하여 풍부한 속성 공간을 가진 대규모 데이터셋을 자동으로 레이블링할 수 있음을 제안한다. 이러한 통찰을 바탕으로 수많은 자기지도 표현을 평가하고, 해석 가능성에 따라 순위를 매기며, 기존의 선형 탐색을 통한 평가와 비교했을 때 나타나는 차이점을 강조한다.