17일 전

개념 지도 학습을 통한 유니버설 미세한 시각 분류

{Gui-Song Xia, Wei Ji, Beichen Zhou, Qi Bi}
초록

기존의 미세한 세분화 시각 분류(FGVC) 기법들은 이미지의 정보성 부분에 미세한 의미가 존재한다고 가정한다. 이 가정은 유리한 전면 중심 객체 이미지에서는 잘 작동하지만, 장면 중심 이미지(예: 스트리트뷰)나 불리한 시점(예: 객체 재식별, 원격 탐사)과 같은 많은 현실 세계 시나리오에서는 큰 도전에 직면하게 된다. 이러한 상황에서는 잘못된 또는 과도한 특징 활성화가 부분 선택을 혼란스럽게 만들고, 미세한 세분화 표현의 품질을 저하시킬 가능성이 높다. 본 논문에서는 현실 세계 시나리오에 적합한 보편적인 FGVC 프레임워크를 설계하고자 한다. 구체적으로, 특정 미세한 세분화 카테고리의 개념을 그 하위의 거시적 세분화 카테고리로부터 상속된 개념과 자기 고유의 구분 가능한 개념의 조합으로 모델링하는 개념 지도 학습(CGL)을 제안한다. 이 구분 가능한 개념은 미세한 세분화 표현 학습을 안내하는 데 활용된다. 구체적으로, 개념 탐색(concept mining), 개념 융합(concept fusion), 개념 제약(concept constraint)의 세 가지 핵심 단계를 설계하였다. 한편, 장면 중심 및 불리한 시점 상황에서의 FGVC 데이터셋 갭을 해소하기 위해, 59,994개의 미세한 세분화 샘플을 포함하는 미세한 지표 분류 데이터셋(FGLCD)을 제안한다. 광범위한 실험 결과는 제안한 CGL이 1) 전통적인 FGVC에서 경쟁력 있는 성능을 보이며, 2) 미세한 항공 장면 및 장면 중심 스트리트 장면에서 최신 기술 수준의 성능을 달성하며, 3) 객체 재식별 및 미세한 항공 객체 탐지에서 우수한 일반화 성능을 보임을 입증한다. 데이터셋 및 소스 코드는 https://github.com/BiQiWHU/CGL 에서 공개될 예정이다.

개념 지도 학습을 통한 유니버설 미세한 시각 분류 | 최신 연구 논문 | HyperAI초신경