2달 전

이미지 레벨 감독을 활용한 다중 라벨 이미지 분류를 위한 공간 정규화 학습

Feng Zhu; Hongsheng Li; Wanli Ouyang; Nenghai Yu; Xiaogang Wang
이미지 레벨 감독을 활용한 다중 라벨 이미지 분류를 위한 공간 정규화 학습
초록

다중 라벨 이미지 분류는 컴퓨터 비전에서 기본적이지만 도전적인 작업입니다. 최근 몇 년 동안 라벨 간의 의미론적 관계를 활용함으로써 큰 진전이 이루어졌습니다. 그러나 기존 접근 방식은 일반적으로 라벨의 공간 주석이 제공되지 않기 때문에 다중 라벨 이미지에서의 라벨 간의 내재된 공간 관계를 모델링할 수 없습니다. 본 논문에서는 이미지 수준의 감독만을 사용하여 라벨 간의 의미론적 및 공간적 관계를 모두 활용하는 통합된 딥 신경망을 제안합니다. 다중 라벨 이미지가 주어지면, 제안한 Spatial Regularization Network (SRN)는 모든 라벨에 대한 주의 맵을 생성하고 학습 가능한 합성곱을 통해 그들 사이의 내재된 관계를 포착합니다. 원래 결과와 ResNet-101 네트워크로 얻은 정규화된 분류 결과를 집계함으로써 분류 성능을 지속적으로 향상시킬 수 있습니다. 전체 딥 신경망은 이미지 수준의 주석만으로 단일 연결(end-to-end)로 훈련되므로, 추가적인 이미지 주석 작업이 필요하지 않습니다. 3개의 공개 데이터셋에서 다양한 유형의 라벨에 대해 광범위한 평가를 수행한 결과, 제안된 접근 방식이 현 상태 최고 기술(state-of-the-arts)보다 크게 우수하며 강력한 일반화 능력을 보임을 확인하였습니다. 학습된 SRN 모델에 대한 분석은 이 모델이 분류 성능 향상을 위해 라벨 간의 의미론적 및 공간적 관계를 효과적으로 포착할 수 있음을 입증하였습니다.

이미지 레벨 감독을 활용한 다중 라벨 이미지 분류를 위한 공간 정규화 학습 | 최신 연구 논문 | HyperAI초신경