
시각적 장면에서 가장 독특한 객체를 발견하고 위치시키는 데 중요한 역할을 하는 주요 객체 검출(Salient Object Detection, SOD)은 다양한 컴퓨터 비전 시스템에서 필수적인 부분을 차지하고 있습니다. 고해상도 시대에 접어들면서 SOD 방법들은 새로운 도전과제에 직면하게 되었습니다. 이전 방법들의 주요 제한점은 저해상도에서 단일 회귀 작업으로 주요 영역을 식별하고 정확한 객체 경계를 추정하려고 한다는 것입니다. 이러한 접근 방식은 두 가지 어려운 문제 사이의 본질적인 차이를 무시하여 검출 품질이 저하되는 결과를 초래합니다. 본 논문에서는 고해상도 SOD 작업을 위한 새로운 딥러닝 프레임워크를 제안합니다. 이 프레임워크는 작업을 저해상도 주요성 분류 네트워크(Low-Resolution Saliency Classification Network, LRSCN)와 고해상도 정교화 네트워크(High-Resolution Refinement Network, HRRN)로 분리합니다. LRSCN은 픽셀 단위 분류 작업으로 설계되어, 저해상도에서 충분한 의미론적 정보를 포착하여 확실한 주요 영역, 배경 및 불확실한 이미지 영역을 식별하는 데 중점을 둡니다. HRRN은 회귀 작업으로, 불확실한 영역 내 픽셀의 주요성 값을 정확히 조정하여 제한된 GPU 메모리를 사용하면서도 고해상도에서 명확한 객체 경계를 유지하는 것을 목표로 합니다. 특히 불확실성을 학습 과정에 도입함으로써, 본 연구의 HRRN은 고해상도 학습 데이터 없이도 고해상도 정교화 작업을 효과적으로 수행할 수 있습니다. 고해상도 주요성 데이터셋과 일부 널리 사용되는 주요성 벤치마크에 대한 광범위한 실험 결과, 제안된 방법이 기존 최신 방법들과 비교하여 우수한 성능을 보임을 확인할 수 있었습니다.