2달 전

고해상도 주요 객체 검출을 위한 이미지 피라미드 구조 재검토

Kim, Taehun ; Kim, Kunhee ; Lee, Joonyeong ; Cha, Dongmin ; Lee, Jiho ; Kim, Daijin
고해상도 주요 객체 검출을 위한 이미지 피라미드 구조 재검토
초록

주요 객체 검출(Salient Object Detection, SOD)은 최근 주목을 받고 있지만, 고해상도(High-Resolution, HR) 이미지에 대한 연구는 상대적으로 적었습니다. 불행히도, HR 이미지와 그 픽셀 단위 주석은 저해상도(Low-Resolution, LR) 이미지와 주석보다 훨씬 더 많은 노동과 시간이 소요됩니다. 따라서 우리는 HR 데이터셋 없이 HR 예측을 수행할 수 있는 이미지 피라미드 기반의 SOD 프레임워크, 역방향 주요성 피라미드 재구성 네트워크(Inverse Saliency Pyramid Reconstruction Network, InSPyReNet)를 제안합니다. InSPyReNet은 주요성 맵의 엄격한 이미지 피라미드 구조를 생성하도록 설계되어 있어 피라미드 기반 이미지 블렌딩을 통해 여러 결과를 결합할 수 있습니다. HR 예측을 위해 우리는 동일한 이미지에서 LR 및 HR 스케일 쌍으로부터 두 가지 다른 이미지 피라미드를 합성하여 효과적인 수용 필드(Effective Receptive Field, ERF) 차이를 극복하기 위한 피라미드 블렌딩 방법을 설계했습니다. 우리의 공개된 LR 및 HR SOD 벤치마크에 대한 광범위한 평가 결과는 InSPyReNet이 다양한 SOD 지표와 경계 정확도에서 최신 기술(State-of-the-Art, SotA) 방법들을 능가함을 보여줍니다.

고해상도 주요 객체 검출을 위한 이미지 피라미드 구조 재검토 | 최신 연구 논문 | HyperAI초신경