2달 전

공동 주요 객체 검출 재고려

Fan, Deng-Ping ; Li, Tengpeng ; Lin, Zheng ; Ji, Ge-Peng ; Zhang, Dingwen ; Cheng, Ming-Ming ; Fu, Huazhu ; Shen, Jianbing
공동 주요 객체 검출 재고려
초록

본 논문에서는 이미지에 대한 공통 주요 객체 검출(CoSOD, Co-Salient Object Detection) 문제에 대해 종합적인 연구를 수행합니다. CoSOD는 주요 객체 검출(SOD, Salient Object Detection)의 새로운이고 급속히 성장하는 확장 분야로, 여러 이미지에서 동시에 나타나는 주요 객체들을 검출하는 것을 목표로 합니다. 그러나 기존의 CoSOD 데이터셋은 각 그룹의 이미지가 비슷한 시각적 특성을 가진 주요 객체를 포함한다고 가정하여 심각한 데이터 편향을 가지고 있습니다. 이러한 편향은 실제 상황에서 유사성이 일반적으로 의미론적이거나 개념적인 경우에 모델의 이상적인 설정과 효과성을 저하시킬 수 있습니다.이 문제를 해결하기 위해 먼저 새로운 벤치마크인 'CoSOD3k in the wild'을 소개합니다. 이 벤치마크는 많은 양의 의미론적 맥락을 요구하여 기존의 CoSOD 데이터셋보다 더 어려운 문제를 제시합니다. 우리의 CoSOD3k은 160개 그룹으로 나누어져 있으며, 각 그룹은 계층적 주석이 추가된 3,316장의 고품질 이미지를 포함하고 있습니다. 이 이미지는 다양한 카테고리, 형태, 객체 크기 및 배경을 포괄하고 있습니다.둘째, 우리는 기존의 SOD 기술들을 통합하여 이 분야에서 오랫동안 필요해졌던 통합된 학습 가능한 CoSOD 프레임워크를 구축합니다. 특히, 공통 정보 학습을 빠르게 수행할 수 있도록 EGNet 모델에 공통 주목도 투영 전략(co-attention projection strategy)을 추가한 새로운 모델인 CoEG-Net을 제안합니다. CoEG-Net은 대규모 SOD 데이터셋을 충분히 활용하여 모델의 확장성과 안정성을 크게 개선합니다.셋째, 우리는 40개의 최신 알고리즘을 종합적으로 요약하고, 이 중 18개 알고리즘을 세 가지 도전적인 CoSOD 데이터셋(iCoSeg, CoSal2015 및 우리들의 CoSOD3k)에서 벤치마킹하여 보다 상세한(즉, 그룹 단위) 성능 분석 결과를 보고합니다.마지막으로, 우리는 CoSOD의 난점과 미래 연구 방향에 대해 논의합니다. 본 연구가 CoSOD 커뮤니티의 성장을 크게 촉진하길 바랍니다. 벤치마크 도구와 결과는 프로젝트 페이지(http://dpfan.net/CoSOD3K/)에서 확인할 수 있습니다.

공동 주요 객체 검출 재고려 | 최신 연구 논문 | HyperAI초신경