12일 전

공동 주목 객체 탐지에 대한 심층적인 고찰

{ Ming-Ming Cheng, Huazhu Fu, Dingwen Zhang, Ge-Peng Ji, Zheng Lin, Deng-Ping Fan}
공동 주목 객체 탐지에 대한 심층적인 고찰
초록

공동 주목 객체 탐지(Co-salient object detection, CoSOD)는 주목 객체 탐지(Salient Object Detection, SOD)의 새로운 하위 분야로, 다수의 이미지 내에서 동시에 등장하는 주목 객체를 탐지하는 것을 목표로 한다. 그러나 기존의 CoSOD 데이터셋은 각 이미지 그룹이 유사한 시각적 특성을 가진 주목 객체를 포함한다고 가정하는 심각한 데이터 편향을 가지고 있다. 이 편향은 기존 데이터셋에서 학습된 모델의 이상적인 설정과 성능을 실제 환경에서의 적용에 한계를 초래하며, 현실에서는 시각적 유사성보다는 의미적 또는 개념적 유사성이 더 일반적임을 고려할 때 특히 문제된다. 이러한 문제를 해결하기 위해 우리는 새로운 고품질 데이터셋인 CoSOD3k를 구축하였다. CoSOD3k는 총 3,316장의 이미지로 구성되어 있으며, 160개의 그룹으로 나뉘어져 있으며, 카테고리, 경계 상자, 객체, 인스턴스 수준의 다중 레벨 레이블을 포함하고 있다. CoSOD3k는 다양성, 난이도, 확장성 측면에서 획기적인 진전을 이뤘으며, 관련된 시각 인식 작업에 큰 기여를 할 수 있다. 또한, 우리는 최신 34개의 알고리즘을 종합적으로 정리하였으며, 기존의 네 가지 CoSOD 데이터셋(MSRC, iCoSeg, Image Pair, CoSal2015)과 본 연구에서 제안한 CoSOD3k를 포함해 총 61,000장의 이미지에서 19개 알고리즘을 벤치마킹하고 그룹 수준의 성능 분석을 보고하였다. 마지막으로, CoSOD의 현재 과제와 향후 연구 방향에 대해 논의하였다. 본 연구는 CoSOD 분야의 지속적인 성장에 강력한 동력을 제공할 것으로 기대된다. 벤치마크 도구 및 결과는 본 연구의 프로젝트 페이지에서 공개되어 있다.

공동 주목 객체 탐지에 대한 심층적인 고찰 | 최신 연구 논문 | HyperAI초신경