12일 전
이미지 내 주목할 만한 객체 탐지를 위한 단계별 개선 모델
{Pingping Zhang, Ali Borji, Tiantian Wang, Lihe Zhang, Huchuan Lu}

초록
딥 컨볼루션 신경망(CNN)은 주목할 만한 물체 탐지와 같은 컴퓨터 비전 분야의 다양한 문제에 성공적으로 적용되어 왔다. 주목할 만한 물체를 정확하게 탐지하고 분할하기 위해서는 고수준의 의미적 특징과 저수준의 세부 정보를 동시에 추출하고 통합하는 것이 필요하다. 그러나 CNN의 경우 풀링 및 컨볼루션과 같은 반복적인 하향 샘플링 연산으로 인해 초기 이미지 해상도가 크게 감소하게 되어 공간적 세부 정보와 미세한 구조가 손실되는 문제가 발생한다. 이 문제를 해결하기 위해 본 논문에서는 주목도 탐지에 적합한 새로운 피라미드 풀링 모듈과 다단계 정밀화 메커니즘을 포함한 전방향 신경망을 제안한다. 먼저, 제안하는 딥 전방향 네트워크는 상당한 세부 구조가 손실된 대략적인 예측 맵을 생성한다. 이후, 각 단계별로 국소적 맥락 정보를 통합한 정밀화 네트워크를 주 분기에서 생성된 이전 주목도 맵을 단계적으로 개선하는 방식으로 적용한다. 더불어, 다양한 영역 기반의 전역 맥락을 집계하기 위해 피라미드 풀링 모듈을 도입한다. 제안한 방법은 다섯 개의 기준 데이터셋에서 수행된 실험적 평가를 통해 기존 최첨단 기법들과 비교해 우수한 성능을 보였다.