
초록
문맥은 주요성 검출 작업에서 중요한 역할을 합니다. 그러나 주어진 문맥 영역에서 모든 문맥 정보가 최종 작업에 유용한 것은 아닙니다. 본 논문에서는 각 픽셀이 정보를 제공하는 문맥 위치에 선택적으로 주의를 기울일 수 있도록 하는 새로운 픽셀 단위 문맥 주의 네트워크, 즉 PiCANet(픽셀-컨텍스트-어텐션 네트워크)를 제안합니다. 구체적으로, 각 픽셀에 대해 정보의 문맥 관련성을 나타내는 주의 맵을 생성할 수 있습니다. 이때 각 주의 가중치는 각 문맥 위치에서의 문맥 관련성을 대응시킵니다. 선택적 집계를 통해 정보적인 문맥 정보만으로 구성된 주의 집중된 문맥 특징을 만들 수 있습니다. 우리는 제안된 PiCANet을 전역과 국소 형태로 공식화하여 각각 전역 및 국소 문맥에 주의를 기울일 수 있도록 하였습니다. 두 모델 모두 완전히 미분 가능하며 CNN(합성곱 신경망)에 통합되어 공동 학습될 수 있습니다. 또한 제안된 모델들을 U-Net 구조와 결합하여 주요 객체를 검출하였습니다. 광범위한 실험 결과, 제안된 PiCANets가 일관되게 주요성 검출 성능을 향상시키는 것으로 나타났습니다. 전역 PiCANet과 국소 PiCANet은 각각 전역 대비 및 균질성을 학습하는 데 도움을 줍니다. 그 결과, 우리의 주요성 모델은 더 정확하고 균일하게 주요 객체를 검출할 수 있어 최신 방법들과 유리한 성능을 보입니다.