4달 전
Triply Supervised Decoder Networks for Joint Detection and Segmentation 삼중 감독 디코더 네트워크를 이용한 공동 탐지 및 분할
Jiale Cao; Yanwei Pang; Xuelong Li

초록
공동 객체 검출 및 의미 분할은 자율 주행 차량과 무인 표면 선박 등 다양한 분야에 적용될 수 있습니다. 이 목표를 달성하기 위해 두 작업 간의 깊은 합성곱 특성을 단순히 공유하는 방법으로 초기적이고 중요한 진전이 이루어졌습니다. 그러나 이러한 단순한 방식은 검출과 분할이 서로 유익하다는 사실을 충분히 활용하지 못합니다. 이 문제를 해결하기 위해, 우리는 각 디코더 네트워크 계층에 객체 검출 지향 감독, 클래스 인식 분할 감독, 그리고 클래스 무관 분할 감독을 부과하는 TripleNet이라는 프레임워크를 제안합니다. 클래스 무관 분할 감독은 의미 분할과 객체 검출 모두에 대한 객체성 사전 지식을 제공합니다. 세 가지 유형의 감독 외에도, 각 디코더 계층에 가벼운 모듈 두 개(즉, 내부 연결 모듈과 주의 스킵 계층 융합)가 통합됩니다. 제안된 프레임워크에서 객체 검출과 분할은 서로 충분히 상호 보완적으로 작용합니다. 또한, 각 디코더 계층에서의 클래스 무관 및 클래스 인식 분할은 테스트 단계에서는 수행되지 않으므로, 테스트 단계에서 추가적인 계산 비용이 발생하지 않습니다. VOC2007 및 VOC2012 데이터셋에서의 실험 결과는 제안된 TripleNet이 추가적인 계산 비용 없이 검출 및 분할 정확도를 향상시킬 수 있음을 입증하였습니다.