2달 전
RedNet: 실내 RGB-D 의미 분할을 위한 잔차 인코더-디코더 네트워크
Jindong Jiang; Lunan Zheng; Fei Luo; Zhijun Zhang

초록
실내 의미 분할은 컴퓨터 비전에서 항상 어려운 과제였습니다. 본 논문에서는 실내 RGB-D 의미 분할을 위한 RGB-D 잔차 인코더-디코더 구조인 RedNet을 제안합니다. RedNet에서 잔차 모듈은 인코더와 디코더의 기본 구성 요소로 사용되며, 스킵 연결(Skip-Connection)은 인코더와 디코더 사이의 공간적 특성을 우회하기 위해 활용됩니다. 장면의 깊이 정보를 통합하기 위해 융합 구조가 설계되어 RGB 이미지와 깊이 이미지를 각각 추론한 후 여러 층에서 그 특성을 융합합니다. 네트워크 매개변수를 효율적으로 최적화하기 위해, 우리는 피라미드 감독 훈련 방식을 제안합니다. 이 방식은 디코더의 다양한 층에서 지도 학습을 적용하여 그래디언트 소실 문제를 해결합니다. 실험 결과, 제안된 RedNet(ResNet-50)은 SUN RGB-D 벤치마크 데이터셋에서 최고 수준의 mIoU 정확도 47.8%를 달성했습니다.