11일 전
실내 장면 분석을 위한 효율적인 RGB-D 세분화
Daniel Seichter, Mona Köhler, Benjamin Lewandowski, Tim Wengefeld, Horst-Michael Gross

초록
모바일 로봇이 다양한 환경에서 작동할 때 장면을 철저히 분석하는 것은 매우 중요하다. 의미론적 세그멘테이션은 (의미론적 보조 기반의) 사람 인식, (의미론적) 자유 공간 탐지, (의미론적) 맵핑, 그리고 (의미론적) 내비게이션과 같은 후속 작업들을 향상시킬 수 있다. 본 논문에서는 NVIDIA TensorRT를 통해 매우 높은 수준으로 최적화가 가능한 효율적이고 견고한 RGB-D 세그멘테이션 방법을 제안한다. 이로 인해 복잡한 시나리오 분석 시스템 내에서 일반적인 초기 처리 단계로 적합하다. 우리는 RGB 이미지만을 처리하는 경우에 비해 RGB-D 세그멘테이션의 우수성을 입증하며, 네트워크 아키텍처를 철저히 설계하면 실시간 처리도 가능함을 보여준다. 제안한 효율적인 장면 분석 네트워크(Efficient Scene Analysis Network, ESANet)를 일반적인 실내 데이터셋인 NYUv2와 SUNRGB-D에서 평가하여, 최신 기술 수준의 성능을 달성하면서도 추론 속도가 빠르다는 것을 확인하였다. 더불어, 실외 데이터셋인 Cityscapes에서의 평가를 통해 본 방법이 다른 응용 분야에도 적합함을 보였다. 마지막으로, 단순히 벤치마크 성능을 제시하는 것을 넘어서, 실내 응용 시나리오 중 하나에서의 정성적 결과도 제시한다.