19일 전

공간정보 지도형 적응형 컨텍스트 인지 네트워크를 활용한 효율적인 RGB-D 세그멘테이션

Yang Zhang, Chenyun Xiong, Junjie Liu, Xuhui Ye, Guodong Sun
공간정보 지도형 적응형 컨텍스트 인지 네트워크를 활용한 효율적인 RGB-D 세그멘테이션
초록

모바일 로봇 분야에서 효율적인 RGB-D 세분화 기술은 환경 정보를 분석하고 인식하는 데 있어 핵심적인 역할을 하며, 최근 많은 주목을 받고 있다. 기존 연구에 따르면 깊이 정보는 객체와 장면에 대한 기하학적 관계를 제공할 수 있으나, 실제 깊이 데이터는 일반적으로 노이즈를 포함하고 있다. 이러한 노이즈가 세분화 정확도 및 계산 효율성에 부정적인 영향을 미치지 않도록 하기 위해, 다중 모달 간 상관관계와 보완적 특징을 효과적으로 활용할 수 있는 효율적인 프레임워크 설계가 필수적이다. 본 논문에서는 계산 파라미터를 줄이고 알고리즘의 강건성을 보장하는 경량형 인코더-디코더 네트워크를 제안한다. 채널 및 공간 병합 주의(attention) 모듈을 활용하여, 다수준의 RGB-D 특징을 효과적으로 추출한다. 또한, 충분한 고수준의 맥락 정보를 획득하기 위해 전역적으로 유도하는 국소적 유사성 맥락 모듈을 도입하였다. 디코더는 단기 및 장기 거리 정보를 결합하면서도 부가적인 계산을 최소화하는 경량형 잔차 단위를 사용한다. NYUv2, SUN RGB-D, Cityscapes 데이터셋에서의 실험 결과를 통해, 제안한 방법이 최신 기술들에 비해 세분화 정확도, 추론 시간, 파라미터 수 간의 더 우수한 균형을 달성함을 확인하였다. 소스 코드는 다음 링크에서 제공된다: https://github.com/MVME-HBUT/SGACNet

공간정보 지도형 적응형 컨텍스트 인지 네트워크를 활용한 효율적인 RGB-D 세그멘테이션 | 연구 논문 | HyperAI초신경