11일 전

InconSeg: 부정확한 다중 모달 데이터를 활용한 잔차 지도 융합을 통한 음성 및 양성 도로 장애물 세그멘테이션

{and Yuxiang Sun, Yueyong Lyu ID, David Navarro-Alarcon ID, Yanning Guo ID, Zhen Feng ID}
초록

도로 장애물, 특히 음성 장애물과 양성 장애물의 세분화는 자율 주행 차량의 안전한 탐색에 있어 핵심적인 요소이다. 최근의 연구들은 RGB 이미지와 깊이/차이 이미지와 같은 다중 모달 데이터 융합(예: RGB 및 깊이/차이 이미지)을 활용한 방법에 대한 관심이 증가하고 있다. 이러한 방법들은 세분화 정확도 향상에 기여하고 있으나, 두 모달 간 정보가 일치하지 않을 경우(예: RGB 이미지에서는 관측 가능한 거리 장애물이 깊이/차이 이미지에서는 관측되지 않는 경우) 성능이 쉽게 저하됨을 발견하였다. 이 문제를 해결하기 위해, 우리는 Residual-Guided Fusion 모듈을 갖춘 새로운 이중 인코더-이중 디코더 RGB-깊이/차이 다중 모달 네트워크를 제안한다. 기존 대부분의 네트워크가 인코더에서 특징맵을 융합하는 것과 달리, 본 연구에서는 디코더에서 특징맵을 융합한다. 또한 도시 및 농촌 환경에서 촬영한 대규모 RGB-깊이/차이 이미지 데이터셋을 공개하며, 음성 장애물 및 양성 장애물의 세분화를 위한 수작업으로 라벨링된 정답 데이터를 포함하고 있다. 광범위한 실험 결과를 통해 제안하는 네트워크가 기존 네트워크들과 비교하여 최첨단 성능을 달성함을 입증하였다.

InconSeg: 부정확한 다중 모달 데이터를 활용한 잔차 지도 융합을 통한 음성 및 양성 도로 장애물 세그멘테이션 | 최신 연구 논문 | HyperAI초신경