
초록
숨겨진 표면의 3D 기하학적 구조와 의미를 추론하는 것은 매우 어려운 작업입니다. 최근에는 단일 깊이 이미지에서 장면을 완성하는 첫 번째 엔드투엔드 학습 접근법이 제안되었습니다. 이 접근법은 장면을 복셀화하고 각 복셀이 점유되어 있는지, 그리고 점유되어 있다면 해당 복셀의 의미 클래스 라벨을 예측합니다. 본 연구에서는 이 작업을 위해 깊이 정보와 RGB 이미지에서 추론된 의미 정보를 활용하는 두 개의 스트림 접근법을 제안합니다. 이 접근법은 추론된 의미 정보를 사용하여 불완전한 3D 의미 텐서를 구성하며, 이를 3D CNN을 통해 완전한 3D 의미 텐서로 추론합니다. 실험 평가에서 제안된 두 개의 스트림 접근법이 의미적인 장면 완성에 있어 최신 기술보다 크게 우수함을 보였습니다.