2달 전

방향 그래디언트 클라우드를 이용한 객체, 표면, 및 실내 장면 레이아웃의 3D 검출

Zhile Ren; Erik B. Sudderth
방향 그래디언트 클라우드를 이용한 객체, 표면, 및 실내 장면 레이아웃의 3D 검출
초록

우리는 복잡한 실내 환경에서 세 가지 차원(3D) 객체 검출과 공간 배치 예측을 위한 새로운 표현 방식과 알고리즘을 개발하였습니다. 먼저, 객체 카테고리의 2D 외관과 3D 자세를 연결하는 방향 그래디언트 클라우드(COG) 디스크립터를 제안하였습니다. 이는 원근 투영이 인식된 이미지 그래디언트에 미치는 영향을 정확히 모델링합니다. 대형 객체의 3D 시각적 스타일을 더 잘 표현하고, 소형 객체의 검출을 개선하기 위한 문맥적 단서를 제공하기 위해 잠재 지지 표면을 도입하였습니다. 또한, 일반적인 실내 환경의 3D 방 구조 기하학을 더 잘 포착하는 "맨해튼 보케"(Manhattan voxel) 표현 방식을 제안하였습니다. 효과적인 분류 규칙은 잠재 구조적 예측 프레임워크를 통해 학습됩니다. 카테고리와 레이아웃 간의 문맥적 관계는 분류기 캐스케이드를 통해 포착되며, 이로 인해 전체적인 장면 가설이 SUN RGB-D 데이터베이스에서 최신 기술보다 우수한 결과를 나타냅니다.

방향 그래디언트 클라우드를 이용한 객체, 표면, 및 실내 장면 레이아웃의 3D 검출 | 최신 연구 논문 | HyperAI초신경