12일 전

DHSNet: 복합 계층적 명확성 네트워크를 통한 명확한 객체 탐지

{Junwei Han, Nian Liu}
DHSNet: 복합 계층적 명확성 네트워크를 통한 명확한 객체 탐지
초록

기존의 주목할 만한 객체 탐지 모델은 종종 수작업으로 설계된 특징을 활용하여 대비와 다양한 사전 지식을 정의한 후 이를 인위적으로 결합하는 방식을 사용한다. 본 연구에서는 컨볼루션 신경망 기반의 새로운 엔드투엔드(end-to-end) 심층 계층적 촉각성 네트워크(DHSNet)를 제안한다. DHSNet은 먼저 전역적인 구조적 촉각성 신호(전역 대비, 객체성, 밀도 등)를 자동으로 학습하여 거시적 전역 예측을 수행한다. 이후, 국소적 맥락 정보를 통합함으로써 단계적으로 세부 정보를 계층적이고 점진적으로 개선하는 새로운 계층적 순환 컨볼루션 신경망(HRCNN)을 도입한다. 전체 아키텍처는 전역에서 국소로, 거시적에서 미세한 방향으로 진행되는 방식으로 작동한다. DHSNet은 전체 이미지와 해당되는 진짜 촉각성 마스크를 직접 사용하여 훈련되며, 테스트 시에는 추가적인 기술 없이 테스트 이미지를 네트워크에 단순히 전방전달(forward pass)만 하면 촉각성 맵을 빠르고 효율적으로 생성할 수 있다. 네 가지 벤치마크 데이터셋에서의 평가 및 다른 11개의 최신 알고리즘과의 비교를 통해, DHSNet은 성능 면에서 뚜렷한 우수성을 보이며, 현대 GPU에서 실시간 속도인 23 FPS를 달성함을 입증하였다.

DHSNet: 복합 계층적 명확성 네트워크를 통한 명확한 객체 탐지 | 최신 연구 논문 | HyperAI초신경