2달 전
U$^2$-Net: 중첩된 U-구조를 활용한 더 깊은 배경에서의 주요 객체 검출
Qin, Xuebin ; Zhang, Zichen ; Huang, Chenyang ; Dehghan, Masood ; Zaiane, Osmar R. ; Jagersand, Martin

초록
본 논문에서는 간단하면서도 강력한 딥 네트워크 아키텍처인 U$^2$-Net을 설계하여 주요 객체 검출(Salient Object Detection, SOD)을 수행합니다. U$^2$-Net의 아키텍처는 두 단계의 중첩된 U-구조로 구성되어 있습니다. 이 설계는 다음과 같은 장점을 가지고 있습니다: (1) 제안된 ReSidual U-blocks (RSU)에서 서로 다른 크기의 수용 필드(receptive fields)를 혼합하여 다양한 스케일에서 더 많은 문맥 정보를 포착할 수 있으며, (2) 이러한 RSU 블록에서 사용되는 풀링 연산(pooling operations) 덕분에 계산 비용을 크게 증가시키지 않고 전체 아키텍처의 깊이를 늘릴 수 있습니다. 이 아키텍처는 이미지 분류 작업에서 사용되는 백본(backbones) 없이 처음부터 딥 네트워크를 학습할 수 있게 해줍니다. 우리는 제안된 아키텍처의 두 가지 모델, U$^2$-Net (176.3 MB, GTX 1080Ti GPU에서 30 FPS)과 U$^2$-Net$^{\dagger}$ (4.7 MB, 40 FPS),을 구현하여 다양한 환경에서의 활용을 용이하게 하였습니다. 두 모델 모두 여섯 개의 SOD 데이터셋에서 경쟁력 있는 성능을 보여주었습니다. 코드는 다음 링크에서 확인 가능합니다: https://github.com/NathanUA/U-2-Net.