2달 전
변형 가능한 합성곱 네트워크
Jifeng Dai; Haozhi Qi; Yuwen Xiong; Yi Li; Guodong Zhang; Han Hu; Yichen Wei

초록
컨벌루션 신경망(CNNs)은 그 구조 모듈 내에 고정된 기하학적 구조가 있어 기하학적 변환을 모델링하는 데 본질적으로 제한을 받습니다. 본 연구에서는 CNN의 변환 모델링 능력을 향상시키기 위해 두 가지 새로운 모듈, 즉 변형 컨벌루션(deformable convolution)과 변형 RoI 풀링(deformable RoI pooling)을 소개합니다. 이 두 모듈 모두 모듈 내 공간 샘플 위치를 추가 오프셋으로 보강하고, 이러한 오프셋을 추가적인 감독 없이 목표 작업에서 학습하는 아이디어를 기반으로 합니다. 새로운 모듈들은 기존의 CNNs에서 평범한 대응물들을 쉽게 대체할 수 있으며, 표준 역전파 방법을 통해 쉽게 엔드투엔드로 훈련될 수 있습니다. 이를 통해 변형 컨벌루션 신경망(deformable convolutional networks)이 생성됩니다. 광범위한 실험을 통해 우리의 접근 방식이 객체 검출 및 의미 분할과 같은 복잡한 시각 작업에서 효과적임을 검증하였습니다. 코드는 공개될 예정입니다.