
초록
CNN 특징을 사용하는 이전 다단계 프레임워크와 비교하여, 최근의 세부 인식을 위한 단일 과정 딥 접근법은 본질적으로 CNN의 중간 수준 학습 능력을 향상시킵니다. 이전 접근법들은 주 분류 네트워크에 위치 정보를 주입하기 위해 보조 네트워크를 도입하거나, 고차원 특징 통계를 포착하기 위한 복잡한 특징 인코딩 방법을 사용하여 이를 달성했습니다. 우리는 CNN 프레임워크 내에서 중간 수준 표현 학습을 강화할 수 있음을 보여주며, 추가적인 부분이나 바운딩 박스 주석 없이 클래스별 차별적 패치를 포착하는 컨볼루션 필터 뱅크를 학습합니다. 이러한 필터 뱅크는 잘 구조화되어 있으며, 적절히 초기화되고 새로운 비대칭 다스트림 아키텍처와 컨볼루션 필터 감독, 그리고 무작위가 아닌 계층 초기화를 통해 차별적으로 학습됩니다. 실험 결과는 우리의 접근법이 세 개의 공개된 세부 인식 데이터셋(CUB-200-2011, 스탠퍼드 카즈 및 FGVC-항공기)에서 최신 기술 수준을 달성함을 보여줍니다. 또한, 성능 분석 연구와 시각화 자료가 제공되어 우리의 접근법을 이해하는 데 도움을 줍니다.