17일 전
세부 시각 분류를 위한 주의 기반 컨볼루션 이진 신경 트리
Ruyi Ji, Longyin Wen, Libo Zhang, Dawei Du, Yanjun Wu, Chen Zhao, Xianglong Liu, Feiyue Huang

초록
세부 시각 분류(Fine-grained visual categorization, FGVC)는 변형, 가림, 조명 등의 요인으로 인해 클래스 내 변동성은 높고 클래스 간 변동성은 낮아져 있어 중요한 그러나 도전적인 과제로 여겨진다. 본 연구에서는 약한 감독 하에서 FGVC 문제를 해결하기 위해 주의 메커니즘을 통합한 컨볼루션 이진 신경수 나무 아키텍처를 제안한다. 구체적으로, 수 나무 구조의 간선을 따라 컨볼루션 연산을 적용하고, 각 노드에서의 라우팅 함수를 활용하여 루트에서 리프까지의 계산 경로를 결정한다. 최종 결정은 리프 노드들의 예측값을 합산함으로써 이루어진다. 깊은 컨볼루션 연산은 객체의 표현을 학습하고, 수 구조는 거시적에서 미시적까지의 계층적 특징 학습 과정을 특징화한다. 또한, 구분 능력을 강화하기 위해 주의 기반 트랜스포머 모듈을 도입한다. 전체 네트워크는 역전파를 이용한 SGD(경사 하강법)를 통해 음의 로그 가능도 손실(Negative log-likelihood loss)을 통해 엔드투엔드 방식으로 학습된다. CUB-200-2011, Stanford Cars, Aircraft 등의 데이터셋에서 수행한 여러 실험 결과, 제안하는 방법이 기존 최첨단 기법들과 비교하여 우수한 성능을 보였다.