17일 전

세부 시각 분류를 위한 주의 기반 컨볼루션 이진 신경 트리

Ruyi Ji, Longyin Wen, Libo Zhang, Dawei Du, Yanjun Wu, Chen Zhao, Xianglong Liu, Feiyue Huang
세부 시각 분류를 위한 주의 기반 컨볼루션 이진 신경 트리
초록

세부 시각 분류(Fine-grained visual categorization, FGVC)는 변형, 가림, 조명 등의 요인으로 인해 클래스 내 변동성은 높고 클래스 간 변동성은 낮아져 있어 중요한 그러나 도전적인 과제로 여겨진다. 본 연구에서는 약한 감독 하에서 FGVC 문제를 해결하기 위해 주의 메커니즘을 통합한 컨볼루션 이진 신경수 나무 아키텍처를 제안한다. 구체적으로, 수 나무 구조의 간선을 따라 컨볼루션 연산을 적용하고, 각 노드에서의 라우팅 함수를 활용하여 루트에서 리프까지의 계산 경로를 결정한다. 최종 결정은 리프 노드들의 예측값을 합산함으로써 이루어진다. 깊은 컨볼루션 연산은 객체의 표현을 학습하고, 수 구조는 거시적에서 미시적까지의 계층적 특징 학습 과정을 특징화한다. 또한, 구분 능력을 강화하기 위해 주의 기반 트랜스포머 모듈을 도입한다. 전체 네트워크는 역전파를 이용한 SGD(경사 하강법)를 통해 음의 로그 가능도 손실(Negative log-likelihood loss)을 통해 엔드투엔드 방식으로 학습된다. CUB-200-2011, Stanford Cars, Aircraft 등의 데이터셋에서 수행한 여러 실험 결과, 제안하는 방법이 기존 최첨단 기법들과 비교하여 우수한 성능을 보였다.