17일 전
EnGraf-Net: 분류 작업을 위한 세밀-거친 접합 균질 다중 균질 브랜치 네트워크
{Nicola Landro, Ignazio Gallo, Riccardo La Grassa}

초록
세부 분류 모델은 일반적으로 클래스 내 분산이 크고 클래스 간 분산이 낮은 데이터셋 상황에서, 매우 유사한 클래스를 구분하는 데 유용한 관련 세부 정보에 특별히 집중할 수 있다. 이러한 모델 대부분은 부분(annotation)을 바운딩 박스, 위치 정보, 텍스트 속성 등의 형태로 사용하여 분류 성능을 향상시키며, 일부는 주의 맵(attention map)을 자동으로 추출하는 고도화된 기술을 활용한다. 우리는 부분 기반 접근법을 자동 컷팅 방법으로 활용할 경우 국소적 특징의 표현이 누락될 수 있다고 가정한다. 이러한 국소적 특징은 유사한 객체를 구분하는 데 핵심적인 역할을 한다. 세부 분류는 그래프의 잎사귀를 인식하려는 시도인 반면, 인간은 객체를 인식할 때 의미적 연관성(semantic association)을 시도한다. 본 논문에서는 의미적 연관성을 계층 구조(계통도, taxonomy)로 정의한 것을 감독 신호로 사용하고, 이를 엔드 투 엔드 딥 신경망 모델인 EnGraf-Net에 통합하였다. Cifar-100, CUB-200-2011, FGVC-Aircraft 세 가지 유명한 데이터셋에서 실시한 광범위한 실험을 통해, EnGraf-Net이 다수의 세부 분류 모델보다 뛰어난 성능을 보였으며, 어떤 컷팅 기법이나 수동 레이블링 없이도 최신 최고 수준의 모델들과 경쟁 가능한 성능을 달성함을 입증하였다.