2달 전

문맥-의미 품질 인식 네트워크를 이용한 세부 시각 분류

Xu, Qin ; Li, Sitong ; Wang, Jiahui ; Jiang, Bo ; Tang, Jinhui
문맥-의미 품질 인식 네트워크를 이용한 세부 시각 분류
초록

유사한 외관을 가진 하위 카테고리 간의 미묘하면서도 독특한 특징을 탐색하고 발굴하는 것은 세부적인 시각적 분류(Fine-Grained Visual Categorization, FGVC)에 있어 매우 중요합니다. 그러나 추출된 시각적 표현의 품질을 평가하는 데는 상대적으로 적은 노력이 기울여져 왔습니다. 직관적으로, 네트워크는 저품질 샘플에서 차별화된 특징을 포착하는 데 어려움을 겪을 수 있으며, 이로 인해 FGVC 성능이 크게 저하될 수 있습니다. 이러한 도전 과제를 해결하기 위해, 우리는 약간의 감독이 필요한 문맥-의미 품질 인식 네트워크(Context-Semantic Quality Awareness Network, CSQA-Net)를 제안합니다.이 네트워크에서는 객체 내에서 더 많은 차별화된 세부 정보를 포착하기 위해 풍부한 부분 설명자와 전역 의미 사이의 공간적 문맥 관계를 모델링하기 위한 새로운 다중 부분 및 다중 스케일 크로스 어텐션(Multi-Part and Multi-Scale Cross-Attention, MPMSCA) 모듈을 설계하였습니다. MPMSCA 모듈에 입력되기 전에, 스케일 혼동 문제를 해결하고 지역적으로 독특한 영역을 정확히 식별하기 위한 부분 네비게이터(Part Navigator)를 개발하였습니다. 또한, 백본 네트워크의 다양한 수준에서 계층적인 의미를 점진적으로 감독하고 강화하기 위한 일반적인 다중 수준 의미 품질 평가 모듈(Multi-Level Semantic Quality Evaluation, MLSQE)을 제안하였습니다.마지막으로, MPMSCA에서 얻은 문맥 인식 특징과 MLSQE에서 얻은 의미적으로 강화된 특징은 각각 해당하는 품질 탐지 분류기(Quality Probing Classifiers)에 입력되어 실시간으로 그 품질을 평가함으로써 특징 표현의 차별성을 증대시킵니다. 네 가지 유명하고 경쟁력 있는 FGVC 데이터셋에 대한 포괄적인 실험 결과는 제안된 CSQA-Net이 최신 방법들과 비교하여 우수함을 입증하였습니다.

문맥-의미 품질 인식 네트워크를 이용한 세부 시각 분류 | 최신 연구 논문 | HyperAI초신경