2달 전

ML-Decoder: 확장성과 다목적 분류 헤드

Ridnik, Tal ; Sharir, Gilad ; Ben-Cohen, Avi ; Ben-Baruch, Emanuel ; Noy, Asaf
ML-Decoder: 확장성과 다목적 분류 헤드
초록

본 논문에서는 새로운 주의 기반 분류 헤드인 ML-Decoder를 소개합니다. ML-Decoder는 쿼리를 통해 클래스 레이블의 존재를 예측하며, 글로벌 평균 풀링에 비해 공간 데이터를 더 효과적으로 활용할 수 있습니다. 디코더 아키텍처를 재설계하고 새로운 그룹 디코딩 방식을 사용함으로써, ML-Decoder는 매우 효율적이며 수천 개의 클래스까지 확장할 수 있습니다. 더 큰 백본을 사용하는 것과 비교하여 ML-Decoder는 일관된 속도-정확도 균형을 제공합니다. 또한 ML-Decoder는 다목적입니다 - 다양한 분류 헤드의 대체품으로 사용될 수 있으며, 단어 쿼리와 함께 작동할 때 미지의 클래스에도 일반화할 수 있습니다. 새로운 쿼리 증강 방법은 그 일반화 능력을 더욱 향상시킵니다. ML-Decoder를 사용하여 우리는 여러 분류 작업에서 최고 수준의 결과를 달성했습니다: MS-COCO 다중 레이블에서 91.4% mAP, NUS-WIDE 제로샷에서 31.1% ZSL mAP, 그리고 추가 데이터나 지도 없이 기본 ResNet50 백본을 사용한 ImageNet 단일 레이블에서 새로운 최고 점수인 80.7%를 기록했습니다. 공개 코드는 다음 주소에서 확인 가능합니다: https://github.com/Alibaba-MIIL/ML_Decoder

ML-Decoder: 확장성과 다목적 분류 헤드 | 최신 연구 논문 | HyperAI초신경