7일 전

2020년 LVIS 챌린지 1위 솔루션: 좋은 박스가 좋은 마스크를 보장하지는 않는다

Jingru Tan, Gang Zhang, Hanming Deng, Changbao Wang, Lewei Lu, Quanquan Li, Jifeng Dai
2020년 LVIS 챌린지 1위 솔루션: 좋은 박스가 좋은 마스크를 보장하지는 않는다
초록

이 논문은 LVIS Challenge 2020에 참가한 팀 lvisTraveler의 솔루션을 소개한다. 본 연구에서는 LVIS 데이터셋의 두 가지 주요 특성—긴 꼬리 분포(long-tailed distribution)와 고해상도 인스턴스 세그멘테이션 마스크—를 중심적으로 고려하였다. 우리는 이중 단계 학습 파이프라인을 채택하였다. 첫 번째 단계에서는 EQL(Enhanced Quality Learning)과 자기 학습(self-training)을 도입하여 일반화된 표현을 학습하였다. 두 번째 단계에서는 분류기를 강화하기 위해 Balanced GroupSoftmax를 활용하였으며, 더 정밀한 마스크 예측을 위해 새로운 제안 박스 할당 전략(proposal assignment strategy)과 새로운 균형 잡힌 마스크 손실 함수(balanced mask loss)를 제안하였다. 최종적으로, LVIS v1.0 검증(val) 및 테스트-개발(test-dev) 세트에서 각각 41.5 및 41.2 AP를 달성하였으며, X101-FPN-MaskRCNN 기반의 베이스라인에 비해 크게 우수한 성능을 보였다.

2020년 LVIS 챌린지 1위 솔루션: 좋은 박스가 좋은 마스크를 보장하지는 않는다 | 최신 연구 논문 | HyperAI초신경