Solution Primée 1re Place du Défi LVIS 2020 : Un Bon Bounding Box Ne Garantit Pas un Bon Masque

Cet article présente les solutions développées par l’équipe lvisTraveler pour le LVIS Challenge 2020. Dans ce travail, deux caractéristiques principales du jeu de données LVIS sont prises en compte : la distribution longue-taillée et la qualité élevée des masques d’instance. Nous adoptons une pipeline d’entraînement en deux étapes. Dans la première étape, nous intégrons EQL et le self-training afin d’apprendre une représentation généralisée. Dans la deuxième étape, nous utilisons le Balanced GroupSoftmax pour améliorer le classificateur, et proposons une nouvelle stratégie d’attribution de propositions ainsi qu’une nouvelle perte équilibrée pour le masque, afin d’obtenir des prédictions de masques plus précises. Enfin, nous atteignons des scores de 41,5 et 41,2 AP sur les ensembles de validation et de test-dev du LVIS v1.0 respectivement, surpassant largement la base linéaire fondée sur X101-FPN-MaskRCNN.