HyperAIHyperAI
il y a 10 jours

Désenchevêtrage de la distribution des étiquettes pour la reconnaissance visuelle à queue longue

Youngkyu Hong, Seungju Han, Kwanghee Choi, Seokjun Seo, Beomsu Kim, Buru Chang
Désenchevêtrage de la distribution des étiquettes pour la reconnaissance visuelle à queue longue
Résumé

Le protocole actuel d'évaluation de la reconnaissance visuelle à distribution longue-queue entraîne le modèle de classification sur une distribution de labels source à queue longue et évalue sa performance sur une distribution cible uniforme. Ce protocole soulève des doutes quant à sa faisabilité pratique, car la distribution cible pourrait également être à queue longue. Par conséquent, nous formulons la reconnaissance visuelle à queue longue comme un problème de décalage de labels, où les distributions de labels source et cible diffèrent. L’un des principaux obstacles à la résolution de ce problème réside dans l’entrelacement entre la distribution de labels source et les prédictions du modèle. Dans cet article, nous nous concentrons sur la désentrelacement de la distribution de labels source par rapport aux prédictions du modèle. Nous introduisons d’abord une méthode de base simple mais négligée, qui ajuste la distribution de labels cible par post-traitement des prédictions du modèle entraîné avec la perte d’entropie croisée et la fonction Softmax. Bien que cette méthode dépasse les méthodes de pointe sur des jeux de données standard, elle peut être améliorée en désentrelaçant directement la distribution de labels source des prédictions du modèle pendant l’entraînement. Ainsi, nous proposons une nouvelle méthode, la perte LAbel distribution DisEntangling (LADE), fondée sur la borne optimale de la représentation de Donsker-Varadhan. LADE atteint des performances de pointe sur des jeux de données standard tels que CIFAR-100-LT, Places-LT, ImageNet-LT et iNaturalist 2018. En outre, LADE surpasse les méthodes existantes sur diverses distributions de labels cibles décalées, démontrant ainsi la capacité générale d’adaptation de notre méthode proposée.