Réfléchir à l'optimisation de la précision moyenne : pénaliser uniquement les instances négatives avant les instances positives est suffisant

L’optimisation de l’approximation de la précision moyenne (Average Precision, AP) a fait l’objet de nombreuses études dans le domaine du traitement d’images. En raison de la définition même de l’AP, les méthodes existantes prennent en compte le classement à la fois des instances négatives et positives situées avant chaque instance positive. Toutefois, nous affirmons qu’il suffit de pénaliser uniquement les instances négatives situées avant les instances positives, car c’est uniquement à partir de ces dernières que provient la perte. À cet effet, nous proposons une nouvelle fonction de perte, nommée Penalizing Negative instances before Positive ones (PNP), qui permet de minimiser directement le nombre d’instances négatives situées avant chaque instance positive. Par ailleurs, les méthodes basées sur l’AP adoptent une stratégie fixe et sous-optimale d’attribution de gradients. Nous menons donc une analyse systématique de différentes stratégies d’attribution de gradients en construisant des fonctions dérivées de la perte, ce qui conduit à deux variantes : PNP-I, basée sur des fonctions dérivées croissantes, et PNP-D, fondée sur des fonctions dérivées décroissantes. PNP-I accorde des gradients plus importants aux instances positives difficiles, en cherchant à rapprocher toutes les instances pertinentes. En revanche, PNP-D accorde moins d’attention à ces instances et les corrige progressivement. Dans la plupart des jeux de données réels, une même classe contient généralement plusieurs sous-groupes locaux (clusters). PNP-I tend à regrouper aveuglément ces clusters, tandis que PNP-D les préserve tels quels. Par conséquent, PNP-D s’avère plus performant. Des expériences menées sur trois jeux de données standards de recherche d’images montrent des résultats cohérents avec cette analyse. Des évaluations étendues démontrent que PNP-D atteint un niveau de performance au sommet de l’état de l’art. Le code est disponible à l’adresse suivante : https://github.com/interestingzhuo/PNPloss