Génération unifiée de paires négatives pour un espace de caractéristiques bien discriminant en reconnaissance faciale

L'objectif de la reconnaissance faciale (RF) peut être considéré comme un problème d'optimisation de la similarité entre paires, en maximisant l'ensemble de similarité $\mathcal{S}^p$ pour les paires positives, tout en minimisant l'ensemble de similarité $\mathcal{S}^n$ pour les paires négatives. Idéalement, il est attendu que les modèles de RF forment un espace de caractéristiques bien discriminatif (WDFS) qui satisfait $\inf{\mathcal{S}^p} > \sup{\mathcal{S}^n}$. En ce qui concerne le WDFS, les paradigmes existants d'apprentissage profond des caractéristiques (c'est-à-dire, les pertes métriques et les pertes de classification) peuvent être exprimés sous un angle unifié en fonction des différentes stratégies de génération de paires (PG). Malheureusement, dans la perte métrique (ML), il est impossible de générer des paires négatives prenant en compte toutes les classes à chaque itération en raison de la taille limitée des mini-batchs. En revanche, dans la perte de classification (CL), il est difficile de générer des paires négatives extrêmement difficiles en raison de la convergence des vecteurs pondérés par classe vers leur centre. Cela entraîne une discordance entre les deux distributions de similarité des paires échantillonnées et de toutes les paires négatives. Ainsi, cet article propose une génération unifiée des paires négatives (UNPG) en combinant deux stratégies PG (c'est-à-dire, MLPG et CLPG) sous un angle unifié afin d'atténuer cette discordance. L'UNPG introduit des informations utiles sur les paires négatives à l'aide du MLPG pour surmonter la lacune du CLPG. De plus, elle inclut le filtrage des similarités des paires négatives bruyantes pour garantir une convergence fiable et une amélioration des performances. Des expériences exhaustives montrent la supériorité de l'UNPG en atteignant des performances au niveau de l'état de l'art sur diverses fonctions de perte récentes dans des jeux de données基准数据集). Notre code et nos modèles pré-entraînés sont disponibles au public.Note: The last sentence has a mix of French and Chinese due to an error in the original text. Here is the corrected version:Des expériences exhaustives montrent la supériorité de l'UNPG en atteignant des performances au niveau de l'état de l'art sur diverses fonctions de perte récentes dans des jeux de données benchmark publics. Notre code et nos modèles pré-entraînés sont disponibles au public.