Recherche de visages à grande échelle : 80 millions de galerie

En raison de la prévalence des sites de médias sociaux, un défi majeur pour les chercheurs en vision par ordinateur est d'élaborer des méthodes permettant de traiter et de rechercher des personnes d'intérêt parmi les milliards de photos partagées sur ces sites. Dans une note blanche publiée en 2013, Facebook a révélé que ses utilisateurs avaient téléchargé plus de 250 milliards de photos et qu'ils téléchargeaient 350 millions de nouvelles photos chaque jour. En raison de cette quantité massive de données, la recherche à grande échelle de visages pour l'exploration d'images web est à la fois importante et complexe. Bien que des progrès significatifs aient été réalisés dans la reconnaissance faciale, la recherche dans une vaste collection d'images faciales non contraintes n'a pas encore été suffisamment abordée. Pour relever ce défi, nous proposons un système de recherche faciale qui combine une procédure de recherche rapide avec un comparateur commercial prêt à l'emploi (COTS) d'avant-garde, dans un cadre en cascade. Étant donné un visage cible, nous filtrons tout d'abord le grand ensemble de photos pour trouver les k visages les plus similaires en utilisant des caractéristiques profondes générées par un réseau neuronal convolutif. Les k candidats sont ensuite réordonnés en combinant les similarités provenant des caractéristiques profondes et du comparateur COTS. Nous évaluons le système proposé de recherche faciale sur un ensemble contenant 80 millions d'images faciales téléchargées sur le web. Les résultats expérimentaux montrent que les caractéristiques profondes sont compétitives avec les méthodes d'avant-garde sur les bancs d'essai de reconnaissance faciale non contrainte (LFW et IJB-A). De plus, le système proposé offre un excellent compromis entre précision et évolutivité sur des jeux de données composés de millions d'images. Dans une expérience consistant à rechercher des images faciales des frères Tsarnaev, condamnés pour l'attentat du marathon de Boston, le système proposé a pu trouver la photo du frère cadet (Dzhokhar Tsarnaev) au premier rang en 1 seconde dans une galerie de 5 millions d'images et au huitième rang en 7 secondes dans une galerie de 80 millions d'images.