Quantification de Triplets Profonds

Le deep hashing établit une recherche d'images efficace et performante grâce à l'apprentissage en bout-à-bout de représentations profondes et de codes de hachage à partir de données de similarité. Nous présentons une solution de codage compacte, axée sur l'approche d'apprentissage profond pour la quantification, qui a montré des performances supérieures aux solutions de hachage pour la recherche par similarité. Nous proposons la Deep Triplet Quantization (DTQ), une nouvelle approche permettant d'apprendre des modèles de quantification profonds à partir de triplets de similarité. Pour faciliter un entraînement de triplets plus efficace, nous concevons une nouvelle méthode de sélection de triplets, Group Hard, qui sélectionne aléatoirement des triplets difficiles dans chaque groupe d'images. Pour générer des codes binaires compacts, nous appliquons également une quantification de triplets avec orthogonalité faible pendant l'entraînement des triplets. La perte de quantification réduit la redondance du codebook et améliore la quantifiabilité des représentations profondes par rétropropagation. De nombreuses expériences montrent que DTQ peut générer des codes binaires de haute qualité et compacts, ce qui offre des performances exceptionnelles en recherche d'images sur trois jeux de données de référence : NUS-WIDE, CIFAR-10 et MS-COCO.