Récupération d'images
La recherche d'images est une tâche fondamentale et durable en vision par ordinateur visant à trouver des images similaires à une image de requête donnée dans une grande base de données. Cette tâche est souvent considérée comme une forme de classification fine-grain, au niveau de l'instance, où la recherche d'images peut efficacement découvrir des images pertinentes en exploitant la similarité visuelle et d'autres critères, jouant un rôle crucial dans les applications telles que la recherche et les recommandations.
ROxford (Hard)
SuperGlobal
ROxford (Medium)
RParis (Hard)
Hypergraph propagation
RParis (Medium)
CREPE (Compositional REPresentation Evaluation)
ViT-L-14 (LAION400M)
Fashion IQ
Flickr30K 1K test
X-VLM (base)
CIRR
SPN4CIR
SOP
Unicom+ViT-L@336px
Flickr30k-CN
Oxf5k
iNaturalist
Smooth-AP
COCO-CN
Flickr30k
BLIP-2 ViT-L (zero-shot, 1K test set)
MUGE Retrieval
Oxf105k
CARS196
CGD (MG/SG)
CUB-200-2011
CGD (MG/SG)
In-Shop
CGD (SG/GS)
Par106k
Par6k
Offline Diffusion
MS COCO
Oscar
AmsterTime
AP-GeM (ResNet-101)
ConQA Conceptual
CLIP
ConQA Descriptive
PhotoChat
DeepFashion - Consumer-to-shop
CTL Model (ResNet50-IBN-A, 320x320)
DeepPatent
SwinV2
Google Landmarks Dataset v2 (retrieval, testing)
AMES
24/7 Tokyo
HED-N-GAN
Exact Street2Shop
RST Model (ResNet50-IBN-A, 320x320)
Google Landmarks Dataset v2 (retrieval, validation)
UNICOM-ViT-L-14-512px
LaSCo
CASE
MSCOCO
HADA
AIC-ICC
ERNIE-ViL2.0
CBVS
UniCLP
INRIA Holidays
MultiGrain R50 @ 800
Oxford5k
GNN-Reranking
Paris6k
IME layer
street2shop - topwear
Ranknet
WIT
WIT-ALL
CIFAR-10
Custom: 3 conv + 2 fcn
COFAR
KRAMT
DeepFashion
RCCapsNet
FETA Car-Manuals
FooDI-ML (Global)
ADAPT-I2T
FooDI-ML (Spain)
ICFG-PEDES
SSAN
ImageCoDe
ContextualCLIP
INSTRE
Localized Narratives
OPT
NUS-WIDE
DTQ
PKU-Reid
IHDA
PKU SketchRe-ID Dataset
IHDA
ROxford Medium without fine-tuning
HesAff–rSIFT–VLAD
RUC-CAS-WenLan
CMCL