استرجاع الصور
استرجاع الصور هو مهمة أساسية ودائمة في مجال رؤية الحاسوب تهدف إلى العثور على صور مشابهة لصورة استعلام معينة من قاعدة بيانات كبيرة. غالبًا ما يُنظر إلى هذه المهمة كشكل من أشكال التصنيف الدقيق على مستوى المثال، حيث يمكن لاسترجاع الصور أن يكتشف الصور ذات الصلة بكفاءة من خلال الاستفادة من التشابه البصري ومعايير أخرى، مما يجعلها تلعب دورًا حاسمًا في التطبيقات مثل البحث والتوصية.
RParis (Medium)
RParis (Hard)
Hypergraph propagation
ROxford (Medium)
ROxford (Hard)
SuperGlobal
CREPE (Compositional REPresentation Evaluation)
ViT-L-14 (LAION400M)
Fashion IQ
Flickr30K 1K test
X-VLM (base)
CIRR
SPN4CIR
SOP
Unicom+ViT-L@336px
Oxf5k
Flickr30k-CN
iNaturalist
Smooth-AP
Oxf105k
COCO-CN
MUGE Retrieval
Flickr30k
BLIP-2 ViT-L (zero-shot, 1K test set)
CUB-200-2011
CGD (MG/SG)
CARS196
CGD (MG/SG)
In-Shop
CGD (SG/GS)
Par6k
Offline Diffusion
Par106k
MS COCO
Oscar
AmsterTime
AP-GeM (ResNet-101)
ConQA Descriptive
PhotoChat
ConQA Conceptual
CLIP
Google Landmarks Dataset v2 (retrieval, testing)
AMES
DeepFashion - Consumer-to-shop
CTL Model (ResNet50-IBN-A, 320x320)
DeepPatent
SwinV2
24/7 Tokyo
HED-N-GAN
LaSCo
CASE
Google Landmarks Dataset v2 (retrieval, validation)
UNICOM-ViT-L-14-512px
MSCOCO
HADA
Exact Street2Shop
RST Model (ResNet50-IBN-A, 320x320)
INRIA Holidays
MultiGrain R50 @ 800
CBVS
UniCLP
Oxford5k
GNN-Reranking
WIT
WIT-ALL
AIC-ICC
ERNIE-ViL2.0
street2shop - topwear
Ranknet
Paris6k
IME layer
INSTRE
COFAR
KRAMT
FooDI-ML (Spain)
NUS-WIDE
DTQ
ICFG-PEDES
SSAN
PKU SketchRe-ID Dataset
IHDA
Localized Narratives
OPT
ROxford Medium without fine-tuning
HesAff–rSIFT–VLAD
FooDI-ML (Global)
ADAPT-I2T
CIFAR-10
Custom: 3 conv + 2 fcn
FETA Car-Manuals
RUC-CAS-WenLan
CMCL
ImageCoDe
ContextualCLIP
DeepFashion
RCCapsNet
PKU-Reid
IHDA