Bildsuche
Bildrecherche ist eine grundlegende und nachhaltige Aufgabe im Bereich der Computer Vision, die darauf abzielt, Bilder zu einem gegebenen Abfragebild aus einer großen Datenbank zu finden. Diese Aufgabe wird oft als eine Form feingranulierter, instanzbasierter Klassifizierung betrachtet, bei der Bildrecherche durch die Nutzung visueller Ähnlichkeit und anderer Kriterien effizient relevante Bilder entdecken kann. Sie spielt eine entscheidende Rolle in Anwendungen wie Suche und Empfehlung.
ROxford (Hard)
SuperGlobal
ROxford (Medium)
RParis (Hard)
Hypergraph propagation
RParis (Medium)
CREPE (Compositional REPresentation Evaluation)
ViT-L-14 (LAION400M)
Fashion IQ
Flickr30K 1K test
X-VLM (base)
CIRR
SPN4CIR
SOP
Unicom+ViT-L@336px
Flickr30k-CN
Oxf5k
iNaturalist
Smooth-AP
COCO-CN
Flickr30k
BLIP-2 ViT-L (zero-shot, 1K test set)
MUGE Retrieval
Oxf105k
CARS196
CGD (MG/SG)
CUB-200-2011
CGD (MG/SG)
In-Shop
CGD (SG/GS)
Par106k
Par6k
Offline Diffusion
MS COCO
Oscar
AmsterTime
AP-GeM (ResNet-101)
ConQA Conceptual
CLIP
ConQA Descriptive
PhotoChat
DeepFashion - Consumer-to-shop
CTL Model (ResNet50-IBN-A, 320x320)
DeepPatent
SwinV2
Google Landmarks Dataset v2 (retrieval, testing)
AMES
24/7 Tokyo
HED-N-GAN
Exact Street2Shop
RST Model (ResNet50-IBN-A, 320x320)
Google Landmarks Dataset v2 (retrieval, validation)
UNICOM-ViT-L-14-512px
LaSCo
CASE
MSCOCO
HADA
AIC-ICC
ERNIE-ViL2.0
CBVS
UniCLP
INRIA Holidays
MultiGrain R50 @ 800
Oxford5k
GNN-Reranking
Paris6k
IME layer
street2shop - topwear
Ranknet
WIT
WIT-ALL
CIFAR-10
Custom: 3 conv + 2 fcn
COFAR
KRAMT
DeepFashion
RCCapsNet
FETA Car-Manuals
FooDI-ML (Global)
ADAPT-I2T
FooDI-ML (Spain)
ICFG-PEDES
SSAN
ImageCoDe
ContextualCLIP
INSTRE
Localized Narratives
OPT
NUS-WIDE
DTQ
PKU-Reid
IHDA
PKU SketchRe-ID Dataset
IHDA
ROxford Medium without fine-tuning
HesAff–rSIFT–VLAD
RUC-CAS-WenLan
CMCL