Bildsuche
Bildrecherche ist eine grundlegende und nachhaltige Aufgabe im Bereich der Computer Vision, die darauf abzielt, Bilder zu einem gegebenen Abfragebild aus einer großen Datenbank zu finden. Diese Aufgabe wird oft als eine Form feingranulierter, instanzbasierter Klassifizierung betrachtet, bei der Bildrecherche durch die Nutzung visueller Ähnlichkeit und anderer Kriterien effizient relevante Bilder entdecken kann. Sie spielt eine entscheidende Rolle in Anwendungen wie Suche und Empfehlung.
RParis (Medium)
RParis (Hard)
Hypergraph propagation
ROxford (Medium)
ROxford (Hard)
SuperGlobal
CREPE (Compositional REPresentation Evaluation)
ViT-L-14 (LAION400M)
Fashion IQ
Flickr30K 1K test
X-VLM (base)
CIRR
SPN4CIR
SOP
Unicom+ViT-L@336px
Oxf5k
Flickr30k-CN
iNaturalist
Smooth-AP
Oxf105k
COCO-CN
MUGE Retrieval
Flickr30k
BLIP-2 ViT-L (zero-shot, 1K test set)
CUB-200-2011
CGD (MG/SG)
CARS196
CGD (MG/SG)
In-Shop
CGD (SG/GS)
Par6k
Offline Diffusion
Par106k
MS COCO
Oscar
AmsterTime
AP-GeM (ResNet-101)
ConQA Descriptive
PhotoChat
ConQA Conceptual
CLIP
Google Landmarks Dataset v2 (retrieval, testing)
AMES
DeepFashion - Consumer-to-shop
CTL Model (ResNet50-IBN-A, 320x320)
DeepPatent
SwinV2
24/7 Tokyo
HED-N-GAN
LaSCo
CASE
Google Landmarks Dataset v2 (retrieval, validation)
UNICOM-ViT-L-14-512px
MSCOCO
HADA
Exact Street2Shop
RST Model (ResNet50-IBN-A, 320x320)
INRIA Holidays
MultiGrain R50 @ 800
CBVS
UniCLP
Oxford5k
GNN-Reranking
WIT
WIT-ALL
AIC-ICC
ERNIE-ViL2.0
street2shop - topwear
Ranknet
Paris6k
IME layer
INSTRE
COFAR
KRAMT
FooDI-ML (Spain)
NUS-WIDE
DTQ
ICFG-PEDES
SSAN
PKU SketchRe-ID Dataset
IHDA
Localized Narratives
OPT
ROxford Medium without fine-tuning
HesAff–rSIFT–VLAD
FooDI-ML (Global)
ADAPT-I2T
CIFAR-10
Custom: 3 conv + 2 fcn
FETA Car-Manuals
RUC-CAS-WenLan
CMCL
ImageCoDe
ContextualCLIP
DeepFashion
RCCapsNet
PKU-Reid
IHDA