画像検索
画像検索は、与えられたクエリ画像と類似した画像を大規模なデータベースから見つけるという、基本的かつ持続的なコンピュータビジョンのタスクです。このタスクは、多くの場合、細かい粒度のインスタンスレベル分類の一種として捉えられ、視覚的類似性やその他の基準を活用して関連画像を効率的に発見することができます。検索や推薦などのアプリケーションにおいて重要な役割を果たしています。
ROxford (Hard)
SuperGlobal
ROxford (Medium)
RParis (Hard)
Hypergraph propagation
RParis (Medium)
CREPE (Compositional REPresentation Evaluation)
ViT-L-14 (LAION400M)
Fashion IQ
Flickr30K 1K test
X-VLM (base)
CIRR
SPN4CIR
SOP
Unicom+ViT-L@336px
Flickr30k-CN
Oxf5k
iNaturalist
Smooth-AP
COCO-CN
Flickr30k
BLIP-2 ViT-L (zero-shot, 1K test set)
MUGE Retrieval
Oxf105k
CARS196
CGD (MG/SG)
CUB-200-2011
CGD (MG/SG)
In-Shop
CGD (SG/GS)
Par106k
Par6k
Offline Diffusion
MS COCO
Oscar
AmsterTime
AP-GeM (ResNet-101)
ConQA Conceptual
CLIP
ConQA Descriptive
PhotoChat
DeepFashion - Consumer-to-shop
CTL Model (ResNet50-IBN-A, 320x320)
DeepPatent
SwinV2
Google Landmarks Dataset v2 (retrieval, testing)
AMES
24/7 Tokyo
HED-N-GAN
Exact Street2Shop
RST Model (ResNet50-IBN-A, 320x320)
Google Landmarks Dataset v2 (retrieval, validation)
UNICOM-ViT-L-14-512px
LaSCo
CASE
MSCOCO
HADA
AIC-ICC
ERNIE-ViL2.0
CBVS
UniCLP
INRIA Holidays
MultiGrain R50 @ 800
Oxford5k
GNN-Reranking
Paris6k
IME layer
street2shop - topwear
Ranknet
WIT
WIT-ALL
CIFAR-10
Custom: 3 conv + 2 fcn
COFAR
KRAMT
DeepFashion
RCCapsNet
FETA Car-Manuals
FooDI-ML (Global)
ADAPT-I2T
FooDI-ML (Spain)
ICFG-PEDES
SSAN
ImageCoDe
ContextualCLIP
INSTRE
Localized Narratives
OPT
NUS-WIDE
DTQ
PKU-Reid
IHDA
PKU SketchRe-ID Dataset
IHDA
ROxford Medium without fine-tuning
HesAff–rSIFT–VLAD
RUC-CAS-WenLan
CMCL