Classification d'images fine-grainée
La classification d'images à grain fin est une tâche en vision par ordinateur qui vise à catégoriser les images dans des sous-catégories plus précises. Cette tâche nécessite que le modèle soit capable d'identifier et de distinguer des différences visuelles subtiles et des motifs au sein de la même catégorie générale, ce qui la rend particulièrement complexe. Sa valeur d'application réside dans l'amélioration de la précision et du détail de la reconnaissance d'images, adaptée à des scénarios tels que l'identification de spécimens biologiques et la classification de produits.
Stanford Cars
CUB-200-2011
MetaFormer
(MetaFormer-2,384)
FGVC Aircraft
Inceptionv4
NABirds
HERBS
CUB-200-2011
TBMSL-Net
Oxford 102 Flowers
AutoFormer-S | 384
Stanford Dogs
MP
Oxford-IIIT Pets
µ2Net+ (ViT-L/16)
Caltech-101
Food-101
CAP
Oxford-IIIT Pet Dataset
CompCars
Resnet50 + PMAL
Bird-225
WideResNet-101 (Spinal FC)
Birdsnap
EffNet-L2 (SAM)
SUN397
SEER (RegNet10B - linear eval)
10 Monkey Species
Fruits-360
VGG-19bn
FoodX-251
CSWin-L
Imbalanced CUB-200-2011
PC-Softmax
Kuzushiji-MNIST
BoxCars116K
iNaturalist
TASN
Herbarium 2021 Half–Earth
Herbarium 2022
Conviformer-B
Bottles
CarFlag-1532
CarFlag-563
ResNet101-swp
Con-Text
PHOC descriptor + Fisher Vector Encoding
DIB-10K
MetaFGNet
EMNIST-Digits
VGG-5
EMNIST-Letters
VGG-5
FGVC-Aircraft
EnGraf-Net101 (G=4, H=1)
MNIST
Vanilla FC layer only
QMNIST
VGG-5
SOP
Assemble-ResNet-FGVC-50
STL-10
Pre trained wide-resnet-101