تصنيف الصور الدقيق
التصنيف الدقيق للصور هو مهمة في رؤية الحاسوب تهدف إلى تصنيف الصور إلى فئات جزئية أكثر تحديدًا. تتطلب هذه المهمة من النموذج القدرة على تحديد وتمييز الاختلافات البصرية الدقيقة والأنماط داخل نفس الفئة العامة، مما يجعلها مهمة معقدة للغاية. تكمن قيمة تطبيقها في تحسين دقة وتفاصيل التعرف على الصور، وهي مناسبة للسيناريوهات مثل تحديد الأنواع البيولوجية وتصنيف المنتجات.
Stanford Cars
CUB-200-2011
MetaFormer
(MetaFormer-2,384)
FGVC Aircraft
Inceptionv4
NABirds
HERBS
CUB-200-2011
TBMSL-Net
Oxford 102 Flowers
AutoFormer-S | 384
Stanford Dogs
MP
Oxford-IIIT Pets
µ2Net+ (ViT-L/16)
Caltech-101
Food-101
CAP
Oxford-IIIT Pet Dataset
CompCars
Resnet50 + PMAL
Bird-225
WideResNet-101 (Spinal FC)
Birdsnap
EffNet-L2 (SAM)
SUN397
SEER (RegNet10B - linear eval)
10 Monkey Species
Fruits-360
VGG-19bn
FoodX-251
CSWin-L
Imbalanced CUB-200-2011
PC-Softmax
Kuzushiji-MNIST
BoxCars116K
iNaturalist
TASN
Herbarium 2021 Half–Earth
Herbarium 2022
Conviformer-B
Bottles
CarFlag-1532
CarFlag-563
ResNet101-swp
Con-Text
PHOC descriptor + Fisher Vector Encoding
DIB-10K
MetaFGNet
EMNIST-Digits
VGG-5
EMNIST-Letters
VGG-5
FGVC-Aircraft
EnGraf-Net101 (G=4, H=1)
MNIST
Vanilla FC layer only
QMNIST
VGG-5
SOP
Assemble-ResNet-FGVC-50
STL-10
Pre trained wide-resnet-101