Langschwanzlernen
Long-tailed Learning ist eines der schwierigsten Probleme im Bereich der visuellen Erkennung und zielt darauf ab, hochleistungsfähige Modelle aus einer großen Anzahl von Bildern zu trainieren, die eine langschwänzige Verteilung von Kategorien aufweisen. Das Ziel des Long-tailed Learnings besteht darin, die Fähigkeit des Modells zu verbessern, Minderheitsklassen bei Datenungleichgewichten zu erkennen, um eine gerechtere und umfassendere Leistung zu erzielen. Der praktische Wert dieser Aufgabe liegt in ihrer Fähigkeit, schief verteilte Datenprobleme in der realen Welt effektiv zu bewältigen und die Generalisierung und Anwendbarkeit der Modelle zu steigern.
ImageNet-LT
VL-LTR (ViT-B-16)
CIFAR-100-LT (ρ=100)
LTR-weight-balancing
CIFAR-10-LT (ρ=10)
TADE
iNaturalist 2018
LIFT (ViT-L/14@336px)
CIFAR-100-LT (ρ=10)
TADE
Places-LT
CIFAR-10-LT (ρ=100)
GLMC+MaxNorm (ResNet-34, channel x4)
CIFAR-100-LT (ρ=50)
TADE
MIMIC-CXR-LT
Decoupling (cRT)
NIH-CXR-LT
COCO-MLT
CLIP(ViT-B/16)
VOC-MLT
CIFAR-10-LT (ρ=50)
GLMC + SAM
ImageNet-GLT
RIDE + IFL
EGTEA
CDB-loss (3D- ResNeXt101)
CIFAR-10-LT (ρ=200)
CIFAR-100-LT (ρ=200)
PaCo + SAM
CelebA-5
OPeN (WideResNet-28-10)
Lot-insts
Character-BERT+RS
mini-ImageNet-LT
TailCalibX