ロングテール学習
ロングテール学習は、視覚認識における最も難しい問題の一つで、多数の画像からロングテール分布に従うカテゴリを用いて高性能なモデルを訓練することを目指しています。ロングテール学習の目的は、データの不均衡下で少数クラスの認識能力を向上させ、より公平で包括的な性能を達成することです。このタスクの実践的価値は、現実世界での偏ったデータ問題を効果的に解決し、モデルの汎化能力和適用性を向上させることにあります。
ImageNet-LT
VL-LTR (ViT-B-16)
CIFAR-100-LT (ρ=100)
LTR-weight-balancing
CIFAR-10-LT (ρ=10)
TADE
iNaturalist 2018
LIFT (ViT-L/14@336px)
CIFAR-100-LT (ρ=10)
TADE
Places-LT
CIFAR-10-LT (ρ=100)
GLMC+MaxNorm (ResNet-34, channel x4)
CIFAR-100-LT (ρ=50)
TADE
MIMIC-CXR-LT
Decoupling (cRT)
NIH-CXR-LT
COCO-MLT
CLIP(ViT-B/16)
VOC-MLT
CIFAR-10-LT (ρ=50)
GLMC + SAM
ImageNet-GLT
RIDE + IFL
EGTEA
CDB-loss (3D- ResNeXt101)
CIFAR-10-LT (ρ=200)
CIFAR-100-LT (ρ=200)
PaCo + SAM
CelebA-5
OPeN (WideResNet-28-10)
Lot-insts
Character-BERT+RS
mini-ImageNet-LT
TailCalibX