롱테일 학습
장기 꼬리 학습은 시각 인식에서 가장 어려운 문제 중 하나로, 많은 수의 이미지가 카테고리의 장기 꼬리 분포를 따르는 상황에서 고성능 모델을 훈련시키는 것을 목표로 합니다. 장기 꼬리 학습의 목적은 데이터 불균형 하에서 소수 클래스의 인식 능력을 개선하여, 더 공정하고 포괄적인 성능을 달성하는 것입니다. 이 작업의 실용적 가치는 실제 세계에서 왜곡된 데이터 문제를 효과적으로 해결할 수 있는 능력에 있으며, 이를 통해 모델의 일반화와 적용 범위를 확대할 수 있습니다.
ImageNet-LT
VL-LTR (ViT-B-16)
CIFAR-100-LT (ρ=100)
LTR-weight-balancing
CIFAR-10-LT (ρ=10)
TADE
iNaturalist 2018
LIFT (ViT-L/14@336px)
CIFAR-100-LT (ρ=10)
TADE
Places-LT
CIFAR-10-LT (ρ=100)
GLMC+MaxNorm (ResNet-34, channel x4)
CIFAR-100-LT (ρ=50)
TADE
MIMIC-CXR-LT
Decoupling (cRT)
NIH-CXR-LT
COCO-MLT
CLIP(ViT-B/16)
VOC-MLT
CIFAR-10-LT (ρ=50)
GLMC + SAM
ImageNet-GLT
RIDE + IFL
EGTEA
CDB-loss (3D- ResNeXt101)
CIFAR-10-LT (ρ=200)
CIFAR-100-LT (ρ=200)
PaCo + SAM
CelebA-5
OPeN (WideResNet-28-10)
Lot-insts
Character-BERT+RS
mini-ImageNet-LT
TailCalibX