التعلم ذي الذيل الطويل
التعلم ذو الذيل الطويل هو أحد أكثر التحديات صعوبة في مجال التعرف البصري، حيث يهدف إلى تدريب نماذج ذات أداء عالي من عدد كبير من الصور التي تتبع توزيعًا ذي ذيل طويل للفئات. الهدف من التعلم ذو الذيل الطويل هو تحسين قدرة النموذج على التعرف على الفئات القليلة تحت عدم التوازن في البيانات، مما يؤدي إلى تحقيق أداء أكثر عدالة وشمولية. القيمة العملية لهذه المهمة تكمن في قدرتها على معالجة مشاكل البيانات غير المتوازنة بشكل فعال في العالم الحقيقي، مما يعزز تعميم النماذج وتطبيقاتها.
ImageNet-LT
VL-LTR (ViT-B-16)
CIFAR-100-LT (ρ=100)
LTR-weight-balancing
CIFAR-10-LT (ρ=10)
TADE
iNaturalist 2018
LIFT (ViT-L/14@336px)
CIFAR-100-LT (ρ=10)
TADE
Places-LT
CIFAR-10-LT (ρ=100)
GLMC+MaxNorm (ResNet-34, channel x4)
CIFAR-100-LT (ρ=50)
TADE
MIMIC-CXR-LT
Decoupling (cRT)
NIH-CXR-LT
COCO-MLT
CLIP(ViT-B/16)
VOC-MLT
CIFAR-10-LT (ρ=50)
GLMC + SAM
ImageNet-GLT
RIDE + IFL
EGTEA
CDB-loss (3D- ResNeXt101)
CIFAR-10-LT (ρ=200)
CIFAR-100-LT (ρ=200)
PaCo + SAM
CelebA-5
OPeN (WideResNet-28-10)
Lot-insts
Character-BERT+RS
mini-ImageNet-LT
TailCalibX