تصنيف موثوق طويل الذيل

التقسيم على البيانات الموزعة بشكل طويل الذيل يُعد مشكلة صعبة، إذ يعاني من توازن فئات غير متكافئ بشكل خطير، مما يؤدي إلى أداء غير مرضٍ خاصةً في الفئات الضعيفة (الذيل). في الآونة الأخيرة، حققت الطرق القائمة على التجميع (الإندماج) أفضل الأداء الممكن، وتبين إمكاناتها الكبيرة. ومع ذلك، توجد حاليًا قيودتان رئيسيتان في هذه الطرق. أولًا، لا يمكن الاعتماد على تنبؤاتها في التطبيقات الحساسة للعوائق، وهو أمر مُضر بشكل خاص للفئات الضعيفة التي تكثر فيها الأخطاء في التنبؤ. ثانيًا، تُخصص نفس العدد من الخبراء لكل عينة، مما يؤدي إلى إهدار موارد حسابية كبيرة بالنسبة للعينات السهلة. لمعالجة هذه المشكلات، نقترح طريقة تصنيف طويل الذيل الموثوق (TLC) التي تُنفّذ بشكل متكامل التصنيف وتقييم عدم اليقين لتحديد العينات الصعبة ضمن إطار متعدد الخبراء. تعتمد طريقة TLC على استخلاص عدم اليقين المستند إلى الأدلة (EvU) لكل خبير، ثم دمج هذه الأدلة وعدم اليقين تحت نظرية الأدلة ديمستر-شافر (DST). علاوة على ذلك، نقترح آلية تفاعل خبراء ديناميكية لتقليل عدد الخبراء المشاركين في العينات السهلة، مما يحقق الكفاءة مع الحفاظ على أداء متميز. وأخيرًا، نُجري تجارب شاملة على مهام التصنيف، وكشف الفئات الضعيفة، وكشف البيانات غير المألوفة (OOD)، وتنبؤ الفشل. تُظهر النتائج التجريبية أن طريقة TLC تتفوق على الطرق الحالية، وتمتاز بالموثوقية من خلال تقييم موثوق لعدم اليقين.