إكمال البيانات المفقودة للتعلم الإشرافي

يمكن أن يساعد استكمال البيانات المفقودة في تحسين أداء نماذج التنبؤ في الحالات التي تخفي فيها البيانات المفقودة معلومات مفيدة. يقوم هذا البحث بمقارنة طرق استكمال البيانات الفئوية المفقودة لمهام التصنيف الإشرافي. قمنا بإجراء تجارب على مجموعتين من بيانات الاختبار القياسية في مجال التعلم الآلي تحتويان على بيانات فئوية مفقودة، حيث قارنا بين تصنيفات تم تدريبها على بيانات غير مستكملة (أي تم ترميزها باستخدام الترميز الثنائي) أو بيانات مستكملة مع مستويات مختلفة من الإرباك الناجم عن البيانات المفقودة. أظهرنا أن طرق الاستكمال يمكن أن تزيد من دقة التنبؤ في وجود إرباك البيانات المفقودة، مما يمكن أن يحسن دقة التنبؤ بشكل فعلي من خلال تنظيم المصنف. حققنا أفضل النتائج الحالية على مجموعة بيانات البالغين (Adult) مع إرباك البيانات المفقودة واستكمال k-أقرب جيران (k-NN).