PCNN: تفسيرات الجيران الأقرب من الفئة المحتملة تُحسّن دقة التصنيف الدقيق للصور بالنسبة للذكاء الاصطناعي والبشر

تُستخدم الجيران الأقرب (NN) تقليديًا لحساب القرارات النهائية، مثل في آلات الدعم المتجه (Support Vector Machines) أو فئات k-NN، ولتقديم تفسيرات للمستخدمين حول قرارات النموذج. في هذه الورقة، نُظهر استخدامًا جديدًا للجيران الأقرب: تحسين تنبؤات فئة صور مُدرّبة مسبقًا وثابتة (frozen) C. نستفيد من مُقارِن صور S الذي (1) يقارن الصورة المدخلة بالصور المجاورة (الجيران الأقرب) من الفئات الخمسة العُليا الأكثر احتمالًا التي تُقدّمها C؛ و(2) يستخدم الدرجات الناتجة من S لوزن درجات الثقة الخاصة بـ C بهدف تحسين التنبؤات. يُظهر نهجنا تحسينًا مستمرًا في دقة التصنيف الدقيق للصور على مجموعات بيانات CUB-200 وCars-196 وDogs-120. كما أظهرت دراسة إنسانية أن عرض الجيران الأقرب للفئات الاحتمالية (PCNN) يقلل من الاعتماد الزائد على الذكاء الاصطناعي، مما يُحسّن دقة قرارات المستخدمين مقارنة بالأساليب السابقة التي تُظهر فقط أمثلة الفئة الأكثر احتمالًا (الصف الأول - top-1).