تصورات قابلة للتفسير باستخدام شبكات التضمين المميزة

نُقدّم خوارزمية تصور تعتمد على نموذج شبكة عصبية متشابهة (Siamese) غير مراقب جديد، ونظام تدريب ووظيفة خسارة مبتكر، يُسمّى شبكات التضمين التمييزية (Differentiating Embedding Networks - DEN). تقوم الشبكة العصبية المتشابهة باكتشاف الميزات التمييزية أو المتشابهة بين أزواج معينة من العينات في مجموعة بيانات، ثم تستخدم هذه الميزات لدمج مجموعة البيانات في فضاء ثنائي الأبعاد أو أقل، بحيث يمكن تصورها. على عكس خوارزميات التصور الحالية مثل UMAP أو $t$-SNE، فإن DEN تُعدّ خوارزمية بارامترية، ما يسمح بتفسيرها باستخدام تقنيات مثل SHAP. لتمكين التفسير، نُنشئ خوارزمية تجميع بارامترية من الطرف إلى الطرف فوق التصور، ثم نستفيد من قيم SHAP لتحديد الميزات المهمة في فضاء العينات التي تُسهم في فهم الهياكل المرئية الناتجة عن التجميع الناتج عن الخوارزمية. قارنا تصورات DEN مع التقنيات الحالية على مجموعة متنوعة من البيانات، بما في ذلك بيانات الصور وبيانات scRNA-seq. ثم أظهرنا أن خوارزمية التجميع لدينا تُحقق أداءً مشابهًا لأفضل التقنيات الحالية، رغم عدم امتلاكها معرفة مسبقة بعدد المجموعات، كما سجّلت أداءً جديدًا على مستوى الدولة (state-of-the-art) في مجموعة بيانات FashionMNIST. وأخيرًا، نُظهر كيفية اكتشاف الميزات التمييزية لمجموعة البيانات. الكود متاح على: https://github.com/isaacrob/DEN