تفسيرات منطقية تعتمد على الإنتروبيا للشبكات العصبية

لقد ظهرت الذكاء الاصطناعي القابل للتفسير بشكل سريع منذ أن بدأ المشرّعون في فرض متطلبات نماذج قابلة للتفسير في المجالات الحرجة للسلامة. وقد برزت الشبكات العصبية القائمة على المفاهيم كأساليب قابلة للتفسير من خلال التصميم، إذ تعتمد على رموز قابلة للفهم البشري (أي المفاهيم) للتنبؤ بانتماء الفئات. ومع ذلك، تركز معظم هذه الأساليب على تحديد المفاهيم الأكثر صلة، ولكنها لا تقدم تفسيرات موجزة وصريحة لكيفية استخدام هذه المفاهيم من قبل المصنف في اتخاذ القرارات. في هذا البحث، نقترح نهجًا جديدًا قابلاً للتمييز من الطرفين (end-to-end differentiable) يُمكّن من استخلاص تفسيرات منطقية من الشبكات العصبية باستخدام صيغة المنطق من الرتبة الأولى. يعتمد هذا الأسلوب على معيار يعتمد على الانتروبيا، والذي يقوم تلقائيًا بتحديد المفاهيم الأكثر صلة. ونُجري أربع دراسات حالة مختلفة لتوضيح أن: (أ) يُمكّن هذا المعيار القائم على الانتروبيا من استخلاص تفسيرات منطقية موجزة في المجالات الحرجة للسلامة، بدءًا من البيانات السريرية ووصولًا إلى الرؤية الحاسوبية؛ (ب) يتفوّق الأسلوب المقترح على النماذج البيضاء المتطورة حديثًا من حيث دقة التصنيف، ويُوازي أداء النماذج المظلمة (black box).