اكتشاف البيانات خارج التوزيع دون تسميات فئوية

اكتشاف البيانات خارج التوزيع يهدف إلى تحديد الابتكارات، وهي العينات التي تختلف عن المعيار. وقد وُجد أن هذه المهمة تكون صعبة للغاية، خاصة في الحالات التي يتكون فيها توزيع البيانات الطبيعية من عدة فئات معنوية (مثل، عدة فئات للكائنات). لتجاوز هذا التحدي، تتطلب الأساليب الحالية تسمية الصور الطبيعية يدويًا أثناء التدريب. في هذا العمل، نواجه اكتشاف الابتكارات متعدد الفئات دون الحاجة إلى تسميات الفئات. حلنا البسيط ولكن الفعال يتكون من مرحلتين: أولاً، نكتشف تسميات الفئات الوهمية باستخدام التجميع غير المنظوم (unsupervised clustering). ثم باستخدام هذه التسميات الوهمية، نتمكن من استخدام طرق الاكتشاف المشرف عليها للتوزيع خارج النموذج القياسي. نتحقق من أداء طريقتنا من خلال مقارنة مواتية مع أفضل ما تم الوصول إليه حتى الآن (state-of-the-art)، ونقدم تحليلًا شاملاً وإزالة متغيرات (ablations).