DenseHybrid: كشف التقلبات الهجينة للتمييز المفتوح الكثيف

يمكن التفكير في كشف الشذوذ إما من خلال النمذجة التوليدية للبيانات التدريبية المنتظمة، أو من خلال التمييز بالنسبة إلى بيانات تدريب سلبية. وتُظهر هاتان الطريقة أنماط فشل مختلفة. وبالتالي، تُعد الخوارزميات الهجينة هدفًا بحثيًا جذابًا. لكن، يُعد كشف الشذوذ الكثيف مطلوبًا التكافؤ الترجمي (translational equivariance) ودقة عالية جدًا في حجم الإدخال. وتُعد هذه المتطلبات غير متوافقة مع جميع النماذج الهجينة السابقة، على الأقل وفقًا لمعارفنا الحالية. ولهذا السبب، نصمم خوارزمية هجينة جديدة، مستندة إلى إعادة تفسير القيم التمييزية (discriminative logits) كـ لوغاريتم التوزيع المشترك غير المُعَدّل $\hat{p}(\mathbf{x}, \mathbf{y})$. تعتمد نماذجنا على تمثيل مشترك متعدد التحويلات (convolutional representation)، من خلاله نستعيد ثلاث تنبؤات كثيفة: (أ) الاحتمال اللاحق للتصنيف المغلق $P(\mathbf{y}|\mathbf{x})$، (ب) الاحتمال اللاحق لبيانات المجموعة $P(d_{in}|\mathbf{x})$، (ج) احتمالية البيانات غير المُعَدّلة $\hat{p}(\mathbf{x})$. وتُدرَّب التنبؤات الأخيرة على كلا النوعين من البيانات: بيانات التدريب القياسية، وبيانات سلبية عامة. ثم ندمج هاتين التنبؤتين في مقياس هجين للشذوذ، مما يسمح بالتعرف المفتوح الكثيف على الصور الطبيعية كبيرة الحجم. ونُصمم بشكل دقيق خسارة مخصصة لاحتمال البيانات، لتجنب التفاضل العكسي عبر الثابت التطبيع غير القابل للحساب $Z(θ)$. وتُقيّم التجارب مساهماتنا على معايير كشف الشذوذ الكثيف القياسية، وكذلك من حيث مقياس open-mIoU – وهو مقياس جديد لأداء الكشف المفتوح الكثيف. وتُظهر نتائجنا أداءً يُعدّ الأفضل في المجال، مع إضافة ضئيلة جدًا على التكلفة الحسابية مقارنةً بالنموذج القياسي لتصنيف الدلالة (semantic segmentation).