دياد: إطار قائم على الانتشار للكشف عن الشذوذ متعدد الفئات

الطرق القائمة على إعادة الإعمار قد حققت نتائج ملحوظة في اكتشاف الشذوذ. لقد أثارت قدرات إعادة إعمار الصور الاستثنائية للنماذج المتداولة حديثًا بحوثًا لاستخدامها في تحسين إعادة إعمار الصور الشاذة. ومع ذلك، قد تواجه هذه الطرق تحديات مرتبطة بالحفاظ على فئات الصور وسلامة الهيكل البكسلية في الإعداد متعدد الفئات الأكثر عملية. لحل المشكلات المذكورة أعلاه، نقترح إطارًا للكشف عن الشذوذ باستخدام النموذج التدفقي (DiAD) للكشف عن الشذوذ متعدد الفئات، والذي يتكون من كودر ذاتي يعمل في مجال البكسل، وشبكة دلالية موجهة (SG) تعمل في المجال الكامن مع اتصال بشبكة إزالة الضوضاء الخاصة بالنموذج التدفقي المستقر، وكاشف خصائص تم تدريبه مسبقًا يعمل في مجال الخصائص. أولاً، تم اقتراح الشبكة الدلالية الموجهة لإعادة إعمار المناطق الشاذة مع الحفاظ على المعلومات الدلالية للصورة الأصلية. ثانياً، نقدم كتلة دمج الخصائص المراعية للمكان (SFF) لتحقيق أعلى دقة في إعادة الإعمار عند التعامل مع المناطق التي تم إعادة إعمارها بشكل واسع. ثالثاً، يتم معالجة الصور الأصلية والمعاد إعمارها بواسطة كاشف خصائص تم تدريبه مسبقًا لتوليد خرائط الشذوذ بناءً على الخصائص المستخرجة بمختلف المقاييس. تظهر التجارب على مجموعتي البيانات MVTec-AD وVisA فعالية نهجنا الذي يتفوق على أفضل الطرق الحالية، مثل تحقيق 96.8/52.6 و97.2/99.0 (AUROC/AP) لكل من التوطين والكشف على التوالي في مجموعة بيانات MVTec-AD متعددة الفئات. سيتم توفير الرمز البرمجي عبر الرابط https://lewandofskee.github.io/projects/diad.