بعيدًا في الفضاء العميق: ك detecion للبيانات غير الموزعة المستندة إلى الجيران الأقرب الكثيف

المحور الأساسي للكشف عن التوزيعات الخارجة عن التوزيع المُدرَّب يكمن في تقدير كثافة البيانات التي تنتمي إلى التوزيع المُدرَّب أو تمثيلاتها المميزة. ويشكل هذا تحديًا كبيرًا في الكشف عن الشذوذ الكثيف في المجالات التي تمتلك فيها البيانات المنتمية إلى التوزيع المُدرَّب بنية معقدة كامنة. وقد أُثبت أن مناهج الجيران الأقرب تعمل بشكل جيد في مجالات البيانات ذات المحور الكائن، مثل فحص الصناعات والتصنيف الصوتي. في هذه الورقة، نُظهر أن مناهج الجيران الأقرب تُحقّق أيضًا نتائج من الطراز الرائد في الكشف عن الجديد الكثيف في المشاهد المعقدة للقيادة، بشرط استخدام تمثيل مميز مناسب. وتحديدًا، نجد أن المعمارية القائمة على النموذج التحويلي (Transformer) تُنتج تمثيلات تُقدّم مقاييس تشابه أفضل بكثير لهذا المهمة. ونحدد البنية متعددة الرؤوس (multi-head) في هذه النماذج كواحدة من الأسباب، ونُظهر طريقة لنقل بعض هذه التحسينات إلى الشبكات العصبية التلافيفية (CNNs). في النهاية، يُعد هذا النهج بسيطًا وغير مُدخل، أي أنه لا يؤثر على أداء التجزئة الأساسي، ولا يتطلب تدريبًا على أمثلة الشذوذ، ويحقق نتائج من الطراز الرائد على مجموعتي بيانات RoadAnomaly وStreetHazards وSegmentMeIfYouCan-Anomaly.