HyperAIHyperAI
منذ 11 أيام

محاذاة وتقطيع: دمج وتحسين الكشف عن الكائنات المتكيف حسب المجال

Justin Kay, Timm Haucke, Suzanne Stathatos, Siqi Deng, Erik Young, Pietro Perona, Sara Beery, Grant Van Horn
محاذاة وتقطيع: دمج وتحسين الكشف عن الكائنات المتكيف حسب المجال
الملخص

غالبًا ما تؤدي كاشفات الكائنات إلى أداء ضعيف على البيانات التي تختلف عن مجموعات التدريب الخاصة بها. وقد أظهرت الأساليب الحديثة للكشف عن الكائنات المتكيفة حسب المجال (DAOD) نتائج قوية في مواجهة هذا التحدي. ومع ذلك، نحن نحدد عيوبًا منهجية في عملية المعايرة تثير تساؤلات حول النتائج السابقة وتعيق التقدم المستقبلي: (أ) تضخيم الأداء نتيجة لأساسيات غير قوية، (ب) ممارسات تنفيذ غير متسقة تمنع المقارنات الشفافة بين الأساليب، و(ج) قلة العامية الناتجة عن استخدام هيكلات قديمة ونقص التنوع في مجموعات المعايرة. ونعالج هذه المشكلات من خلال تقديم: (1) إطار موحد للمعايرة والتنفيذ، يُسمى "المحاذاة والتقطيع" (ALDI)، يمكّن من مقارنة أساليب DAOD ويدعم التطوير المستقبلي، (2) بروتوكول عادل وحديث للتدريب والتقييم في DAOD يعالج عيوب المعايرة، (3) مجموعة بيانات جديدة لمعايرة DAOD تُسمى CFC-DAOD، تتيح التقييم على بيانات واقعية متنوعة، و(4) طريقة جديدة تُسمى ALDI++، التي تحقق نتائج على مستوى الحد الأقصى من الأداء بفارق كبير. تتفوق ALDI++ على الحد الأقصى السابق من الأداء بـ +3.5 AP50 على تحويل Cityscapes إلى Foggy Cityscapes، و+5.7 AP50 على تحويل Sim10k إلى Cityscapes (حيث نحن الوحيد الذي يتفوق على الأساسيات العادلة)، و+0.6 AP50 على تحويل CFC Kenai إلى Channel. ويتميز كل من ALDI و ALDI++ بأنهما غير مرتبطين ببنية محددة، ويُحدّدان حدًا جديدًا للأداء الأقصى لأساليب DAOD المستندة إلى YOLO وDETR دون الحاجة إلى ضبط معلمات إضافية. يوفر إطارنا، وبياناتنا، وطريقة الأداء الأقصى المتطورة، إعادة ضبط حاسمة لـ DAOD، ويوفر أساسًا قويًا للبحث المستقبلي. الكود والبيانات متاحة عبر: https://github.com/justinkay/aldi و https://github.com/visipedia/caltech-fish-counting.

محاذاة وتقطيع: دمج وتحسين الكشف عن الكائنات المتكيف حسب المجال | أحدث الأوراق البحثية | HyperAI