HyperAIHyperAI
منذ 2 أشهر

D-FINE: إعادة تعريف مهمة الانحدار في DETRs كتحسين دقيق للتوزيع

Yansong Peng; Hebei Li; Peixi Wu; Yueyi Zhang; Xiaoyan Sun; Feng Wu
D-FINE: إعادة تعريف مهمة الانحدار في DETRs كتحسين دقيق للتوزيع
الملخص

نقدم D-FINE، وهو نظام كشف الأشياء في الوقت الفعلي قوي يحقق دقة توطين متميزة بإعادة تعريف مهمة تقدير الصندوق الحدودي في نماذج DETR. يتكون D-FINE من مكونين رئيسيين: تحسين التوزيع الدقيق (Fine-grained Distribution Refinement - FDR) والتدريس الذاتي للتوطين الأمثل عالمياً (Global Optimal Localization Self-Distillation - GO-LSD). يقوم FDR بتحويل عملية التقدير من التنبؤ بالإحداثيات الثابتة إلى تكرار تحسين التوزيعات الاحتمالية، مما يوفر تمثيلًا وسيطًا دقيقًا يعزز بشكل كبير دقة التوطين. أما GO-LSD فهي استراتيجية تحسين ثنائية الاتجاه تقوم بنقل المعرفة المتعلقة بالتوطين من التوزيعات المكررة إلى الطبقات الأعمق عبر التدريس الذاتي، بينما تبسط مهام التنبؤ المتبقية للطبقات الأعمق. بالإضافة إلى ذلك، يدمج D-FINE تحسينات خفيفة الوزن في الوحدات والعمليات التي تستهلك الكثير من الحسابات، مما يحقق توازنًا أفضل بين السرعة والدقة. وبشكل محدد، يصل D-FINE-L / X إلى نسبة AP 54.0% / 55.8% على مجموعة بيانات COCO بمعدل 124 / 78 إطارًا في الثانية على وحدة معالجة الرسومات NVIDIA T4. عند استخدامه بعد التدريب المسبق على Objects365، يصل D-FINE-L / X إلى نسبة AP 57.1% / 59.3%,تفوق جميع الكاشفات الزمنية الفعلية الموجودة حاليًا. علاوة على ذلك، يعزز أسلوبنا أداء مجموعة واسعة من نماذج DETR بنسبة AP تصل إلى 5.3% مع زيادة طفيفة جدًا في عدد المعلمات وتكلفة التدريب. يمكن الوصول إلى شفرتنا وموديلاتنا المدربة مسبقًا عبر الرابط: https://github.com/Peterande/D-FINE.请注意,最后一个句子中的“https://github.com/Peterande/D-FINE”是一个网址,不需要翻译。另外,为了符合阿拉伯语的书写习惯,我将逗号的位置调整为在单词之后。

D-FINE: إعادة تعريف مهمة الانحدار في DETRs كتحسين دقيق للتوزيع | أحدث الأوراق البحثية | HyperAI