HyperAIHyperAI
منذ 2 أشهر

DEIM: DETR مع تحسين التطابق لل렴 grenvergence السريع 请注意,"Fast Convergence" 通常翻译为 "ال렴 Grenvergence السريع",但更常见的翻译是 "التقارب السريع"。如果你希望使用更常见的表达,请告诉我。

Shihua Huang; Zhichao Lu; Xiaodong Cun; Yongjun Yu; Xiao Zhou; Xi Shen
DEIM: DETR مع تحسين التطابق لل렴 grenvergence السريع
请注意,"Fast Convergence" 通常翻译为 "ال렴 Grenvergence السريع",但更常见的翻译是 "التقارب السريع"。如果你希望使用更常见的表达,请告诉我。
الملخص

نقدم إطار التدريب المبتكر والفعال DEIM، المصمم لتسريع التقارب في اكتشاف الأشياء في الوقت الحقيقي باستخدام هياكل مبنية على نماذج Transformer (DETR). لمعالجة الإشراف النادر المتأصل في مطابقة واحدة إلى واحدة (O2O) في نماذج DETR، يستخدم DEIM استراتيجية مطابقة كثيفة من نوع O2O. تزيد هذه الطريقة من عدد العينات الإيجابية لكل صورة من خلال إدخال أهداف إضافية، باستخدام تقنيات تحسين البيانات القياسية. بينما تسرع مطابقة O2O الكثيفة التقارب، فإنها أيضًا تدخل العديد من المطابقات ذات الجودة المنخفضة التي قد تؤثر على الأداء. لحل هذه المشكلة، نقترح دالة خسارة جديدة تُعرف بـ Matchability-Aware Loss (MAL)، وهي تقوم بتحسين المطابقات عبر مستويات جودة مختلفة، مما يعزز فعالية مطابقة O2O الكثيفة. تؤكد التجارب الواسعة على مجموعة بيانات COCO فعالية DEIM. عند دمجه مع RT-DETR و D-FINE، فإنه يحسن الأداء بشكل ثابت ويقلل وقت التدريب بنسبة 50٪. وبشكل لافت للنظر، عند استخدامه مع RT-DETRv2، يصل DEIM إلى نسبة AP 53.2٪ في يوم واحد فقط من التدريب على وحدة معالجة الرسومات NVIDIA 4090. بالإضافة إلى ذلك، فإن النماذج الزمنية الحقيقية التي تم تدريبها باستخدام DEIM تتفوق على أبرز اكتشافات الأشياء في الوقت الحقيقي، حيث حقق كل من DEIM-D-FINE-L و DEIM-D-FINE-X نسبة AP 54.7٪ و 56.5٪ بمعدلات تشغيل 124 و 78 إطارًا في الثانية على وحدة معالجة الرسومات NVIDIA T4، على التوالي، دون الحاجة إلى بيانات إضافية. نعتقد أن DEIM يحدد خط أساس جديد للتقدم في مجال اكتشاف الأشياء في الوقت الحقيقي. يمكن الوصول إلى شفرتنا والنماذج المدربة مسبقًا عبر الرابط: https://github.com/ShihuaHuang95/DEIM.

DEIM: DETR مع تحسين التطابق لل렴 grenvergence السريع 请注意,"Fast Convergence" 通常翻译为 "ال렴 Grenvergence السريع",但更常见的翻译是 "التقارب السريع"。如果你希望使用更常见的表达,请告诉我。 | أحدث الأوراق البحثية | HyperAI