منذ 11 أيام
Deformable DETR: تحولات مُتعدّدة الأشكال للكشف عن الكائنات من البداية إلى النهاية
Xizhou Zhu, Weijie Su, Lewei Lu, Bin Li, Xiaogang Wang, Jifeng Dai

الملخص
تم مؤخرًا اقتراح نموذج DETR للتخلص من الحاجة إلى العديد من المكونات المصممة يدويًا في كشف الكائنات، مع إظهار أداءً جيدًا. ومع ذلك، يعاني هذا النموذج من تقارب بطيء وحلّة محدودة للسمات المكانية، نظرًا لقيود وحدات الانتباه في نموذج Transformer عند معالجة خرائط الميزات الصورية. ولتخفيف هذه المشكلات، قمنا بتطوير نموذج Deformable DETR، الذي يُركّز وحدات انتباهه فقط على مجموعة صغيرة من نقاط العينة الأساسية المحيطة بنقطة مرجعية. يُظهر Deformable DETR أداءً أفضل من DETR (خاصةً في الكائنات الصغيرة)، مع استخدام عدد من دورات التدريب يقل عن عشرة أضعاف. أظهرت تجارب واسعة على معيار COCO فعالية النهج المُقترح. تم إتاحة الكود المصدري عبر الرابط التالي: https://github.com/fundamentalvision/Deformable-DETR.