HyperAIHyperAI
منذ 17 أيام

يولو-فورمِر: يلو تُصافح فيت

Javad Khoramdel, Ahmad Moori, Yasamin Borhani, Armin Ghanbarzadeh, Esmaeil Najafi
يولو-فورمِر: يلو تُصافح فيت
الملخص

يُعدّ المنهج المقترح YOLO-Former تكاملًا سلسًا بين أفكار معمارية الترانسفورمر وYOLOv4، مما يُنتج نظامًا دقيقًا وفعالًا للغاية للكشف عن الكائنات. ويستفيد هذا المنهج من سرعة الاستدلال السريع لـ YOLOv4، ويُضفي مزايا معمارية الترانسفورمر من خلال دمج وحدات الانتباه التبادليية (convolutional attention) ووحدات الترانسفورمر. وتُظهر النتائج فعالية النهج المقترح، حيث بلغ متوسط الدقة المتوسطة (mAP) 85.76٪ على مجموعة بيانات Pascal VOC، مع الحفاظ على سرعة تنبؤ عالية تصل إلى 10.85 إطارًا في الثانية. وتتمثل الإسهامات الرئيسية لهذا العمل في إظهار كيف يمكن أن يؤدي الدمج المبتكر بين هاتين التقنيتين الرائدتين إلى تحسينات إضافية في مجال الكشف عن الكائنات.