HyperAIHyperAI
منذ 8 أيام

T-YOLO: اكتشاف المركبات الصغيرة المستند إلى YOLO وشبكات عصبية تلافيفية متعددة المقاييس

{Domenec Puig, Miguel Ángel García, Hatem RashwanHatem Rashwan, Daniel Padilla Carrasco}
الملخص

لحل المشكلات الواقعية المتعلقة بتطبيقات المدن الذكية المختلفة، مثل كشف اشغال أماكن الوقوف، يتطلب استخدام الشبكات العصبية العميقة تحسينًا دقيقًا (Fine-tuning) لهذه الشبكات. وفي حالة أماكن الوقوف الكبيرة، يُفضَّل استخدام كاميرا موجهة إلى المستوى الأفقي (الكاميرا المركزيّة) مثبتة على ارتفاع عالٍ، مما يتيح مراقبة المساحة الكاملة لمكان الوقوف أو منطقة وقوف واسعة باستخدام كاميرا واحدة فقط. في الوقت الحالي، تحقق نماذج كشف الكائنات الشهيرة اليوم، مثل YOLO، أداءً جيدًا من حيث الدقة عند سرعة زمنية حقيقية (real-time). ومع ذلك، إذا استخدمنا بيانات خاصة بنا تختلف عن البيانات العامة المستخدمة في مجموعات البيانات الشائعة مثل COCO وImageNet، فهناك مجال واسع للتحسين والابتكار. في هذه الورقة، نقترح نموذجًا جديدًا للكشف عن الكائنات العميق، مُعدّلًا ولكنه خفيف الوزن، مستندًا إلى بنية YOLO-v5. يمكن لهذا النموذج المقترح اكتشاف الكائنات الكبيرة والصغيرة والصغيرة جدًا. وبشكل خاص، نقترح استخدام آلية متعددة المقاييس (multi-scale mechanism) لتعلم تمثيلات مميزة عميقة للسمات على مقاييس مختلفة، وتحديد التلقائي للمقاييس الأنسب لاكتشاف الكائنات في المشهد (أي في حالتنا الحالية، المركبات). ويقلل هذا الوحدة المتعددة المقاييس من عدد المعاملات القابلة للتدريب مقارنةً بالبنية الأصلية لـ YOLO-v5. كما تُظهر النتائج التجريبية تحسنًا كبيرًا في الدقة. في الواقع، كما يوضح التجربة، ينخفض عدد المعاملات من 7.28 مليون معامل في النموذج YOLO-v5-S إلى 7.26 مليون معامل فقط في نموذجنا. علاوةً على ذلك، قمنا بتقليل زمن الكشف بحيث نصل إلى 30 إطارًا في الثانية (30 fps)، مقارنةً بالنمذجين YOLO-v5-L/X. كما تم تحسين أداء اكتشاف المركبات الصغيرة جدًا بنسبة 33% مقارنةً بنموذج YOLO-v5-X.

T-YOLO: اكتشاف المركبات الصغيرة المستند إلى YOLO وشبكات عصبية تلافيفية متعددة المقاييس | أحدث الأوراق البحثية | HyperAI