HyperAIHyperAI
منذ 12 أيام

TrackNetV2: شبكة تتبع الكرة الطائرة الفعّالة

{Tsì-Uí İk, Ho-Yi Chung, Dung-Ru Yu, Tzu-Han Hsu, Shao-Ping Chuang, Yu-Ching Lin, Nien-En Sun}
الملخص

تم اقتراح شبكة التتبع TrackNet، وهي شبكة تعلم عميق، لتتبع الأجسام ذات السرعة العالية والصغيرة جدًا مثل كرات التنس وكرات الريشة من مقاطع الفيديو. ولsuperior إلى مشكلات جودة الصورة المنخفضة مثل الضبابية والظلال المتبقية والانسداد القصير الأجل، تم إدخال عدد معين من الإطارات المتتالية معًا للكشف عن الجسم المُتَحَرِّك. في هذا العمل، تم اقتراح TrackNetV2 لتحسين أداء TrackNet من جوانب متعددة، وبخاصة سرعة المعالجة، ودقة التنبؤ، واستهلاك ذاكرة وحدة معالجة الرسومات (GPU). أولاً، تم رفع سرعة المعالجة من 2.6 إطارًا في الثانية إلى 31.8 إطارًا في الثانية. تم تحقيق هذا التحسين من خلال تقليل حجم الصورة المُدخلة وإعادة هندسة الشبكة من تصميم مدخلات متعددة وواحدة خرج (MISO) إلى تصميم مدخلات متعددة وخروج متعدد (MIMO). ثانيًا، لتحسين دقة التنبؤ، تم جمع مجموعة بيانات شاملة من مقاطع مباريات الريشة المتنوعة وتم تسميتها لغرض التدريب والاختبار. تتكوّن هذه المجموعة من 55,563 إطارًا من 18 مقطعًا لمباريات ريشة. علاوةً على ذلك، تتكون آليات الشبكة من VGG16 وطبقات التكبير (upsampling)، بالإضافة إلى بنية U-net. أخيرًا، لخفض استهلاك ذاكرة GPU، تم إعادة تصميم هيكل البيانات الخاص بطبقة الخريطة الحرارية (heatmap) من مصفوفة ثلاثية الأبعاد مُشفرة بأسلوب one-hot لكل بكسل إلى مصفوفة ثنائية الأبعاد ذات قيم حقيقية. وبما أن تم تغيير تمثيل خريطة الحرارة، فقد أعيد تصميم دالة الخسارة من دالة تعتمد على متوسط الجذر التربيعي للخطأ (RMSE) إلى دالة تعتمد على الانتروبيا الموزونة (weighted cross-entropy). أظهرت نتائج التحقق الشامل أن دقة TrackNetV2 ودقة التنبؤ والدقة التكرارية (recall) وصلت إلى 96.3% و97.0% و98.7% على التوالي في مرحلة التدريب، وبلغت 85.2% و97.2% و85.4% في اختبار على مباراة جديدة تمامًا. وبلغت سرعة المعالجة للنسخة ذات الإدخال الثلاثي والإخراج الثلاثي من TrackNetV2 31.84 إطارًا في الثانية. وتتوفر مجموعة البيانات والكود المصدري لهذا العمل عبر الرابط التالي: https://nol.cs.nctu.edu.tw:234/open-source/TrackNetv2/.

TrackNetV2: شبكة تتبع الكرة الطائرة الفعّالة | أحدث الأوراق البحثية | HyperAI