اكتشاف الأجسام المتحركة للرؤية القائمة على الأحداث باستخدام تجميع الطيف الرسومي

اكتشاف الأجسام المتحركة كان موضوعًا مركزيًا للنقاش في رؤية الحاسوب نظرًا لتطبيقاته الواسعة مثل السيارات ذاتية القيادة، ومراقبة الفيديو، والأمن والتنفيذ. أجهزة استشعار الرؤية العصبية (Neuromorphic Vision Sensors - NVS) هي أجهزة استشعار مستوحاة من الأحياء تقلد عمل العين البشرية. على عكس الكاميرات التقليدية القائمة على الإطارات، تلتقط هذه الأجهزة تيارًا من الأحداث "الغير متزامنة" التي توفر العديد من المزايا على الكاميرات التقليدية، مثل نطاق ديناميكي عالي، وتأخير منخفض، واستهلاك طاقة منخفض، وتقليل تشويش الحركة. ومع ذلك، فإن هذه المزايا تأتي بتكلفة عالية، حيث تحتوي بيانات كاميرا الأحداث عادةً على ضوضاء أكثر ولديها دقة منخفضة. بالإضافة إلى ذلك، نظرًا لأن كاميرات الأحداث تستطيع فقط التقاط التغييرات النسبية في سطوع المشهد، فإن بيانات الأحداث لا تحتوي على المعلومات البصرية المعتادة (مثل النسيج واللون) المتاحة في بيانات الفيديو من الكاميرات العادية. لذلك، يصبح اكتشاف الأجسام المتحركة في كاميرات الأحداث مهمة صعبة للغاية. في هذا البحث، نقدم تقنية تصنيف الطيف البياني غير المشرف للكشف عن الأجسام المتحركة في بيانات الأحداث (GSCEventMOD). كما نوضح كيفية تحديد عدد الأجسام المتحركة الأمثل بشكل آلي. تظهر المقارنات التجريبية على قواعد البيانات المتاحة للعامة أن الخوارزمية المقترحة GSCEventMOD تتفوق على العديد من التقنيات الرائدة بأقصى هامش يصل إلى 30%.