EV-SegNet: التجزئة الدلالية للكاميرات القائمة على الأحداث

الكاميرات الحدثية، أو مستشعر الرؤية الديناميكية (DVS)، هي أجهزة استشعار واعدة أظهرت العديد من المزايا على الكاميرات القائمة على الإطارات. ومع ذلك، فإن معظم الأعمال الحديثة المتعلقة بتطبيقات هذه الكاميرات تركز على إعادة بناء الصور ثلاثية الأبعاد وتتبع الكاميرا بست درجات من الحرية. يمكن للتقنيات المستندة إلى التعلم العميق، والتي تقود التطور الحالي في مهام التعرف البصري، الاستفادة المحتملة من مزايا DVS، ولكن لا يزال هناك حاجة لبعض التعديلات حتى تعمل بكفاءة على هذه الكاميرات. يقدم هذا العمل أول أساس مرجعي للفصل الدلالي باستخدام هذا النوع من البيانات. نقوم ببناء شبكة عصبية اصطناعية للفصل الدلالي تعتمد على التقنيات الأكثر تقدماً وتستخدم معلومات الحدث كمدخل وحيد. بالإضافة إلى ذلك، نقترح تمثيلاً جديداً للبيانات DVS يتفوق على التمثيلات السابقة المستخدمة في المهام ذات الصلة. نظرًا لعدم وجود مجموعة بيانات مشهورة مصنفة لهذا المهمة، نقترح كيفية إنشاء بطاقات فصل دلالي تقريبية بشكل آلي لبعض سلاسل مجموعة بيانات DDD17، والتي ننشرها مع النموذج ونثبت أنها صالحة لتدريب نموذج يستخدم بيانات DVS فقط. نقارن بين نتائج الفصل الدلالي من بيانات DVS ونتائج استخدام الصور الرمادية المقابلة، مما يوضح كيف أنهما مكملان ويستحقان الجمع.