HyperAIHyperAI
منذ 3 أشهر

بوبلنيت: هيكل متكرر متناثر للتعرف على الأنشطة

{William R. Schwartz, Victor H. C. Melo, Igor L. O. Bastos}
بوبلنيت: هيكل متكرر متناثر للتعرف على الأنشطة
الملخص

يقدم هذا البحث منهجية لتمييز الأنشطة البشرية في الفيديوهات من خلال استخدام شبكة عميقة متكررة، حيث تُستخدم كمدخلات معلومات الشكل (الظهور) وتدفق البصري (التدفق الضوئي). يقترح هذا الأسلوب بنية جديدة تُسمى BubbleNET، والتي تعتمد على طبقة متكررة موزعة على عدة وحدات (تُعرف بـ "الفقاعات") إلى جانب آلية انتباه تعتمد على استراتيجية الضغط والتحفيز (squeeze-and-excitation)، المسؤولة عن ضبط مساهمة كل فقاعة. وبذلك، نسعى إلى جمع المعلومات من الأجزاء الأساسية المرتبطة في البيانات المدخلة، مما يُكوّن توقيعًا مكوّنًا من عناصر تميّز كل نشاط. وقد أظهرت تجاربنا، التي أُجريت على مجموعات بيانات شائعة الاستخدام في تمييز الأنشطة، وجود هذه التوقيعات، حيث تُثبت خرائط نشاط الفقاعات لكل فئة من فئات المجموعات. وللتمييز بين هذا الأسلوب والأساليب المنشورة في الأدبيات، تم اعتماد الدقة المتوسطة، والتي حققت BubbleNET معدلات دقة بلغت 97.62% و91.70% و82.60% على مجموعات بيانات UCF-101 وYUP++ وHMDB-51 على التوالي، ما يضعها ضمن أفضل الأساليب الحالية في المجال.