الانتباه التقطير لتعلم تمثيلات الفيديو

نناول المشكلة الصعبة المتمثلة في تعلم تمثيلات الحركة باستخدام النماذج العميقة للاعتراف بالفيديو. لتحقيق هذا الهدف، نستفيد من وحدات الانتباه التي تتعلم تسليط الضوء على المناطق في الفيديو وتجميع الخصائص للاعتراف. وبشكل خاص، نقترح الاستفادة من خرائط الانتباه الخرجية كوسيلة لنقل التمثيل المتعلم من شبكة الحركة (التدفق) إلى شبكة RGB. ندرس بشكل منهجي تصميم وحدات الانتباه، ونطور طريقة جديدة لتقطير الانتباه. يتم تقييم طريقتنا على مقاييس الأنشطة الرئيسية، وتحسن باستمرار أداء الشبكة الأساسية RGB بمقدار كبير. علاوة على ذلك، نثبت أن خرائط انتباهنا يمكنها الاستفادة من مؤشرات الحركة في تعلم تحديد موقع الأنشطة في إطارات الفيديو. نعتقد أن طريقتنا توفر خطوة نحو تعلم تمثيلات حساسة للحركة في النماذج العميقة. صفحة مشروعنا متاحة على الرابط: https://aptx4869lm.github.io/AttentionDistillation/