HyperAIHyperAI
منذ 2 أشهر

تجميع الانتباه لتمييز الأفعال

Rohit Girdhar; Deva Ramanan
تجميع الانتباه لتمييز الأفعال
الملخص

نقدم نموذجًا بسيطًا ومع ذلك قويًّا بشكل مفاجئ لدمج الانتباه في مهام التعرف على الأفعال وتفاعل الإنسان مع الأشياء. يمكن تدريب الوحدة المقترحة للانتباه مع أو بدون إشراف إضافي، مما يوفر زيادة كبيرة في الدقة مع الحفاظ على حجم الشبكة وتكلفة الحسابات تقريبًا كما هي. هذا النموذج يؤدي إلى تحسينات كبيرة على ثلاثة مقاييس قياسية للتعرف على الأفعال عبر الصور الثابتة والفيديوهات، ويحدد مستوى جديد من الطليعة في مجموعة بيانات MPII بمعدل تحسن نسبي يبلغ 12.5٪. كما أجرينا تحليلًا شاملًا لوحدة الانتباه الخاصة بنا سواءً بطريقة تجريبية أو تحليلية. فيما يتعلق بالتحليل الأخير، نقدم اشتقاقًا جديدًا للانتباه من الأسفل إلى الأعلى ومن الأعلى إلى الأسفل كتقريبات ذات رتبة منخفضة لطرق التجميع الثنائية (التي يتم استخدامها عادةً للتقييم الدقيق للتصنيف). من هذه الزاوية، يقترح صياغتنا للانتباه تصنيفًا جديدًا لمهمة التعرف على الأفعال كمشكلة تصنيف دقيقة.

تجميع الانتباه لتمييز الأفعال | أحدث الأوراق البحثية | HyperAI