HyperAIHyperAI
منذ 17 أيام

نموذج B2C-AFM: نموذج تكامل الانتباه الثنائي الاتجاه والزمني المشترك والمساحي المتقاطع للتمييز عن الحركات البشرية

{and Jiakai Zhu, Wei Song, Qiwei Meng, Wen Wang, Xiangming Xi, Shiqiang Zhu, Tianlei Jin, Fangtai Guo}
الملخص

تمثّل التعرف على السلوك البشري محركًا رئيسيًا لتطبيقات التفاعل بين الإنسان والحاسوب. يركّز معظم الأبحاث الحالية على تحسين قدرة النماذج على التعميم من خلال دمج وحدات متعددة متجانسة، بما في ذلك الصور الملونة (RGB)، والوضعيات البشرية، والتدفقات البصرية. علاوةً على ذلك، تُثبت الدراسات أن التفاعلات السياقية واللغات الإشارية غير السياقية تعتمد على فئة المشهد وعلى الإنسان نفسه. وقد أظهرت المحاولات المبذولة لدمج ميزات المظهر مع الوضعيات البشرية نتائج إيجابية. ومع ذلك، نظرًا لوجود أخطاء فضائية في الوضعيات البشرية، وغموض زمني، تظل الطرق الحالية عرضة لمشاكل في التوسع، وقيود في المقاومة للعوامل المضادة، ونماذج غير مثلى. في هذا البحث، مستوحى من الفرضية التي تفترض أن الوحدات المختلفة قد تحافظ على اتساق زمني وتكامل فضائي، نقدّم نموذجًا جديدًا يُسمى نموذج التكامل الاتجاهي الثنائي الزمني والفضائي المتبادل (B2C-AFM). يتميز هذا النموذج باستراتيجية دمج غير متزامنة لسمات الوحدات المتعددة على المستويين الزمني والفضائي. علاوةً على ذلك، نستعرض تمثيلات جديدة صريحة موجهة نحو الحركة تُسمى حقول تدفق الأطراف (Lff) لتقليل الغموض الزمني المرتبط بالوضعيات البشرية. وقد تأكدت مساهماتنا من خلال تجارب على مجموعات بيانات متاحة للعامة. وتشير الدراسات التحليلية الواسعة إلى أن نموذج B2C-AFM يحقق أداءً قويًا على سلوك بشري معروف وغير معروف. يمكن الوصول إلى الشفرة المصدرية عبر الرابط: https://github.com/gftww/B2C.git.