HyperAIHyperAI
منذ 3 أشهر

شاب-ميكسي: خلط موجه بالقيمة شابلي للتمييز عن الحركات القائمة على الهيكل العظمي في حالات التوزيع الطويل الذيل

Jiahang Zhang, Lilang Lin, Jiaying Liu
شاب-ميكسي: خلط موجه بالقيمة شابلي للتمييز عن الحركات القائمة على الهيكل العظمي في حالات التوزيع الطويل الذيل
الملخص

في السيناريوهات الواقعية، تميل الأفعال البشرية إلى اتباع توزيع طويل الذيل (long-tailed distribution). وهذا ما يسبب تدهورًا حادًا في أداء الطرق الحالية لتمييز الأفعال القائمة على الهيكل العظمي، والتي صُمّمت في الغالب بناءً على مجموعات بيانات متوازنة. في الآونة الأخيرة، بذلت جهود كثيرة لمعالجة التعلم في الفيديوهات أو الصور ذات التوزيع الطويل الذيل. ومع ذلك، فإن تطبيق هذه الطرق مباشرة على البيانات العظمية قد لا يكون الأمثل، نظرًا لعدم أخذ النمط الحركي المكاني-الزمني الحاسم بعين الاعتبار، خصوصًا في بعض الطرق المخصصة للوسائط مثل التكبير العشوائي للبيانات (data augmentation). ولحل هذه المشكلة، ونظرًا للدور الحاسم للأجزاء الجسدية في الأفعال البشرية المركّزة مكانيًا، نركز على استراتيجيات الخلط (mixing augmentations) ونُقدّم طريقة جديدة تُسمى Shap-Mix، التي تُحسّن التعلم في البيئات ذات التوزيع الطويل الذيل من خلال استخراج أنماط حركية تمثيلية لفئات الذيل. وبشكل محدد، نطوّر أولاً استراتيجية فعّالة للخلط المكاني-الزمني للهيكل العظمي لتعزيز جودة التمثيل. ثم نُقدّم طريقة توجيهية تعتمد على التميز (saliency guidance)، تتكوّن من تقدير التميز بناءً على قيمة شابلي (Shapley value) وسياسة خلط مُدركة للفئات النادرة (tail-aware mixing policy). وتُحافظ هذه الطريقة على الأجزاء الحركية المميزة للفئات النادرة في البيانات المختلطة، وتعزز بشكل صريح العلاقة بين المؤشرات الهيكلية الأساسية للجسم والمعاني عالية المستوى. أظهرت التجارب الواسعة على ثلاث مجموعات بيانات كبيرة للهيكل العظمي تحسنًا ملحوظًا في الأداء في كل من البيئات ذات التوزيع الطويل الذيل والمتوازن. يُمكن الوصول إلى المشروع بشكل عام عبر الرابط التالي: https://jhang2020.github.io/Projects/Shap-Mix/Shap-Mix.html.