BlockGCN: إعادة تعريف الوعي بالهيكلية لتمييز الحركات القائمة على الهيكل العظمي

تمثّل الشبكات التوافقية الرسومية (GCNs) الحد الأقصى من التطور في التعرف على الإجراءات القائمة على الهيكل العظمي، بفضل قدرتها على استكشاف الديناميكيات المعقدة لهيكلية المفاصل البشرية من خلال مصفوفة الجوار الرسومية. ومع ذلك، ظهر عيب جوهري في هذه النماذج المتقدمة: فهي تميل إلى تحسين مصفوفة الجوار بشكل مشترك مع أوزان النموذج. ورغم أن هذه العملية تبدو فعّالة، إلا أنها تؤدي إلى تدهور تدريجي في بيانات اتصال العظام، ما يُنتج نموذجًا لا يهتم بالهيكلية التي كان يسعى إلى تمثيلها في الأصل. ولعلاج هذه المشكلة، نقترح استراتيجية مزدوجة: (1) نقدّم منهجًا مبتكرًا يُشَكِّل اتصال العظام من خلال استغلال قوة المسافات الرسومية لوصف الهيكلية الفيزيائية؛ كما ندمج تمثيلًا هيكليًا مخصصًا للإجراء من خلال تحليل الهومولوجيا المستمرة (persistent homology) لتصوير الديناميكيات الشاملة، مما يحافظ على التفاصيل الهيكلية الحيوية التي تُضيع غالبًا في الشبكات التوافقية الرسومية التقليدية. (2) كما كشفت دراستنا عن تكرار غير ضروري في الشبكات التوافقية الرسومية الحالية في نمذجة العلاقات المتعددة، وهو ما نعالجُه من خلال اقتراح تحسين فعّال للتوافقيات الرسومية (GC)، يُسمّى BlockGC. وقد أدى هذا التحسين إلى تقليل كبير في عدد المعاملات مع تحسين الأداء مقارنة بالـ GC الأصلية. يُعد النموذج الكامل، BlockGCN، الذي نقترحه، يُحدث حدًا جديدًا في معايير التعرف على الإجراءات القائمة على الهيكل العظمي عبر جميع فئات النماذج. وتُعد دقة النموذج العالية وتصميمه الخفيف، لا سيما على مجموعة بيانات NTU RGB+D 120 الضخمة، دليلًا قويًا على فعالية BlockGCN.