تعلم شبكة الت(Convolutional) الرسومية للتمييز عن الأفعال البشرية القائمة على الهيكل العظمي من خلال البحث العصبي

تمثل التعرف على الإجراءات البشرية من خلال بيانات الهيكل العظمي، بفضل الشبكة التلافيفية الرسومية (GCN)، مجالًا حظي باهتمام كبير، نظرًا لقدرتها الفعّالة على نمذجة بيانات ذات هيكل غير أقليدي. ومع ذلك، فإن العديد من الطرق الحالية القائمة على GCN تُقدّم رسمًا مُعرّفًا مسبقًا وتحفظه ثابتًا عبر كامل الشبكة، مما يؤدي إلى فقدان العلاقات الضمنية بين المفاصل. علاوةً على ذلك، فإن الشبكات الرسومية الطيفية السائدة تعتمد على تقريب ذي طابع أولي (one-order hop)، ما يعني أن الاتصالات ذات الرتبة الأعلى لا تُؤخذ بعين الاعتبار بشكل كافٍ. وبالتالي، تتطلب مجهودات كبيرة لاستكشاف بنية GCN أفضل. ولحل هذه المشكلات، نلجأ إلى طريقة البحث التلقائي في البنية العصبية (NAS) ونُقدّم أول شبكة GCN تم تصميمها تلقائيًا للتعرف على الإجراءات القائمة على الهيكل العظمي. بشكل محدد، نُثري فضاء البحث من خلال إدخال وحدات رسومية ديناميكية متعددة، بعد استكشاف شامل للعلاقات المكانية-الزمنية بين العقد. كما نُقدّم وحدات متعددة الطبقات (multiple-hop) ونأمل في التغلب على القيود المفروضة على القدرة التمثيلية الناتجة عن التقريب من الدرجة الأولى. علاوةً على ذلك، نُقدّم استراتيجية تطورية فعّالة من حيث العينة والذاكرة، لاستكشاف البنية المثلى لهذا المهمة. تُثبت البنية الناتجة فعالية التقريب من الرتبة الأعلى وآلية النمذجة الديناميكية للرسم مع التفاعلات الزمنية، وهي مسائل لم تُناقَش سابقًا بشكل واسع. ولتقييم أداء النموذج المُستكشف، نُجري تجارب واسعة النطاق على مجموعتي بيانات كبيرتين جدًا، وتُظهر النتائج تفوق نموذجنا على أحدث النماذج المُسجلة في المجال.