تحسين بنية الشبكة لتقدير وضعية الإنسان الثلاثي الأبعاد

يُمثل الوضع البشري بشكل طبيعي كرسم بياني، حيث تُعتبر المفاصل العقد والهياكل العظمية الحواف. ومن الطبيعي إذًا تطبيق الشبكة التلافيفية الرسومية (GCN) لتقدير الوضع ثلاثي الأبعاد من الوضع ثنائي الأبعاد. في هذه الدراسة، نقترح صيغة عامة تكون فيها كل من الشبكة التلافيفية الرسومية (GCN) والشبكة المتصلة بالكامل (FCN) حالات خاصة منها. ومن خلال هذه الصيغة، نكتشف أن لـ GCN قدرة تمثيل محدودة عند استخدامها لتقدير الوضع ثلاثي الأبعاد. ونتحدى هذه القيود من خلال تقديم شبكة متصلة محليًا (LCN)، التي يمكن تنفيذها بشكل طبيعي عبر الصيغة العامة المذكورة. وتبين النتائج أن هذه الشبكة تُحسّن بشكل ملحوظ من قدرة التمثيل مقارنة بـ GCN. علاوةً على ذلك، وبما أن كل مفصل متصل فقط بعدة مفاصل في جواره، فإنها تتمتع بقدرة تعميم قوية. وتشير التجارب على مجموعات بيانات عامة إلى أن النموذج: (1) يتفوق على أفضل النماذج الحالية؛ (2) يحتاج إلى كميات أقل من البيانات مقارنة بالنماذج البديلة؛ (3) يُظهر تعميمًا جيدًا على الحركات والبيانات غير المرئية سابقًا.