HyperAIHyperAI
منذ 2 أشهر

الاستدلال على الرسوم البيانية الديناميكية لتقدير الوضع ثلاثي الأبعاد للأشخاص المتعددين

Qiu, Zhongwei ; Yang, Qiansheng ; Wang, Jian ; Fu, Dongmei
الاستدلال على الرسوم البيانية الديناميكية لتقدير الوضع ثلاثي الأبعاد للأشخاص المتعددين
الملخص

تقدير الوضع ثلاثي الأبعاد لعدة أشخاص هو مهمة صعبة بسبب التغطية وغموض العمق، خاصة في حالات المشاهد المزدحمة. لحل هذه المشكلات، تستكشف معظم الطرق الحالية نمذجة إشارات السياق الجسدي من خلال تعزيز تمثيل الميزات باستخدام الشبكات العصبية الرسمية أو إضافة قيود هيكلية. ومع ذلك، فإن هذه الطرق ليست ثابتة بسبب تركيبتها ذات الجذر الواحد التي تقوم بفك تشفير الوضعيات ثلاثية الأبعاد من عقدة جذر محددة مسبقًا بواسطة رسم بياني محدد.في هذا البحث، نقترح GR-M3D، وهي طريقة تنظم تقدير الوضع ثلاثي الأبعاد لعدة أشخاص باستخدام الاستدلال الرسم البياني الديناميكي (\textbf{G}raph \textbf{R}easoning). يتم التنبؤ برسم التفكيك في GR-M3D بدلاً من تحديده مسبقًا. بشكل خاص، يتم أولاً توليد عدة خرائط بيانات وتعزيزها باستخدام وحدة تحسين على درجات الحجم والعمق (SDAR) (Scale and Depth Aware Refinement Module). ثم يتم تقدير نقاط المفصل الجذر المتعددة ومسارات فك التشفير الكثيفة لكل شخص من هذه الخرائط البيانات. بناءً عليها، يتم بناء رسوم تفكيك ديناميكية عن طريق تعيين وزن المسار للمسارات التفكيكية، بينما يتم استنتاج أوزان المسارات من تلك الخرائط البيانات المعززة. ويُطلق على هذا العملية اسم الاستدلال الرسم البياني الديناميكي (DGR) (Dynamic Graph Reasoning).أخيرًا، يتم فك تشفير الوضعيات ثلاثية الأبعاد وفقًا لرسوم التفكيك الديناميكية لكل شخص تم اكتشافه. يمكن لـ GR-M3D ضبط هيكل رسم التفكيك ضمنيًا عن طريق اعتماد أوزان مسار ناعمة حسب البيانات الإدخالية، مما يجعل رسوم التفكيك قابلة للتكيف مع مختلف الأشخاص الإدخاليين بأفضل حد ممكن وأكثر قدرة على التعامل مع مشاكل التغطية وغموض العمق مقارنة بالطرق السابقة. نظهر عمليًا أن النهج المقترح من الأسفل إلى الأعلى يتفوق حتى على الطرق من الأعلى إلى الأسفل ويحقق أفضل النتائج في ثلاثة مجموعات بيانات للوضع الثلاثي الأبعاد.

الاستدلال على الرسوم البيانية الديناميكية لتقدير الوضع ثلاثي الأبعاد للأشخاص المتعددين | أحدث الأوراق البحثية | HyperAI