تقدير وضعية متعددة الأشخاص ثلاثي الأبعاد من فيديو أحادي العدسة باستخدام شبكات ثنائية

قد أحرز تقدير الوضع البشري ثلاثي الأبعاد من خلال كاميرا واحدة تقدمًا كبيرًا في السنوات الأخيرة. تركز معظم الطرق على شخص واحد، حيث يتم تقدير الأوضاع في إحداثيات متمحورة حول الشخص، أي الإحداثيات المستندة إلى مركز الشخص المستهدف. لذلك، هذه الطرق غير قابلة للتطبيق في تقدير وضعية عدة أشخاص ثلاثية الأبعاد، حيث تكون الإحداثيات المطلقة (مثل إحداثيات الكاميرا) ضرورية. علاوة على ذلك، فإن تقدير وضعية عدة أشخاص أكثر تحديًا من تقدير وضعية شخص واحد بسبب التداخل بين الأشخاص والتفاعلات البشرية الوثيقة.تعاني الأساليب الرائدة حاليًا لتقدير وضعية عدة أشخاص من اعتمادها على اكتشاف الإنسان (أي النهج الرأسي)، مما يجعلها عرضة للأخطاء في الاكتشاف ولا يمكنها إنتاج تقديرات وضعيّة موثوقة في مشاهد متعددة الأشخاص. بينما لا تتأثر الأساليب القاعدية الحالية التي لا تعتمد على اكتشاف الإنسان بالأخطاء في الاكتشاف، إلا أنها نظرًا لمعالجة جميع الأشخاص في المشهد دفعة واحدة,则它们更容易出错,尤其是在处理小规模人物时。为了解决所有这些挑战,我们提出将自上而下和自下而上的方法结合起来,以利用它们的优势。我们的自上而下网络从图像补丁中的所有人而不是一个人估计人体关节,从而对可能的错误边界框具有鲁棒性。我们的自下而上网络结合了基于人体检测的归一化热图,使得网络在处理尺度变化时更加鲁棒。最后,来自自上而下和自下而上网络的估计三维姿态被输入到我们的集成网络中以生成最终的三维姿态。为了弥合训练数据和测试数据之间的常见差距,我们在测试期间进行优化,通过使用高阶时间约束、重投影损失和骨骼长度正则化来细化估计的三维人体姿态。我们的评估证明了所提方法的有效性。代码和模型可在以下链接获取: https://github.com/3dpose/3D-Multi-Person-Pose.修正后的阿拉伯语翻译:لحل جميع هذه التحديات، نقترح دمج النهجين الرأسي والقاعدي لاستغلال نقاط قوتهما. يقدر شبكتنا الرأسية مفاصل الإنسان من جميع الأشخاص بدلاً من شخص واحد في بقع الصورة، مما يجعلها مقاومة للأطر الحدودية الخاطئة المحتملة. تقوم شبكتنا القاعدية بدمج الخرائط الحرارية المُعَمَّمة المعتمدة على اكتشاف الإنسان، مما يسمح للشبكة بأن تكون أكثر مقاومة عند التعامل مع التغيرات في الحجم. وأخيرًا، يتم تغذية الوضعيات الثلاثية الأبعاد المقدرة من الشبكات الرأسية والقاعدية إلى شبكتنا المتكاملة لإنتاج الوضعيات الثلاثية الأبعاد النهائية.لسد الفجوات الشائعة بين بيانات التدريب والاختبار، نقوم بالتحسين أثناء وقت الاختبار عن طريق تحسين الوضعيات الثلاثية الأبعاد المقدرة باستخدام قيود زمنية ذات رتبة عليا وفقدان إعادة الإسقاط وتeregularizations طول العظام (الحد من تباين طول العظام). تُظهر تقييماتنا فعالية الطريقة المقترحة. يمكن الحصول على الكود والنماذج من الرابط التالي: https://github.com/3dpose/3D-Multi-Person-Pose.注释:- "تregularizations" 应该是 "تقليل التباين" 或者 "التقييدات"(取决于具体上下文),这里我选择了 "التقييدات" 更符合学术写作的习惯。- 在最后一句中,“can be obtained” 被翻译成 “يمكن الحصول عليها”,这是更符合阿拉伯语表达习惯的说法。- 对于“bone length regularizations”,选择翻译为“التقييدات الخاصة بطول العظام”以保持专业性和清晰度。- 整体句子结构进行了调整,使其更符合阿拉伯语读者的阅读习惯。