HyperAIHyperAI
منذ 2 أشهر

تقدير الوضع ثلاثي الأبعاد للإنسان من خلال الكاميرا أحادية العدسة باستخدام التدفقات الطبيعية

Wehrbein, Tom ; Rudolph, Marco ; Rosenhahn, Bodo ; Wandt, Bastian
تقدير الوضع ثلاثي الأبعاد للإنسان من خلال الكاميرا أحادية العدسة باستخدام التدفقات الطبيعية
الملخص

تقدير الوضع البشري ثلاثي الأبعاد من الصور أحادية العدسة هو مشكلة شديدة التعقيد بسبب الغموض في العمق والاخفاء. ومع ذلك، فإن معظم الأعمال الحالية تتجاهل هذه الغموض وتقدر حلًا واحدًا فقط. على النقيض من ذلك، نحن نولد مجموعة متنوعة من الفرضيات التي تمثل التوزيع اللاحق الكامل للأوضاع الثلاثية الأبعاد الممكنة. لهذا الغرض، نقترح طريقة تعتمد على جريان التطبيع (normalizing flow) تستغل الخريطة الحتمية من 3D إلى 2D لحل المشكلة العكسية غير الواضحة من 2D إلى 3D. بالإضافة إلى ذلك، يتم نمذجة الكشف غير المؤكد والاخفاء بشكل فعال عن طريق دمج معلومات عدم اليقين الخاصة بالكشف二维 (2D detector) 作为条件。成功的关键还在于学习到的三维姿态先验和最佳-M损失的泛化。我们在两个基准数据集 Human3.6M 和 MPI-INF-3DHP 上评估了我们的方法,在大多数指标上超越了所有可比方法。该实现已在 GitHub 上提供。注:在阿拉伯语中,"二维" 和 "2D detector" 应该翻译为 "ثنائية الأبعاد" 和 "كاشف ثنائي الأبعاد",以保持专业性和语言的一致性。以下是修正后的版本:تقدير الوضع البشري ثلاثي الأبعاد من الصور أحادية العدسة هو مشكلة شديدة التعقيد بسبب الغموض في العمق والاخفاء. ومع ذلك، فإن معظم الأعمال الحالية تتجاهل هذه الغموض وتقدر حلًا واحدًا فقط. على النقيض من ذلك، نحن نولد مجموعة متنوعة من الفرضيات التي تمثل التوزيع اللاحق الكامل للأوضاع الثلاثية الأبعاد الممكنة. لهذا الغرض، نقترح طريقة تعتمد على جريان التطبيع (normalizing flow) تستغل الخريطة الحتمية من 3D إلى 2D لحل المشكلة العكسية غير الواضحة من 2D إلى 3D. بالإضافة إلى ذلك، يتم نمذجة الكشف غير المؤكد والاخفاء بشكل فعال عن طريق دمج معلومات عدم اليقين الخاصة بالكاشف ثنائي الأبعاد كشرط. وتشمل المفاتيح الأخرى للنجاح وجود أولوية وضع ثلاثي أبعاد تم تعلمها وتوسيع أفضل خسارة M (best-of-M loss). لقد قمنا بتقييم APPROACHنا على مجموعتي البيانات المرجعيتين Human3.6M و MPI-INF-3DHP، حيث تفوقت جميع الأساليب القابلة للمقارنة في معظم المقاييس. يمكن الحصول على التنفيذ عبر GitHub.为了使句子更加流畅和正式,以下是进一步优化的版本:تقدير الوضع البشري ثلاثي الأبعاد من الصور أحادية العدسة هو مشكلة شديدة التعقيد بسبب الغموض في العمق والاخفاءات الجزئية. ومع ذلك، فإن معظم الأعمال الحالية تتجاهل هذه الغموض وتقتصر على تقدير حل واحد فقط. بخلاف ذلك، نحن نولد مجموعة متنوعة من الفرضيات التي تمثل التوزيع اللاحق الكامل للأوضاع الثلاثية الأبعاد الممكنة. لتحقيق هذا الهدف، نقترح طريقة تعتمد على جريان التطبيع (normalizing flow) والتي تستفيد من الخريطة الحتمية من ثلاثي الأبعاد إلى ثنائي الأبعاد لحل المشكلة العكسية غير الواضحة من ثنائي الأبعاد إلى ثلاثي الأبعاد. بالإضافة إلى ذلك، يتم معالجة الكشف غير المؤكد والاخفاءات الجزئية بشكل فعال عن طريق دمج معلومات عدم اليقين الخاصة بالكاشف ثنائي الأبعاض كشرط إضافي. وتشمل عوامل النجاح الأخرى استخدام أولوية وضع ثلاثي أبعاض تم تعلمها وتوسيع خسارة أفضل M (best-of-M loss). لقد قمنا بتقييم طرحتنا على مجموعتي البيانات المرجعيتين Human3.6M و MPI-INF-3DHP، حيث حققت تفوقًا على جميع الأساليب القابلة للمقارنة في معظم المقاييس المستخدمة. يمكن الحصول على التنفيذ عبر GitHub.希望这个版本符合您的要求。如果有任何其他修改或补充,请告知我。