Command Palette
Search for a command to run...
تقدير الوضع الثلاثي الأبعاد لعدة أشخاص في صورة واحدة من صورة RGB أحادية
تقدير الوضع الثلاثي الأبعاد لعدة أشخاص في صورة واحدة من صورة RGB أحادية
الملخص
نُقدّم طريقة جديدة ذات خطوة واحدة لتقدير وضعية الأشخاص متعددين في الأبعاد الثلاثة في المشاهد العامة باستخدام كاميرا RGB مفردة. تعتمد طريقة العمل هذه على خ карات وضعية جديدة مقاومة للتغطية (ORPM)، والتي تتيح استنتاج وضعية الجسم بالكامل حتى في حالات التغطية الجزئية الشديدة الناتجة عن أشخاص أو أشياء أخرى في المشهد. تُخرِج خ карات ORPM عددًا ثابتًا من الخ карات، حيث تمثل موضع المفاصل الثلاثية الأبعاد لجميع الأشخاص في المشهد. تسمح روابط أجزاء الجسم باستنتاج الوضعية ثلاثية الأبعاد لعدد غير محدود من الأشخاص دون الحاجة إلى توقع مربعات حدودية صريحة. ولتدريب هذه الطريقة، نقدّم مجموعة بيانات تدريب كبيرة بعنوان MuCo-3DHP، وهي أول مجموعة بيانات كبيرة تحتوي على صور حقيقية لتفاعلات معقدة بين أشخاص متعددين وتغطيات متعددة. وقمنا بتركيب كمية كبيرة من الصور المتعددة الأشخاص من خلال دمج صور أشخاص منفصلين (باستخدام بيانات الحقيقة الأساسية المستمدة من التقنيات متعددة الزوايا لالتقاط الحركات). ونُقيّم طريقتنا على مجموعة اختبار جديدة صعبة التصنيف ثلاثية الأبعاد لحالات الأشخاص المتعددين، تُسمى MuPoTs-3D، حيث نحقق أداءً متقدمًا على مستوى الحالة الحالية (state-of-the-art). ولتحفيز المزيد من الأبحاث في مجال تقدير الوضعية ثلاثية الأبعاد للأشخاص المتعددين، سنُزوّد الباحثين بالبيانات الجديدة والرمز البرمجي المرتبط بها بشكل مفتوح للاستخدام الأكاديمي والبحثي.