HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

TesseTrack: تتبع ثلاثي الأبعاد مرن متعدد الأشخاص قابِل للتعلم من البداية إلى النهاية

{Srinivasa Narasimhan Jayan Eledath Leonid Pischulini Laurent Guigues N. Dinesh Reddy}

TesseTrack: تتبع ثلاثي الأبعاد مرن متعدد الأشخاص قابِل للتعلم من البداية إلى النهاية

الملخص

ننظر إلى مهمة تقدير وتعقب الوضع الثلاثي الأبعاد لعدد من الأشخاص الذين يُرصدون عبر عدد غير محدود من مقاطع الكاميرات. نقترح نموذج "TesseTrack"، وهو نهج من نوع "أعلى إلى أسفل" جديد يعالج في نفس الوقت إعادة بناء مفاصل الجسم ثلاثية الأبعاد والارتباطات بين الأشخاص في الفضاء والزمن ضمن إطار تعلّمي متكامل ومتسلسل. ويعتمد النهج الأساسي على صيغة مبتكرة في الفضاء الزمني-المكاني تعمل في فضاء مميز (Voxelized) مشترك تم جمعه من مقاطع كاميرات فردية أو متعددة. وبعد مرحلة كشف الأشخاص، يُنتج شبكة عصبية متعددة الأبعاد (4D CNN) تمثيلات قصيرة الأمد مخصصة لكل شخص، والتي تُربط فيما بينها عبر الزمن باستخدام مُطابق قابل للتمايز. ثم تُدمج هذه التمثيلات المرتبطة وتُحوَّل إلى وضعيات ثلاثية الأبعاد من خلال عملية تفكيك (Deconvolution). تختلف هذه الصيغة المتكاملة في الفضاء والزمن عن الاستراتيجيات السابقة التي تعالج تقدير الوضع ثنائي الأبعاد، ورفع الوضع ثنائي الأبعاد إلى ثلاثي الأبعاد، وتعقب الوضع ثلاثي الأبعاد كمشاكل فرعية مستقلة، وهي عرضة للأخطاء عند حلها بشكل منفصل. علاوةً على ذلك، على عكس الطرق السابقة، يُعدّ "TesseTrack" مقاومًا للتغيرات في عدد مقاطع الكاميرات، ويحقق نتائج ممتازة حتى عند توفر مشهد واحد فقط أثناء التقييم. تُظهر التقييمات الكمية لدقة إعادة بناء الوضع ثلاثي الأبعاد على المعايير القياسية تحسينات كبيرة مقارنة بأفضل النماذج الحالية. كما يُظهر تقييم تعقب الوضع ثلاثي الأبعاد للأشخاص المتعددين في إطار التقييم الجديد تفوق "TesseTrack" على النماذج القوية السابقة.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
3d-human-pose-estimation-on-cmu-panopticTesseTrack Multi-View (5 views)
Average MPJPE (mm): 7.3
3d-human-pose-estimation-on-cmu-panopticTesseTrack Monocular
Average MPJPE (mm): 18.9
3d-human-pose-estimation-on-human36mTesseTrack (Monocular)
Average MPJPE (mm): 44.6
Multi-View or Monocular: Monocular
Using 2D ground-truth joints: No
3d-human-pose-estimation-on-human36mTesseTrack (Multi-View)
Average MPJPE (mm): 18.7
Multi-View or Monocular: Multi-View
Using 2D ground-truth joints: No
3d-human-pose-tracking-on-cmu-panopticTesseTrack
3DMOTA: 94.1
3d-multi-person-pose-estimation-on-campusTesseTrack
PCP3D: 97.4
3d-multi-person-pose-estimation-on-cmuTesseTrack
Average MPJPE (mm): 7.3
3d-multi-person-pose-estimation-on-shelfTesseTrack (paper)
PCP3D: 98.2
3d-multi-person-pose-estimation-on-shelfTesseTrack (correct)
PCP3D: 97.9
3d-pose-estimation-on-human3-6mTesseTrack
Average MPJPE (mm): 18.7

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
TesseTrack: تتبع ثلاثي الأبعاد مرن متعدد الأشخاص قابِل للتعلم من البداية إلى النهاية | الأوراق البحثية | HyperAI