استخدام مقاطع الفيديو الشاملة للتحديد والتعقب متعدد الأشخاص في إحداثيات ثلاثية الأبعاد شاملة

تُعدّ التحديد والتعقب ثلاثي الأبعاد على شكل منظور دوائر لعدة أشخاص من المواضيع البارزة في العديد من التطبيقات، ومع ذلك، فإن الطرق التقليدية التي تعتمد على معدات ليدار قد تكون باهظة التكلفة اقتصاديًا، كما أنها غير فعّالة من حيث الحوسبة نظرًا لمعالجة بيانات السحابة النقطية. في هذه الدراسة، نقترح منهجية فعّالة وفعّالة من حيث التكلفة وذات تكلفة منخفضة. أولاً، نحصل على مقاطع فيديو منظورية باستخدام أربع كاميرات عادية. ثم نحوّل مواقع البشر من إحداثيات صورة منظورية ثنائية الأبعاد إلى إحداثيات كاميرا منظورية ثلاثية الأبعاد باستخدام هندسة الكاميرا والخصائص الحيوية للإنسان (مثل الطول). وأخيرًا، نُولّد مسارات ثلاثية الأبعاد (3D tracklets) من خلال ربط مظهر الإنسان مع مساره ثلاثي الأبعاد. ونُثبت فعالية منهجيتنا على ثلاث مجموعات بيانات، بما في ذلك مجموعة بيانات جديدة أنشأناها نحن، من حيث التحديد ثلاثي الأبعاد من منظور واحد لعدة أشخاص، والتعقب ثلاثي الأبعاد من منظور واحد لعدة أشخاص، والتعرف والتعقب ثلاثي الأبعاد على شكل منظور دوائر لعدة أشخاص. يُمكن الوصول إلى الشفرة المصدرية ومجموعة البيانات عبر الرابط: \url{https://github.com/fandulu/MPLT}.