HyperAIHyperAI
منذ 18 أيام

ترام: المدار العالمي والحركة للبشر الثلاثية الأبعاد من مقاطع الفيديو الملتقطة في البيئات الطبيعية

Yufu Wang, Ziyun Wang, Lingjie Liu, Kostas Daniilidis
ترام: المدار العالمي والحركة للبشر الثلاثية الأبعاد من مقاطع الفيديو الملتقطة في البيئات الطبيعية
الملخص

نُقدّم طريقة TRAM، وهي طريقة ثنائية المرحلة لاستعادة مسار الإنسان وحركته العالمية من مقاطع فيديو ملتقطة في البيئات الطبيعية (in-the-wild). تُعزّز TRAM تقنية SLAM لاستعادة حركة الكاميرا في ظل وجود أشخاص ديناميكين، وتستفيد من خلفية المشهد لاستخلاص مقياس الحركة. وباستخدام الكاميرا المستعادة كإطار مرجعي بمقاييس مترية، نقدّم نموذجًا مُحوّلًا للفيديو (VIMO) لاستخلاص حركة الجسم الحركية للإنسان. من خلال دمج الحركتين، نحقق استعادة دقيقة للإنسان ثلاثي الأبعاد في الفضاء العالمي، مما يقلل بشكل كبير من أخطاء الحركة العالمية مقارنة بالعمل السابق.https://yufu-wang.github.io/tram4d/