مجموعة بيانات فيديو VOccl3D ثلاثية الأبعاد لحجب الرؤية البشرية
التاريخ
رابط النشر
رابط الورقة البحثية
العلامات
VOccl3D هي مجموعة بيانات اصطناعية واسعة النطاق أصدرتها جامعة كاليفورنيا في عام 2025، وتركز على فهم الإنسان ثلاثي الأبعاد في المشاهد المعقدة المحجوبة. الورقة البحثية ذات الصلة بعنوان "VOccl3D: مجموعة بيانات مرجعية للفيديو لتقدير وضعية وشكل الإنسان ثلاثي الأبعاد في ظل ظروف الحجب الحقيقيةالهدف هو توفير معيار تقييم أكثر واقعية لتقدير وضعية الإنسان وإعادة بنائها ومهام الإدراك متعدد الوسائط، بناءً على ظروف الحجب.
تحتوي مجموعة البيانات هذه على أكثر من 250,000 صورة وحوالي 400 مقطع فيديو، تم إنشاؤها من مشاهد خلفية، وحركات بشرية، وقوام متنوع، وتحديداً بما في ذلك:
- الخلفية: 40 تمثيلاً ثلاثي الأبعاد من العالم الحقيقي تم تعلمها من DL3DV، بما في ذلك أنواع مختلفة من الانسداد الطبيعي.
- الحركة البشرية: ما يقرب من 400 تسلسل حركي من AMASS
- نسيج الجسم: حوالي 200 نسيج من SMPLitex، تغطي مختلف أنواع الملابس وألوان البشرة وأنواع الجسم.
تُعرض جميع التسلسلات بدقة 720×720 بكسل وبمعدل 30 إطارًا في الثانية، مما يوفر معلمات دقيقة للكاميرا، سواءً الداخلية أو الخارجية. كما توفر مجموعة البيانات شروحًا متعددة الوسائط، تشمل الوضعية والشكل ثلاثي الأبعاد، ونقاطًا رئيسية ثنائية الأبعاد، وخطوطًا محيطية بشرية، وتجزئة دلالية، وعلامات حجب، ومربعات إحاطة بشرية، والتي يمكن استخدامها لدراسة قدرات الإدراك البشري متعددة المهام في ظل ظروف الحجب.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.