HyperAIHyperAI
منذ 4 أشهر

تقدير وضع الإنسان في سيناريوهات مزدحمة حقيقية

Thomas Golda; Tobias Kalb; Arne Schumann; Jürgen Beyerer
تقدير وضع الإنسان في سيناريوهات مزدحمة حقيقية
الملخص

قد حققت تقدير وضعية الإنسان تقدمًا كبيرًا مؤخرًا بفضل استخدام الشبكات العصبية التلافيفية العميقة. وقد جذبت العديد من تطبيقاتها اهتمامًا هائلًا في السنوات الأخيرة. ومع ذلك، فإن العديد من التطبيقات العملية تتطلب تقدير وضعية الحشود البشرية، وهي مشكلة لا تزال نادرة الدراسة. في هذا العمل، نستكشف طرقًا لتحسين تقدير وضعية الحشود البشرية، مع التركيز على التحديات التي تنشأ مع الحشود الكثيفة، مثل الإخفاء، وجود الأشخاص بالقرب الشديد من بعضهم البعض، وجزئيّة رؤية الأشخاص.لمعالجة هذه التحديات، نقيم ثلاثة جوانب لنهج كشف الوضعية: أ) طريقة زيادة البيانات لإدخال متانة ضد الإخفاء، ب) الكشف الصريح عن أجزاء الجسم المخفية، وج) استخدام مجموعات البيانات المولدة بشكل صناعي. النهج الأول لتحسين الدقة في السيناريوهات المزدحمة هو إنشاء إخفاء أثناء التدريب باستخدام قصاصات الأشخاص والأشياء من مجموعة بيانات COCO (Common Objects in Context). بالإضافة إلى ذلك، يتم تقييم مجموعة البيانات JTA (Joint Track Auto) لاستخدامها في تطبيقات الحشود الواقعية.من أجل التغلب على الفجوة النقلية لمجموعة بيانات JTA والتي تنبع من تنوع وضعيات الجسم المنخفض والحشود الأقل كثافة، تم إنشاء مجموعة بيانات موسعة تسهل استخدامها في التطبيقات الواقعية. علاوةً على ذلك، يتم استخدام علامات الإخفاء المرفقة مع JTA لتدريب نموذج يميز بشكل صريح بين أجزاء الجسم المخفية والظاهرة في فرعين مختلفين. يساعد الجمع بين الإضافات المقترحة للطريقة الأساسية على تحسين الدقة الكلية بنسبة 4.7% AP وبالتالي توفير نتائج مماثلة لأحدث الأساليب الرائدة على نفس مجموعة البيانات.