HyperAIHyperAI

Command Palette

Search for a command to run...

اكتشاف الأشخاص متعدد الآراء في المشاهد الكبيرة من خلال توزيع الأوزان المشرف عليها حسب الرأي

Qi Zhang¹, Yunfei Gong¹, Daijie Chen², Antoni B. Chan³, Hui Huang¹*

الملخص

الطرق الحديثة للكشف عن الأشخاص متعددة الآراء المستندة إلى التعلم العميق (MVD) قد أظهرت نتائج واعدة على مجموعات البيانات الموجودة. ومع ذلك، فإن الطرق الحالية يتم تدريبها وتقييمها بشكل أساسي على مشاهد فردية صغيرة تحتوي على عدد محدود من الإطارات متعددة الآراء وآراء كاميرات ثابتة. نتيجة لذلك، قد لا تكون هذه الطرق عملية للكشف عن الأشخاص في مشاهد أكبر وأكثر تعقيدًا تحتوي على احتمالات كبيرة للإخفاء وأخطاء ضبط الكاميرا. يركز هذا البحث على تحسين الكشف عن الأشخاص متعدد الآراء من خلال تطوير نهج لتوزيع الأوزان المراقب لكل رأي يدمج المعلومات من عدة كاميرات بشكل أفضل في المشاهد الكبيرة. بالإضافة إلى ذلك، تم استخدام مجموعة بيانات صناعية كبيرة لتعزيز قدرة النموذج على التعميم وتمكين تقييم ومقارنة أكثر عملية. تم تحسين أداء النموذج في مشاهد الاختبار الجديدة أيضًا باستخدام تقنية بسيطة للتكيف بين المجالات. تظهر النتائج التجريبية فعالية نهجنا في تحقيق أداء واعد للكشف عن الأشخاص متعدد الآراء عبر المشاهد المختلفة. يمكن الاطلاع على الرمز البرمجي هنا: https://vcc.tech/research/2024/MVD.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp