HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

عدّ الحشود من صورة واحدة من خلال شبكة عصبية متعددة الأعمدة متعددة التلافيف

{Siqin Chen Shenghua Gao Yi Ma Yingying Zhang Desen Zhou}

عدّ الحشود من صورة واحدة من خلال شبكة عصبية متعددة الأعمدة متعددة التلافيف

الملخص

تهدف هذه الورقة إلى تطوير طريقة قادرة على تقدير عدد الحشود بدقة من صورة فردية، بغض النظر عن كثافة الحشود أو الزاوية المرئية المُستخدمة. ولتحقيق هذا الهدف، قمنا بطرح بنية شبكة عصبية تلافيفية متعددة الأعمدة (MCNN) بسيطة ولكنها فعّالة، تُستخدم لتحويل الصورة إلى خريطة كثافة الحشود. تسمح MCNN المقترحة للصورة المدخلة بأن تكون ذات حجم أو دقة غير محددة مسبقًا. وباستخدام مرشحات ذات مجال استقبال (receptive fields) مختلف الأحجام، تصبح الميزات التي تتعلمها كل شبكة عصبية أعمدة (column CNN) قادرة على التكيف مع التغيرات في حجم الأشخاص أو الرؤوس الناتجة عن التأثيرات البصرية أو تغير دقة الصورة. علاوةً على ذلك، يتم حساب خريطة الكثافة الحقيقية بدقة باستخدام كيرنل (kernel) تعتمد على الهندسة، دون الحاجة إلى معرفة خريطة الزاوية البصرية للصورة المدخلة. وبما أن المجموعات الموجودة حاليًا من بيانات تعداد الحشود لا تغطي بشكل كافٍ جميع الحالات الصعبة التي تم اعتمادها في هذا العمل، فقد قمنا بجمع وتسمية مجموعة بيانات جديدة كبيرة تضم 1198 صورة مع ما يقارب 330,000 رأس مُعلّم. وتم إجراء تجارب واسعة على هذه المجموعة الجديدة الصعبة، فضلًا عن جميع المجموعات المتاحة حاليًا، للتحقق من فعالية النموذج والطريقة المقترحة. وبشكل خاص، أظهرت النتائج أن الطريقة المقترحة، باستخدام نموذج MCNN البسيط، تتفوق على جميع الطرق الموجودة حاليًا. كما أظهرت التجارب أن النموذج، بمجرد تدريبه على مجموعة بيانات واحدة، يمكن نقله بسهولة إلى مجموعة بيانات جديدة.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
crowd-counting-on-shanghaitech-aMCNN
MAE: 110.2
crowd-counting-on-shanghaitech-bMCNN
MAE: 26.4
crowd-counting-on-ucf-cc-50MCNN
MAE: 377.6
crowd-counting-on-ucf-qnrfMCNN
MAE: 277
crowd-counting-on-veniceMCNN
MAE: 145.4
crowd-counting-on-worldexpo10MCNN
Average MAE: 11.6

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
عدّ الحشود من صورة واحدة من خلال شبكة عصبية متعددة الأعمدة متعددة التلافيف | الأوراق البحثية | HyperAI