Command Palette
Search for a command to run...
تقسيم ونمو: التقاط التنوع الكبير في صور الحشود باستخدام شبكات النيورونات المتزايدة تدريجياً
تقسيم ونمو: التقاط التنوع الكبير في صور الحشود باستخدام شبكات النيورونات المتزايدة تدريجياً
Deepak Babu Sam; Neeraj N Sajjan; R. Venkatesh Babu
الملخص
عد الأشخاص تلقائيًا في صور الحشود هو مهمة صعبة. يكمن الصعوبة الرئيسية في التنوع الكبير في طريقة ظهور الأشخاص في الحشود. في الواقع، تعتمد الخصائص المتاحة لتمييز الحشد بشكل كبير على كثافة الحشد إلى حد أن الأشخاص يظهرون ككتل فقط في المشاهد ذات الكثافة العالية. نعالج هذه المشكلة باستخدام شبكة عصبية تقنية التعلم العميق (CNN) متنامية يمكنها زيادة قدرتها تدريجيًا للتعامل مع التنوع الواسع الموجود في مشاهد الحشد. يبدأ نموذجنا من شبكة عصبية تقنية التعلم العميق (CNN) أساسية لمعرفة الكثافة، والتي يتم تدريبها بالتساوي على جميع أنواع صور الحشود. من أجل التكيف مع التنوع الكبير، ننشئ شبكتين فرعيتين هما نسختان مطابقتان للشبكة الأساسية (CNN). يتضمن إجراء التدريب التفاضلي تقسيم مجموعة البيانات إلى عنقين وضبط الشبكات الفرعية على خبراتها الخاصة. نتيجة لذلك، وبلا أي معايير يدوية لتشكيل الخبرات، تصبح الشبكات الفرعية خبراء في أنواع معينة من الحشود. يتم تقسيم الشبكات الفرعية مرة أخرى بطريقة متكررة، مما يؤدي إلى إنشاء خبيرين في كل تقسيم. يؤدي هذا التدريب الهرمي إلى شجرة من شبكات (CNN)، حيث تكون الشبكات الفرعية أكثر دقة من أي من آبائها. يتم اتخاذ العقد الطرفية كخبراء نهائيين ويتم بعد ذلك تدريب شبكة تصنيف لتنبؤ الخبير الصحيح لمقطع صورة اختبار معين. يحقق النموذج المقترح دقة أعلى في العد على المجموعات الرئيسية للحشد. بالإضافة إلى ذلك، نحلل خصائص الخبرات التي تم استخراجها تلقائيًا بواسطة طريقتنا.请注意,这里“ashkhas”(أشخاص)一词在阿拉伯语中是复数形式,而“shakhs”(شخص)是单数形式。根据上下文,我选择了适当的复数形式。此外,“leaf nodes”被翻译为“العقد الطرفية”,这是指树状结构中的终端节点。如果你有其他特定的术语偏好,请告诉我。