HydraPlus-Net: الخصائص العميقة المتنبه لتحليل المشاة

تحليل المشاة يلعب دورًا حاسمًا في المراقبة الفيديوية الذكية ويعتبر مكونًا رئيسيًا لأنظمة الرؤية الحاسوبية التي تركز على الأمن. رغم أن شبكات العصب الاصطناعي التلافيفية متميزة في تعلم الخصائص التمييزية من الصور، فإن تعلم الخصائص الشاملة للمشاة للمهام الدقيقة لا يزال مشكلة مفتوحة.在这项研究中,我们提出了一种新的基于注意力的深度神经网络,命名为HydraPlus-Net (HP-net),该网络多方向地将多层次注意力图馈送到不同的特征层。所提出的HP-net学习到的注意力深度特征带来了独特的优势:(1) 该模型能够从低级到语义级捕捉多个注意力点;(2) 它探索了注意力特征的多尺度选择性,以丰富行人图像的最终特征表示。我们在两个任务上展示了所提出的HP-net在行人分析中的有效性和通用性,即行人属性识别和个人重新识别。我们提供了大量的实验结果来证明HP-net在各种数据集上的表现优于最先进的方法。请注意,以下是经过调整以更符合阿拉伯语表达习惯的翻译:تحليل المشاة يلعب دورًا حاسمًا في المراقبة الفيديوية الذكية ويعتبر مكونًا رئيسيًا لأنظمة الرؤية الحاسوبية التي تركز على الأمن. رغم أن شبكات العصب الاصطناعي التلافيفية (الشبكات العصبية التلافيفية) متميزة في استخراج الخصائص التمييزية من الصور، إلا أن استخراج الخصائص الشاملة للمشاة للمهام الدقيقة لا يزال مشكلة قائمة.在这项研究中,我们提出了一种新的基于注意力机制的深度神经网络,命名为HydraPlus-Net (HP-net)، حيث يتم تقديم خرائط الانتباه متعددة المستويات إلى طبقات الميزات المختلفة بشكل متعدد الاتجاهات. الميزات العميقة ذات الانتباه المستخرجة من HP-net المقترح توفر مزايا فريدة: (1) يمكن للنموذج التقاط انتباه متعدد من المستوى المنخفض إلى المستوى الدلالي، و(2) يستكشف خاصية الاختيار المتعدد للميزات ذات الانتباه لتعزيز تمثيل الميزات النهائي لصورة المشاة. لقد أظهرنا فعالية وعمومية HP-net المقترح في تحليل المشاة من خلال تنفيذه على مهمتين، وهما: تحديد سمات المشاة وإعادة تعريف الشخص. وقد قدمنا نتائج تجريبية شاملة لإثبات أن HP-net يتفوق على أفضل الأساليب الحالية في مختلف القواعد البيانات.再次调整后的版本如下:تحليل المشاة يلعب دورًا حاسمًا في المراقبة الفيديوية الذكية ويعتبر مكونًا رئيسيًا لأنظمة الرؤية الحاسوبية التي تركز على الأمن. رغم أن شبكات العصب الاصطناعي التلافيفية (الشبكات العصبية التلافيفية) متميزة في استخراج الخصائص التمييزية من الصور، إلا أن استخراج الخصائص الشاملة للمشاة للمهام الدقيقة لا يزال مشكلة قائمة.في هذه الدراسة، نقترح شبكة عصبونية عميقة جديدة تعتمد على آلية الانتباه، باسم HydraPlus-Net (HP-net)، حيث يتم تقديم خرائط الانتباه متعددة المستويات إلى طبقات الميزات المختلفة بشكل متعدد الاتجاهات. الميزات العميقة ذات الانتباه المستخرجة من HP-net المقترح توفر مزايا فريدة:يمكن للنموذج التقاط انتباه متعدد من المستوى المنخفض إلى المستوى الدلالي.يستكشف خاصية الاختيار المتعدد للميزات ذات الانتباه لتعزيز تمثيل الميزات النهائي لصورة المشاة.لقد أظهرنا فعالية وعمومية HP-net المقترح في تحليل المشاة من خلال تنفيذه على مهمتين، وهما: تحديد سمات المشاة وإعادة تعريف الشخص. وقد قدمنا نتائج تجريبية شاملة لإثبات أن HP-net يتفوق على أفضل الأساليب الحالية في مختلف القواعد البيانات.