HyperAIHyperAI
منذ 2 أشهر

استكشاف وسيلة تحليل الإنسان للاعتراف بالحركة

Liu, Jinfu ; Ding, Runwei ; Wen, Yuhang ; Dai, Nan ; Meng, Fanyang ; Zhao, Shen ; Liu, Mengyuan
استكشاف وسيلة تحليل الإنسان للاعتراف بالحركة
الملخص

طرق التعرف على الحركات القائمة على الوسائط المتعددة حققت نجاحًا كبيرًا باستخدام وسائط الوضع (الهيكل العظمي) والصور الملونة (RGB). ومع ذلك، فإن سلاسل الهياكل العظمية تفتقر إلى وصف المظهر، والصور الملونة تعاني من الضوضاء غير ذات الصلة بسبب قيود الوسيلة. لمعالجة هذا، نقدم خريطة ميزات فك رموز الإنسان كوسيلة جديدة، حيث يمكنها حفظ الميزات الدلالية الفعالة للأجزاء الجسدية بشكل انتقائي، بينما تصفّي معظم الضوضاء غير ذات الصلة. نقترح إطارًا ثنائي الفروع جديدًا يُسمى شبكة فك رموز الإنسان والتجميع (EPP-Net)، وهي أول شبكة تستفيد من كلٍ من الوسائط الهيكلية وفك الرموز البشري للتعرف على الحركات. يتم إدخال الفرع الأول للوضع البشري في شبكة التحويل الرسمية لتمثيل ميزات الوضع، بينما يستخدم الفرع الثاني لفك الرموز البشري خرائط ميزات فك الرموز الوصفية لتمثيل ميزات فك الرموز عبر النوى الانvolutionary. سيتم دمج الميزتين ذوي المستوى العالي بكفاءة من خلال استراتيجية الاندماج المتأخر للحصول على أفضل التعرف على الحركات. أثبتت التجارب الشاملة على مقاييس NTU RGB+D و NTU RGB+D 120 بانتساق فعالية شبكتنا المقترحة EPP-Net، والتي تتفوق على طرق التعرف على الحركات الموجودة حاليًا. شفرتنا المصدر متاحة في: https://github.com/liujf69/EPP-Net-Action.请注意,"انvolutionary" 这个词在阿拉伯语中并不常见,通常我们会使用 "Convolutional"(卷积)来表示这个概念。因此,建议将上述翻译中的 "النوى الانvolutionary" 更正为 "الشبكات الانvolutional" 或者直接使用 "الشبكات الاقتباسية"(Convolutional Networks)。以下是修正后的版本:طرق التعرف على الحركات القائمة على الوسائط المتعددة حققت نجاحًا كبيرًا باستخدام وسائط الوضع (الهيكل العظمي) والصور الملونة (RGB). ومع ذلك، فإن سلاسل الهياكل العظمية تفتقر إلى وصف المظهر، والصور الملونة تعاني من الضوضاء غير ذات الصلة بسبب قيود الوسيلة. لمعالجة هذا، نقدم خريطة ميزات فك رموز الإنسان كوسيلة جديدة، حيث يمكنها حفظ الميزات الدلالية الفعالة للأجزاء الجسدية بشكل انتقائي، بينما تصفّي معظم الضوضاء غير ذات الصلة. نقترح إطارًا ثنائي الفروع جديدًا يُسمى شبكة فك رموز الإنسان والتجميع (EPP-Net)، وهي أول شبكة تستفيد من كلٍ من الوسائط الهيكلية وفك الرموز البشري للتعرف على الحركات. يتم إدخال الفرع الأول للوضع البشري في شبكة التحويل الرسمية لتمثيل ميزات الوضع، بينما يستخدم الفرع الثاني لفك الرموز البشري خرائط ميزات فك الرموز الوصفية لتمثيل ميزات فك الرموز عبر الشبكات الانvolutional (Convolutional Networks). سيتم دمج الميزتين ذوي المستوى العالي بكفاءة من خلال استراتيجية الاندماج المتأخر للحصول على أفضل التعرف على الحركات. أثبتت التجارب الشاملة على مقاييس NTU RGB+D و NTU RGB+D 120 بانتظام فعالية شبكتنا المقترحة EPP-Net، والتي تتفوق على طرق التعرف على الحركات الموجودة حاليًا. شفرتنا المصدر متاحة في: https://github.com/liujf69/EPP-Net-Action.

استكشاف وسيلة تحليل الإنسان للاعتراف بالحركة | أحدث الأوراق البحثية | HyperAI