معالجة الميزات التكيفية للاعتراف القوي بأنشطة الإنسان في مجموعة بيانات متعددة الأوضاع جديدة

التعرف على النشاط البشري (HAR) هو عنصر أساسي في العديد من التطبيقات الناشئة مثل التنقل الذكي، وتحليلات الرياضة، والحياة المعاونة المحيطة، والتفاعل بين الإنسان والروبوت. مع التعرف القوي على النشاط البشري، ستصبح الأنظمة أكثر وعياً بالإنسان، مما يؤدي إلى أنظمة ذاتية القيادة أكثر أماناً وتعاطفاً. رغم التقدم الكبير الذي أحرزته كشف الوضع البشري بفضل ظهور الشبكات العصبية التلافيفية العميقة (CNNs)، فإن معظم الأبحاث الرائدة ركزت بشكل شبه حصري على وسيلة استشعار واحدة، خاصة الفيديو. ومع ذلك، في التطبيقات الحرجة من حيث السلامة، من الضروري استخدام عدة وسائل استشعار للعمل بكفاءة عالية. للاستفادة من مزايا تقنيات التعلم الآلي الرائدة في التعرف على النشاط البشري، يُعدّ وجود قواعد بيانات متعددة الوسائط أمراً بالغ الأهمية. في هذا البحث، نقدم مجموعة بيانات جديدة ومبتكرة تستخدم عدة وسائل استشعار وتغطي تسعة أنشطة داخلية تم تنفيذها بواسطة 16 مشاركاً وأُخذت باستخدام أربع أنواع من المستشعرات التي تُستخدم عادةً في التطبيقات الداخلية والمركبات ذاتية القيادة. تعد هذه المجموعة البيانات المتعددة الوسائط الأولى من نوعها التي يتم توفيرها بشكل مفتوح ويمكن استخدامها في العديد من التطبيقات التي تتطلب التعرف على النشاط البشري، بما في ذلك تحليلات الرياضة، ومُساعدة الرعاية الصحية، والتنقل الذكي داخل المباني. نقترح خوارزمية معالجة بيانات جديدة ومبتكرة تمكن من استخراج الخصائص المرنة من المجموعة البيانات لاستخدامها بواسطة مختلف خوارزميات التعلم الآلي. عبر تقييمات تجريبية صارمة، يراجع هذا البحث أداء نماذج التعلم الآلي في التعرف على وضع الجسم ويحلل متانة هذه الخوارزميات. عند إجراء التعرف على النشاط البشري باستخدام بيانات RGB-Depth من مجموعتنا البيانات الجديدة، حققت خوارزميات التعلم الآلي مثل الشبكة العصبية العميقة دقة تصنيف متوسطة بلغت حتى 96.8٪ لجميع الأنشطة الثابتة والديناميكية.