ESPRESSO: التجزئة الزمنية المستندة إلى الإنتروبيا وشكل الشكل (Entropy and ShaPe awaRe timE-Series SegmentatiOn) لمعالجة بيانات الاستشعار غير الموحدة

استخلاص أجزاء زمنية مفيدة وذات معنى من بيانات أجهزة الاستشعار القابلة للارتداء عالية الأبعاد، أو بيانات الأجهزة الذكية، أو بيانات إنترنت الأشياء (IoT)، يُعد خطوة ما قبل المعالجة الحيوية في تطبيقات مثل تمييز الأنشطة البشرية (HAR)، وتوقع المسارات، وتمييز الإشارات اليدوية، وتسجيل السجلات الحياتية. في هذه الورقة، نقترح نموذجًا هجينًا للتقسيم يُسمى ESPRESSO (الإنتروبيا وشكل الوقت المُدرك لتقسيم السلاسل الزمنية)، المصمَّم لاستغلال خصائص الإنتروبيا والشكل الزمني للسلاسل الزمنية متعددة الأبعاد. يختلف ESPRESSO عن الطرق الحالية التي تركز حصريًا على خصائص إحصائية أو زمنية معينة للسلاسل الزمنية. أثناء تطوير النموذج، تم تقديم تمثيل زمني جديد للسلاسل الزمنية يُعرف بـ $WCAC$، إلى جانب منهجية بحث جشعة تُقدّر الأجزاء بناءً على مقياس الإنتروبيا. أظهرت النتائج أن ESPRESSO يتفوّق في الأداء مقارنة بأربع طرق حديثة ومتطورة على سبعة مجموعات بيانات عامة تتضمن بيانات استشعار قابلة للارتداء وغير قابلة للارتداء. علاوةً على ذلك، قمنا بتحليل أعمق لهذه المجموعات لفهم كيفية أداء ESPRESSO وطرقه المكوّنة بحسب خصائص المجموعات المختلفة. وأخيرًا، قدّمنا دراستين دراسيتين مثيرتين للاهتمام لتوضيح كيف يمكن لتطبيق ESPRESSO أن يسهم في استخلاص أنماط النشاط اليومي والحالة العاطفية للإنسان.