ClaSP -- تجزئة سلسلة زمنية بدون معاملات

غالبًا ما تؤدي دراسة العمليات الطبيعية والاصطناعية إلى تسلسلات طويلة من القيم المرتبة زمنيًا، المعروفة بسلاسل الزمن (TS). غالبًا ما تتكون هذه العمليات من حالات متعددة، مثل أوضاع التشغيل لآلة، بحيث تؤدي التغيرات في الحالة إلى تغيرات في توزيع الشكل للقيم المقاسة. تهدف عملية تقسيم سلسلة الزمن (TSS) إلى اكتشاف هذه التغيرات بعد حدوثها، بهدف استخلاص معلومات حول التغيرات في عملية إنتاج البيانات. وعادة ما يُعالج TSS كمشكلة تعلم غير مراقب، تهدف إلى تحديد أجزاء من السلسلة يمكن التمييز بينها بناءً على خاصية إحصائية معينة. لكن الخوارزميات الحالية لـ TSS تتطلب تحديد معلمات فائقة تعتمد على المجال من قبل المستخدم، أو تضع افتراضات حول توزيع قيم سلسلة الزمن أو أنواع التغيرات القابلة للكشف، مما يحد من قابليتها للتطبيق. ومن بين المعلمات الشائعة: مقياس تجانس القطعة، وعدد نقاط التغير، وهي معلمات يصعب ضبطها بدقة لكل مجموعة بيانات. نقدم هنا طريقة جديدة تُسمى ClaSP، وهي طريقة دقيقة للغاية، خالية من المعلمات الفائقة، وعامة بالنسبة للمجالات (domain-agnostic) لعملية تقسيم سلسلة الزمن. تعتمد ClaSP على تقسيم سلسلة الزمن بشكل هرمي إلى جزأين. ويتم تحديد نقطة التغير من خلال تدريب فاصل ثنائي لسلسلة الزمن لكل نقطة تقسيم محتملة، ثم اختيار النقطة التي تُظهر أفضل أداء في التمييز بين التسلسلات الجزئية التي تنتمي إلى كل من المجموعتين. وتعلم ClaSP معلمتها الرئيسية (التي تتألف من عددين) من البيانات باستخدام خوارزميتين جديدتين مصممتين خصيصًا لهذا الغرض. وفي تقييم تجريبي أجريناه باستخدام مجموعة معيارية تضم 107 مجموعة بيانات، أظهرنا أن ClaSP تتفوق على أحدث الطرق في الدقة، كما أنها سريعة وقابلة للتوسع. علاوة على ذلك، نسلط الضوء على الخصائص المميزة لـ ClaSP من خلال عدة دراسات حالة واقعية.