تعلم التمثيلات من بيانات السلاسل الزمنية الصحية للكشف غير المراقب عن الشذوذ
يزداد حجم البيانات الزمنية المُنتجة في مجال الرعاية الصحية بشكل سريع جدًا، كما يزداد الطلب على الطرق التي تُمكّن من تحليل هذه البيانات وتحديد الانحرافات (الانomalies) وتقديم رؤى ذات معنى. ومع ذلك، فإن معظم البيانات المتاحة غير مُعلَّمة، مما جعل كشف الانحرافات في هذا السياق تحديًا كبيرًا بالنسبة للباحثين والمهنيين. في الآونة الأخيرة، تم تطبيق التعلم التمثيلي غير المُشرف باستخدام النماذج التوليدية العميقة لاستخلاص تمثيلات للبيانات دون الحاجة إلى مجموعات بيانات مُعلَّمة كبيرة. مستوحين من نجاح هذه النماذج، نقترح إطارًا غير مُشرفًا للكشف عن الانحرافات في البيانات الزمنية. في منهجنا، يتم تعلم التمثيلات والكشف عن الانحرافات بشكل كامل وغير مُشرف. علاوةً على ذلك، يمكن أن تتضمن بيانات التدريب بيانات غير طبيعية (انحرافية). نبدأ أولاً بتعلم تمثيلات البيانات الزمنية باستخدام مُشفِّر متكرر احتمالي (Variational Recurrent Autoencoder). ثم، استنادًا إلى هذه التمثيلات، نُجري الكشف عن السلاسل الزمنية غير الطبيعية باستخدام تقنيات التجميع (Clustering) ومسافة واسرستاين (Wasserstein distance). تُظهر النتائج التي تم الحصول عليها على مجموعة بيانات ECG5000 الكهربائية للقلب المُتاحة للجمهور قدرة المنهج المقترح على اكتشاف نبضات قلب غير طبيعية بطريقة غير مُشرفة بالكامل، مع تقديم تمثيلات منظمة وغنية للبيانات. بالإضافة إلى ذلك، يتفوّق منهجنا على الطرق المُشرفة والغير مُشرفة السابقة على هذه المجموعة.