HyperAIHyperAI
il y a 9 jours

Apprentissage de représentations à partir de données séquentielles de santé pour la détection d’anomalies non supervisée

{Margarida Silveira, João Pereira}
Résumé

La quantité de données de séries temporelles générées dans le domaine de la santé augmente très rapidement, tout comme la nécessité de méthodes capables d’analyser ces données, de détecter des anomalies et de fournir des insights significatifs. Toutefois, la majeure partie des données disponibles est non étiquetée, ce qui constitue un défi majeur pour les chercheurs et praticiens en détection d’anomalies dans ce contexte. Récemment, l’apprentissage non supervisé de représentations à l’aide de modèles génératifs profonds a été appliqué pour extraire des représentations de données sans nécessiter de grands ensembles de données étiquetées. Inspirés par ces succès, nous proposons un cadre non supervisé pour la détection d’anomalies dans les séries temporelles. Dans notre méthode, à la fois l’apprentissage de représentations et la détection d’anomalies sont entièrement non supervisés. De plus, les données d’entraînement peuvent inclure des observations anormales. Nous commençons par apprendre des représentations des séries temporelles à l’aide d’un Autoencodeur Récurrent Variationnel. Ensuite, à partir de ces représentations, nous détectons les séries temporelles anormales à l’aide de méthodes de clustering combinées à la distance de Wasserstein. Nos résultats obtenus sur le jeu de données public ECG5000, dédié aux électrocardiogrammes, démontrent la capacité de l’approche proposée à détecter des battements cardiaques anormaux de manière entièrement non supervisée, tout en fournissant des représentations structurées et expressives des données. En outre, notre méthode surpasser les approches supervisées et non supervisées précédentes sur ce jeu de données.