HyperAIHyperAI
il y a 12 jours

Modèle de mélange de Gaussienne à autoencodeur profond pour la détection non supervisée d'anomalies

{Cristian Lumezanu, Wei Cheng, Qi Song, Daeki Cho, Bo Zong, Martin Renqiang Min, Haifeng Chen}
Modèle de mélange de Gaussienne à autoencodeur profond pour la détection non supervisée d'anomalies
Résumé

La détection non supervisée d’anomalies sur des données multi- ou hautement dimensionnelles revêt une importance capitale tant dans la recherche fondamentale en apprentissage automatique que dans les applications industrielles, où l’estimation de densité joue un rôle central. Bien que les approches précédentes fondées sur une réduction de dimensionnalité suivie d’une estimation de densité aient permis des progrès significatifs, elles souffrent principalement de deux inconvénients majeurs : un apprentissage de modèle déconnecté avec des objectifs d’optimisation incohérents, et une incapacité à préserver l’information essentielle dans l’espace de faible dimension. Dans cet article, nous proposons un modèle profond appelé Deep Autoencoding Gaussian Mixture Model (DAGMM) pour la détection non supervisée d’anomalies. Notre modèle utilise un autoencodeur profond afin d’obtenir une représentation de faible dimension ainsi qu’une erreur de reconstruction pour chaque point de données d’entrée, lesquels sont ensuite alimentés dans un modèle à mélanges de Gaussiennes (GMM). Contrairement aux approches classiques utilisant un apprentissage en deux étapes déconnectées et l’algorithme standard d’Expectation-Maximization (EM), DAGMM optimise simultanément les paramètres de l’autoencodeur profond et du modèle de mélange de façon end-to-end, en exploitant un réseau de estimation distinct pour faciliter l’apprentissage des paramètres du modèle de mélange. Cette optimisation conjointe, qui équilibre efficacement la reconstruction par autoencodage, l’estimation de densité de la représentation latente et la régularisation, permet à l’autoencodeur d’éviter les optima locaux peu attractifs et de réduire davantage les erreurs de reconstruction, tout en éliminant la nécessité d’un pré-entraînement. Les résultats expérimentaux sur plusieurs jeux de données publics de référence montrent que DAGMM surpasse significativement les techniques les plus avancées en détection d’anomalies, avec une amélioration pouvant atteindre 14 % en termes de score F1 standard.

Modèle de mélange de Gaussienne à autoencodeur profond pour la détection non supervisée d'anomalies | Articles de recherche récents | HyperAI