HyperAIHyperAI
il y a 17 jours

Forêt d’isolation profonde pour la détection d’anomalies

Hongzuo Xu, Guansong Pang, Yijie Wang, Yongjun Wang
Forêt d’isolation profonde pour la détection d’anomalies
Résumé

L’isolation forest (iForest) s’est progressivement imposée comme le détecteur d’anomalies le plus populaire ces dernières années, en raison de son efficacité générale sur diverses benchmarks ainsi que de sa forte scalabilité. Toutefois, sa méthode d’isolation axée sur des coupes parallèles aux axes entraîne fréquemment (i) une incapacité à détecter des anomalies difficiles à isoler dans des espaces de données à haute dimension ou non linéairement séparables, et (ii) un biais algorithmique notoire qui attribue des scores d’anomalie inattendus et faibles aux régions artefact. Ces problèmes contribuent à des taux élevés d’erreurs de faux négatifs. Plusieurs extensions de iForest ont été proposées, mais elles reposent essentiellement sur une partition de données peu profonde et linéaire, ce qui limite leur capacité à isoler efficacement les véritables anomalies. À cet égard, ce papier introduit la deep isolation forest. Nous proposons un nouveau schéma de représentation fondé sur des réseaux neuronaux initialement aléatoirement, qui permet de mapper les données d’origine en des ensembles de représentations aléatoires, auxquels sont ensuite appliquées des coupes aléatoires parallèles aux axes afin de réaliser la partition des données. Ce schéma de représentation permet une grande liberté dans la partition de l’espace original des données (équivalente à une partition non linéaire sur des sous-espaces de tailles variables), favorisant ainsi une synergie originale entre les représentations aléatoires et l’isolation fondée sur des partitions aléatoires. Des expérimentations étendues montrent que notre modèle atteint des améliorations significatives par rapport aux méthodes d’isolation de pointe ainsi qu’aux détecteurs profonds sur des jeux de données tabulaires, graphiques et séries temporelles ; en outre, il préserve la scalabilité souhaitable de iForest.

Forêt d’isolation profonde pour la détection d’anomalies | Articles de recherche récents | HyperAI