UBnormal : Nouveau benchmark pour la détection d'anomalies vidéo en ensemble ouvert supervisée

La détection d’événements anormaux dans les vidéos est généralement formulée comme une tâche de classification à une seule classe, où les vidéos d’entraînement ne contiennent que des événements normaux, tandis que les vidéos de test incluent à la fois des événements normaux et anormaux. Dans ce cadre, la détection d’anomalies constitue un problème à ensemble ouvert. Toutefois, certaines études assimilent la détection d’anomalies à la reconnaissance d’actions, ce qui correspond à un scénario à ensemble fermé et ne permet pas d’évaluer la capacité des systèmes à détecter de nouveaux types d’anomalies. À cet effet, nous proposons UBnormal, un nouveau benchmark supervisé à ensemble ouvert composé de multiples scènes virtuelles dédiées à la détection d’anomalies dans les vidéos. Contrairement aux jeux de données existants, nous introduisons, pour la première fois, des événements anormaux annotés au niveau des pixels durant l’étape d’entraînement, permettant ainsi l’usage de méthodes d’apprentissage entièrement supervisées pour la détection d’événements anormaux. Afin de préserver la formulation classique du problème à ensemble ouvert, nous veillons à ce que les ensembles de types d’anomalies soient disjoints entre les vidéos d’entraînement et celles de test. Selon nos connaissances, UBnormal est le premier benchmark de détection d’anomalies dans les vidéos à permettre une comparaison équitable en tête-à-tête entre des modèles à une seule classe en ensemble ouvert et des modèles supervisés en ensemble fermé, comme le montrent nos expérimentations. En outre, nous fournissons des preuves empiriques indiquant que UBnormal peut améliorer les performances d’un cadre de détection d’anomalies de pointe sur deux jeux de données réputés, Avenue et ShanghaiTech. Notre benchmark est librement disponible à l’adresse suivante : https://github.com/lilygeorgescu/UBnormal.