Vers une détection adaptative d'anomalies vidéo centrée sur l'humain : Un cadre complet et un nouveau benchmark

La détection d'anomalies vidéo centrée sur l'humain (VAD) vise à identifier les comportements humains qui s'écartent de la norme. Au cœur de cette approche, la détection d'anomalies vidéo centrée sur l'humain fait face à des défis considérables, tels que la complexité des comportements humains variés, la rareté des anomalies et les contraintes éthiques. Ces défis limitent l'accès à des jeux de données de haute qualité et soulignent la nécessité d'un jeu de données et d'un cadre soutenant l'apprentissage continu. En nous orientant vers une détection d'anomalies vidéo centrée sur l'humain plus adaptative, nous présentons le jeu de données HuVAD (Détection d'anomalies vidéo centrée sur l'humain avec renforcement de la vie privée) et un nouveau cadre d'apprentissage continu non supervisé pour les anomalies (UCAL). UCAL permet l'apprentissage incrémentiel, ce qui permet aux modèles de s'adapter au fil du temps, comblant ainsi le fossé entre l'entraînement traditionnel et le déploiement en environnement réel. HuVAD accorde une priorité à la vie privée en fournissant des annotations dépersonnalisées et comprend sept scènes intérieures/extérieures, offrant plus de cinq fois plus de cadres annotés par posture que les jeux de données précédents. Nos benchmarks standard et continus utilisent un ensemble complet de métriques, montrant que les modèles améliorés par UCAL atteignent une performance supérieure dans 82,14 % des cas, établissant ainsi un nouveau niveau d'excellence (SOTA). Le jeu de données est accessible à l'adresse suivante : https://github.com/TeCSAR-UNCC/HuVAD.