Contratation de la cinématique squelettique pour la détection d’anomalies dans les vidéos liées à l’humain

La détection des anomalies dans le comportement humain est essentielle pour repérer précocement des situations dangereuses, telles que des altercations dans la rue ou des chutes chez les personnes âgées. Toutefois, la détection d’anomalies est un défi complexe, car les événements anormaux sont rares et parce qu’il s’agit d’une tâche de reconnaissance à ensemble ouvert : ce qui est anormal au moment de l’inférence n’a pas été observé durant l’entraînement. Nous proposons COSKAD, un modèle novateur qui encode le mouvement squelettique humain à l’aide d’un réseau de convolution sur graphe et apprend à contracter les embeddings cinématiques squelettiques sur une hypersphère latente de volume minimal, dans le cadre de la détection d’anomalies vidéo. Nous introduisons trois espaces latents : l’espace euclidien couramment utilisé, ainsi que deux espaces nouveaux, sphérique et hyperbolique. Toutes les variantes surpassent l’état de l’art sur le jeu de données UBnormal récent, pour lequel nous fournissons une version enrichie de squelettes humains annotés. COSKAD établit un nouveau record sur les versions relatives aux humains des jeux de données ShanghaiTech Campus et CUHK Avenue, avec des performances comparables à celles des méthodes basées sur les vidéos. Le code source et le jeu de données seront rendus disponibles à la suite de l’acceptation.