HyperAIHyperAI
il y a 2 mois

Gestion Implicite du Mouvement pour la Détection d'Objets Camouflés dans les Vidéos

Cheng, Xuelian ; Xiong, Huan ; Fan, Deng-Ping ; Zhong, Yiran ; Harandi, Mehrtash ; Drummond, Tom ; Ge, Zongyuan
Gestion Implicite du Mouvement pour la Détection d'Objets Camouflés dans les Vidéos
Résumé

Nous proposons un nouveau cadre de détection d'objets camouflés dans les vidéos (VCOD) capable d'exploiter à la fois les dynamiques à court terme et la cohérence temporelle à long terme pour détecter des objets camouflés à partir de trames vidéo. Une propriété essentielle des objets camouflés est qu'ils présentent généralement des motifs similaires au fond, ce qui les rend difficiles à identifier sur des images fixes. Par conséquent, gérer efficacement les dynamiques temporelles dans les vidéos devient crucial pour la tâche de VCOD, car les objets camouflés seront plus visibles lorsqu'ils se déplacent. Cependant, les méthodes actuelles de VCOD utilisent souvent l'homographie ou les flux optiques pour représenter les mouvements, où l'erreur de détection peut s'accumuler à partir des erreurs d'estimation du mouvement et des erreurs de segmentation. D'autre part, notre méthode unifie l'estimation du mouvement et la segmentation d'objets au sein d'un seul cadre d'optimisation. Plus précisément, nous construisons un volume de corrélation dense pour capturer implicitement les mouvements entre les trames voisines et utilisons la supervision finale de segmentation pour optimiser conjointement l'estimation du mouvement implicite et la segmentation. De plus, pour imposer une cohérence temporelle au sein d'une séquence vidéo, nous utilisons conjointement un transformateur spatio-temporel afin de raffiner les prédictions à court terme. Des expériences approfondies sur des bancs d'essai VCOD montrent l'efficacité architecturale de notre approche. Nous fournissons également un grand ensemble de données VCOD nommé MoCA-Mask avec des masques vérités-terrain manuellement créés au niveau pixel et construisons un banc d'essai VCOD complet en combinant nos méthodes avec celles précédentes afin de faciliter la recherche dans cette direction.Lien vers le jeu de données : https://xueliancheng.github.io/SLT-Net-project.

Gestion Implicite du Mouvement pour la Détection d'Objets Camouflés dans les Vidéos | Articles de recherche récents | HyperAI