Command Palette
Search for a command to run...
Apprentissage de la régularité temporelle dans les séquences vidéo
Apprentissage de la régularité temporelle dans les séquences vidéo
Hasan Mahmudul Choi Jonghyun Neumann Jan Roy-Chowdhury Amit K. Davis Larry S.
Résumé
Percevoir des activités significatives dans une séquence vidéo longue constitue un problème difficile en raison de la définition floue du terme « significativité », ainsi que de la présence de perturbations (clutter) dans la scène. Nous abordons ce problème en apprenant un modèle génératif des motifs réguliers de mouvement, appelés « régularité », à partir de plusieurs sources, avec une supervision très limitée. Plus précisément, nous proposons deux méthodes fondées sur les autoencodeurs, grâce à leur capacité à fonctionner avec très peu ou pas de supervision. Premièrement, nous exploitons des caractéristiques spatio-temporelles locales classiques, conçues manuellement, et apprenons un autoencodeur entièrement connecté à partir de ces caractéristiques. Deuxièmement, nous concevons un autoencodeur entièrement convolutif à feed-forward, permettant d’apprendre à la fois les caractéristiques locales et les classificateurs dans un cadre d’apprentissage end-to-end. Notre modèle est capable de capturer des régularités à partir de plusieurs jeux de données. Nous évaluons nos méthodes de manière qualitative et quantitative : nous montrons la régularité apprise dans divers aspects des vidéos, et démontrons des performances compétitives sur des jeux de données de détection d’anomalies, en tant qu’application.