Trajectory Factory : Clivage et Réconnexion de Trajectolettes par un Deep Siamese Bi-GRU pour le Suivi de Multiples Objets

Le suivi multi-objets (MOT) est une tâche complexe dans des scénarios tels que la surveillance et la conduite autonome. Dans cet article, nous proposons une nouvelle méthode de traitement de trajectoires pour diviser et reconnecter les trajectoires en cas de foule ou d'occlusion à long terme, en utilisant une unité récurrente biorienteuse à double porte Siamese (Siamese Bi-Gated Recurrent Unit, GRU). La génération des trajectoires utilise les caractéristiques d'objets extraites par un réseau neuronal convolutif (CNN) et un réseau neuronal récurrent (RNN) pour créer des candidats de trajectoires à haute confiance dans des scénarios clairsemés. En raison de fausses pistes lors du processus de génération, les trajectoires provenant d'objets différents sont divisées en plusieurs sous-trajectoires par une GRU bidirectionnelle. Par la suite, une méthode de reconnectage des trajectoires basée sur une GRU Siamese est appliquée pour lier les sous-trajectoires appartenant au même objet afin de former une trajectoire complète. De plus, nous extrayons les images de trajectoires à partir des jeux de données MOT existants et proposons un nouveau jeu de données pour entraîner nos réseaux. Le jeu de données proposé contient plus de 95 160 images piétonnes. Il comprend 793 personnes différentes, avec en moyenne 120 images par personne, incluant leurs positions et tailles. Les résultats expérimentaux démontrent les avantages de notre modèle par rapport aux méthodes les plus avancées sur MOT16.