Suivi multi-cibles quasi-en ligne avec descripteur de flux local agrégé

Dans cet article, nous nous concentrons sur deux aspects clés du problème de suivi multiple : 1) la conception d'une mesure d'affinité précise pour associer les détections et 2) la mise en œuvre d'un algorithme de suivi multiple efficace et précis (quasi) en ligne. En tant que première contribution, nous introduisons un nouveau descripteur de flux local agrégé (ALFD) qui encode le modèle de mouvement relatif entre une paire de détections temporellement éloignées à l'aide de trajectoires à long terme de points d'intérêt (IPTs). Grâce aux IPTs, l'ALFD fournit une mesure d'affinité robuste pour estimer la probabilité d'appariement des détections, indépendamment des scénarios d'application. Comme deuxième contribution, nous présentons un algorithme de suivi multi-cibles quasi en ligne (NOMT). Le problème de suivi est formulé comme une association de données entre les cibles et les détections dans une fenêtre temporelle, qui est effectuée répétitivement à chaque image. Bien qu'efficace, le NOMT atteint une robustesse en intégrant plusieurs indices, y compris la métrique ALFD, la dynamique des cibles, la similarité d'apparence et la régularisation des trajectoires à long terme dans le modèle. Notre analyse ablatives vérifie la supériorité de la métrique ALFD par rapport aux autres mesures d'affinité conventionnelles. Nous avons mené une évaluation expérimentale complète sur deux jeux de données de suivi difficiles, les ensembles KITTI et MOT. La méthode NOMT combinée avec la métrique ALFD atteint la meilleure précision dans les deux jeux de données avec des marges significatives (environ 10% plus élevé en MOTA) par rapport aux méthodes actuelles les plus avancées.