Prévision Diversifiée de Trajectoires avec des Processus Ponctuels Déterminantaux

La capacité de prédire un ensemble de comportements futurs probables et divers d'un agent (par exemple, les trajectoires futures d'un piéton) est essentielle pour les systèmes de perception critiques en termes de sécurité (par exemple, les véhicules autonomes). En particulier, l'ensemble des comportements futurs générés par le système doit être diversifié afin de prendre en compte toutes les issues possibles et ainsi pouvoir prendre les précautions de sécurité nécessaires. Il ne suffit pas de maintenir un ensemble des résultats futurs les plus probables car celui-ci peut ne contenir que des variations d'un seul résultat. Bien que des modèles génératifs tels que les autoencodeurs variationnels (VAEs) aient été démontrés comme étant un outil puissant pour apprendre une distribution sur les trajectoires futures, des échantillons tirés aléatoirement du modèle de vraisemblance implicite appris peuvent ne pas être diversifiés -- le modèle de vraisemblance est dérivé de la distribution des données d'entraînement et les échantillons se concentreront autour du mode principal qui contient le plus de données.Dans ce travail, nous proposons d'apprendre une fonction d'échantillonnage diversifié (DSF) capable de générer un ensemble diversifié et probable de trajectoires futures. La DSF mappe les caractéristiques contextuelles de la prédiction à un ensemble de codes latents qui peuvent ensuite être décryptés par un modèle génératif (par exemple, VAE) en un ensemble d'échantillons de trajectoire diversifiés. Plus précisément, le processus d'identification d'un ensemble diversifié d'échantillons est formulé comme une estimation des paramètres de la DSF. Pour apprendre ces paramètres, la diversité des échantillons de trajectoire est évaluée par une perte de diversité basée sur un processus ponctuel déterminant (DPP). Une descente gradient est effectuée sur les paramètres de la DSF, ce qui entraîne le déplacement des codes latents du jeu d'échantillons pour trouver un ensemble optimal tant en termes de diversité que de probabilité.Notre méthode constitue une application novatrice des DPPs pour optimiser un ensemble d'éléments (trajectoires) dans un espace continu. Nous montrons la diversité des trajectoires produites par notre approche à partir à la fois de données 2D à faible dimensionnalité et de données complexes relatives au mouvement humain à haute dimensionnalité.