Social-Implicit : Repenser l'évaluation de la prédiction de trajectoire et l'efficacité de l'estimation du maximum de vraisemblance implicite

L’erreur moyenne de déplacement (ADE) et l’erreur finale de déplacement (FDE) selon la méthode Best-of-N (BoN) constituent les métriques les plus utilisées pour évaluer les modèles de prédiction de trajectoires. Toutefois, la méthode BoN ne prend pas en compte l’ensemble des échantillons générés, ce qui conduit à une vision incomplète de la qualité et des performances du modèle. Nous proposons une nouvelle métrique, la distance de Mahalanobis moyenne (AMD), afin de remédier à ce problème. L’AMD est une mesure qui quantifie la proximité de l’ensemble des échantillons générés par rapport aux vérités terrain. Nous introduisons également la métrique de la valeur propre maximale moyenne (AMV), qui évalue l’étendue globale des prédictions. Nos métriques ont été validées empiriquement : nous montrons que l’ADE/FDE n’est pas sensible aux décalages de distribution, ce qui donne une impression biaisée de précision, contrairement aux métriques AMD/AMV. Nous proposons l’utilisation de l’estimation implicite du maximum de vraisemblance (IMLE) comme alternative aux modèles génératifs traditionnels pour entraîner notre modèle, Social-Implicit. Le mécanisme d’entraînement IMLE est cohérent avec l’objectif d’AMD/AMV, qui consiste à prédire des trajectoires proches des vérités terrain avec une dispersion réduite. Social-Implicit est un modèle profond à faible consommation de mémoire, comptant seulement 5,8 K paramètres, capable de fonctionner en temps réel à environ 580 Hz, tout en atteignant des résultats compétitifs. Une démonstration interactive du problème est disponible à l’adresse suivante : https://www.abduallahmohamed.com/social-implicit-amdamv-adefde-demo . Le code source est accessible à l’adresse : https://github.com/abduallahmohamed/Social-Implicit.