Social-Implicit: Die Neubewertung der Trajektorienprädiktion und die Wirksamkeit der impliziten Maximum-Likelihood-Schätzung

Best-of-N (BoN) Average Displacement Error (ADE)/Final Displacement Error (FDE) ist die am häufigsten verwendete Metrik zur Bewertung von Trajektorienvorhersagemodellen. Dennoch quantifiziert BoN nicht alle generierten Proben, was zu einer unvollständigen Sicht auf die Vorhersagequalität und -leistung des Modells führt. Wir schlagen eine neue Metrik, den Average Mahalanobis Distance (AMD), vor, um dieses Problem anzugehen. AMD ist eine Metrik, die quantifiziert, wie nahe alle generierten Proben der Ground Truth liegen. Außerdem führen wir die Metrik Average Maximum Eigenvalue (AMV) ein, die die Gesamtverbreitung der Vorhersagen misst. Unsere Metriken werden empirisch validiert, indem gezeigt wird, dass ADE/FDE gegenüber Verteilungsverschiebungen nicht empfindlich sind und somit eine verzerrte Vorstellung von der Genauigkeit vermitteln, im Gegensatz zu AMD und AMV. Wir stellen die Verwendung der impliziten Maximum-Likelihood-Schätzung (IMLE) als Ersatz für herkömmliche generative Modelle zur Schulung unseres Modells Social-Implicit vor. Der IMLE-Schulungsmechanismus entspricht dem Ziel von AMD/AMV, Trajektorien vorherzusagen, die der Ground Truth nahe liegen und eine enge Verteilung aufweisen. Social-Implicit ist ein speichereffizientes tiefes Modell mit lediglich 5,8 K Parametern, das mit einer Geschwindigkeit von etwa 580 Hz in Echtzeit läuft und wettbewerbsfähige Ergebnisse erzielt. Eine interaktive Demonstration des Problems ist unter https://www.abduallahmohamed.com/social-implicit-amdamv-adefde-demo verfügbar. Der Quellcode ist auf https://github.com/abduallahmohamed/Social-Implicit zugänglich.