Social-Implicit:トラジェクトリ予測評価の再考と暗黙的マクシマム・ライクリーディング推定の有効性

Best-of-N(BoN)平均移動誤差(ADE)/最終移動誤差(FDE)は、軌道予測モデルの評価に最も広く用いられている指標である。しかし、BoNは生成されたすべてのサンプルを定量的に評価しないため、モデルの予測品質および性能について不完全な視点を提供してしまう。この問題に対処するために、我々は新たな指標である平均マハラノビス距離(AMD)を提案する。AMDは、生成されたすべてのサンプルが真値(ground truth)にどれほど近いかを定量的に評価する指標である。さらに、予測の全体的な分散を測定する平均最大固有値(AMV)という指標も導入した。実験的に検証した結果、ADE/FDEは分布シフトに対して敏感でないことが明らかになった一方で、AMD/AMVはそのような変化に対してより適切な反応を示し、正確性に関するバイアスのない評価を可能にする。本研究では、従来の生成モデルの代替として、Implicit Maximum Likelihood Estimation(IMLE)を用いた学習手法を採用し、Social-Implicitモデルを構築した。IMLEの学習機構は、AMD/AMVの目的である「真値に近いかつ狭い範囲に集中した予測」を達成する設計と整合している。Social-Implicitはメモリ効率が高く、パラメータ数わずか5.8Kで、実時間処理速度約580Hzを実現し、競争力のある性能を達成している。問題のインタラクティブデモは以下のURLで確認可能である:https://www.abduallahmohamed.com/social-implicit-amdamv-adefde-demo。コードはGitHubにて公開されている:https://github.com/abduallahmohamed/Social-Implicit。