社会隐式:重新思考轨迹预测评估与隐式最大似然估计的有效性

最佳N项(Best-of-N, BoN)平均位移误差(Average Displacement Error, ADE)/最终位移误差(Final Displacement Error, FDE)是评估轨迹预测模型最常用的指标。然而,BoN仅关注生成样本中的最优结果,未能全面反映所有生成样本的分布特性,从而导致对模型预测质量与性能的评估存在不完整性。为此,本文提出一种新指标——平均马哈拉诺比斯距离(Average Mahalanobis Distance, AMD),用于量化生成样本整体与真实轨迹之间的接近程度。此外,我们引入了平均最大特征值(Average Maximum Eigenvalue, AMV)指标,用于衡量预测结果的整体扩散程度。通过实证分析,我们验证了ADE/FDE对分布偏移(distribution shift)不敏感,容易产生对模型准确性的偏差判断,而AMD和AMV指标则能更客观、全面地反映模型性能。为实现与AMD/AMV目标一致的训练机制,本文采用隐式最大似然估计(Implicit Maximum Likelihood Estimation, IMLE)替代传统生成模型,用于训练所提出的模型——Social-Implicit。IMLE的训练策略与AMD/AMV的目标高度契合,即生成既贴近真实轨迹又具有紧凑分布的预测结果。Social-Implicit是一种内存高效的深度模型,仅包含5.8K个参数,可在约580Hz的实时频率下运行,同时取得了具有竞争力的预测性能。相关问题的交互式演示可访问:https://www.abduallahmohamed.com/social-implicit-amdamv-adefde-demo。代码已开源,地址为:https://github.com/abduallahmohamed/Social-Implicit。