12 天前

从RGB-D视频中学习时空结构以实现人体活动检测与预测

{Hema S. Koppula, Ashutosh Saxena}
从RGB-D视频中学习时空结构以实现人体活动检测与预测
摘要

我们研究的是检测过去行为以及预测未来将发生的行为及其具体方式的问题。为此,我们首先利用条件随机场(CRF)对人姿态与物体之间的丰富时空关系(即“可供性”)进行建模。然而,由于构成某一行为的子活动在时间上的分割存在歧义,无论是过去还是未来,都可能存在多种可能的图结构。本文中,我们通过在多种可能的图结构之间进行推理,来应对这些替代可能性。我们通过仅使用加性特征对图结构进行近似,从而实现高效的动态规划。在初始图结构的基础上,我们进一步设计了若干变换操作,以生成多个合理的其他图结构。实验结果表明,该方法在120段由四位受试者采集的活动视频数据集上,显著提升了过去行为检测与未来行为预测的性能,达到了当前最先进的水平。

从RGB-D视频中学习时空结构以实现人体活动检测与预测 | 最新论文 | HyperAI超神经