Action Parsing是计算机视觉领域的子任务,旨在对视频或静态图像中的每一帧或图像进行动作标注。该任务通过识别和分类每个时间点的动作,实现对动态场景的精细解析,为行为理解、姿态估计和异常检测等应用提供关键支持。