
摘要
人体解析的目标是将图像中的人体划分为若干组成部分。该任务要求对人体图像中的每个像素进行类别标注。由于人体结构具有层次化特征,图像中每个身体部位通常具有独特的空间分布特性。例如,头部出现在脚部下方的可能性较低,而四肢更可能靠近躯干。受此观察启发,我们通过在水平和垂直方向上对原始人体解析标签进行累积,构建实例级的类别分布图,该分布图可作为有效的监督信号。利用这些水平与垂直方向的类别分布标签,网络能够更好地捕捉各类别内在的空间位置分布规律。我们将两种引导特征融合,生成一个空间引导图,并通过乘法与拼接的方式将其叠加至基础网络中,从而更精确地区分人体各组成部分。我们在三个著名的基准数据集(LIP、ATR 和 CIHP)上进行了大量实验,充分验证了所提方法的有效性与优越性。