
摘要
人体与物体交互检测对于全面理解视觉场景至关重要。特别是,人体与物体之间的空间关联是推理交互关系的重要线索。为此,我们提出了一种基于骨架感知的图卷积网络用于人体-物体交互检测,命名为SGCN4HOI。该网络利用人体关键点与物体关键点之间的空间连接关系,通过图卷积操作捕捉二者之间的细粒度结构交互。同时,网络将此类几何特征与从人体-物体对中获取的视觉特征及空间配置特征进行融合。此外,为更好地保留物体的结构信息并促进人体-物体交互检测,我们提出了一种新型的基于骨架的物体关键点表示方法。SGCN4HOI在公开基准数据集V-COCO上进行了性能评估。实验结果表明,所提出的方法在性能上优于现有的基于姿态的模型,并在与其他模型的对比中展现出具有竞争力的表现。