2 个月前

通过合成学习检测人-物交互

Hou, Zhi ; Yu, Baosheng ; Qiao, Yu ; Peng, Xiaojiang ; Tao, Dacheng
通过合成学习检测人-物交互
摘要

人与物体交互(Human-Object Interaction, HOI)检测是从图像或视频中推断人类与物体之间关系的基本任务,对于高层次场景理解至关重要。然而,HOI检测通常会受到与物体交互的开放长尾性质的影响,而人类具有极强的组合感知能力,能够认知罕见或未见过的HOI样本。受此启发,我们设计了一种新的HOI组合学习框架,称为合成组合学习(Fabricated Compositional Learning, FCL),以解决开放长尾HOI检测问题。具体而言,我们引入了一个物体生成器来生成有效的物体表示,然后将动词和合成的物体结合起来,组成新的HOI样本。通过所提出的物体生成器,我们能够为罕见和未见过的类别生成大规模的HOI样本,从而缓解HOI检测中的开放长尾问题。在最流行的HOI检测数据集HICO-DET上进行的大量实验表明,该方法在处理不平衡的HOI检测方面具有有效性,并显著提升了罕见和未见过的HOI类别的最新性能。代码可在https://github.com/zhihou7/HOI-CL 获取。