7 天前

用于多人姿态估计的可微分分层图分组

Sheng Jin, Wentao Liu, Enze Xie, Wenhai Wang, Chen Qian, Wanli Ouyang, Ping Luo
用于多人姿态估计的可微分分层图分组
摘要

多人姿态估计是一项具有挑战性的任务,其核心在于同时定位多个个体的身体关键点。现有的方法主要可分为两类:自顶向下(top-down)与自底向上(bottom-up)方法。自顶向下方法首先进行人体检测,再在检测到的个体区域内定位关键点;而自底向上方法则直接检测关键点,随后通过聚类或分组将关键点分配给不同的人体,通常在效率上优于自顶向下方法。然而,在现有的自底向上方法中,关键点聚类过程通常与关键点检测相互独立,导致模型无法实现端到端训练,且性能受限于次优的分组策略。本文提出一种全新的视角来理解人体部件的分组问题,并将其重新建模为图聚类任务。为此,我们提出一种新颖的可微分分层图聚类(Hierarchical Graph Grouping, HGG)方法,用于在自底向上的多人姿态估计任务中学习关键点的图结构聚类。HGG方法可轻松集成至主流的自底向上姿态估计框架中。该方法将人体关键点候选作为图的节点,利用多层图神经网络模型实现关键点的分层聚类。HGG的各个模块可与关键点检测网络进行端到端联合训练,并支持以分层方式对聚类过程进行监督。为进一步提升聚类的判别能力,我们引入了一组边判别器(edge discriminators)和宏观节点判别器(macro-node discriminators),以增强图结构中节点间关系的区分性。在COCO和OCHuman两个公开数据集上的大量实验表明,所提出的HGG方法显著提升了自底向上姿态估计方法的性能。

用于多人姿态估计的可微分分层图分组 | 最新论文 | HyperAI超神经