2달 전

단계별 다중 인물 해석을 위한 포인트 세트와 중심 기반 오프셋

Chu, Jiaming ; Jin, Lei ; Xing, Junliang ; Zhao, Jian
단계별 다중 인물 해석을 위한 포인트 세트와 중심 기반 오프셋
초록

이 연구는 다중 인간 해석 문제를 다룹니다. 기존 방법들은 상향식(top-down) 또는 하향식(bottom-up) 두 단계 패러다임을 따르지만, 일반적으로 비싼 계산 비용을 필요로 합니다. 우리는 이를 대신하여 다중 인간 해석 문제를 세부적으로 두 개의 하위 문제, 즉 인간 몸체와 부위의 위치 결정으로 분리하는 고성능 단일 단계 다중 인간 해석(Single-stage Multi-human Parsing, SMP) 딥 아키텍처를 제시합니다. SMP는 중심점 위치에서 포인트 특징을 활용하여 그들의 분할(segmentation)을 얻고, 이후 인간 몸체의 중심점에서 부위의 중심점까지 일련의 오프셋(offsets)을 생성함으로써 그룹화 과정 없이 인간 몸체와 부위 매칭(matching)을 수행합니다.SMP 아키텍처 내에서, 우리는 생성된 마스크 주의(mask attention)를 통해 인스턴스(instance)의 전역 특징(global feature)을 추출하는 정교한 특징 유지 모듈(Refined Feature Retain module)과 예측된 분할(segmentation)로 분류 결과(classification results)를 정제(refine)하는 학습 가능한 플러그인 모듈인 관심 영역 마스크 재분류 모듈(Mask of Interest Reclassify module)을 제안합니다. MHPv2.0 데이터셋에 대한 광범위한 실험은 제안된 방법이 최상의 효과性和效率性,超越了现有最先进方法在AP50p上2.1%,在APvolp上1.0%,以及在PCP50上1.2%的表现。特别是,所提出的方法需要较少的训练周期和更简单的模型架构。我们将发布我们的源代码、预训练模型和在线演示,以促进进一步的研究。(注:最后几句话中出现了中文,可能是误输入。以下是修正后的韩文翻译:)MHPv2.0 데이터셋에 대한 광범위한 실험은 제안된 방법이 최상의 효과성과 효율성을 보여주며, 기존 최첨단(state-of-the-art) 방법보다 AP50p에서 2.1%, APvolp에서 1.0%, 그리고 PCP50에서 1.2% 더 우수한 성능을 나타냅니다. 특히, 제안된 방법은 적은 훈련 에포크(epoch)와 덜 복잡한 모델 아키텍처가 필요합니다. 우리는 우리의 소스 코드, 사전 훈련된 모델, 및 온라인 데모를 공개하여 추가 연구를 촉진할 계획입니다.