2달 전
You Only Learn One Query: 단일 단계에서 다중 인물, 다중 작업을 위한 통합된 인간 쿼리 학습
Jin, Sheng ; Li, Shuhuai ; Li, Tong ; Liu, Wentao ; Qian, Chen ; Luo, Ping

초록
사람 중심 인식(예: 감지, 분할, 자세 추정 및 속성 분석)은 컴퓨터 비전에서 오랫동안 연구되어 온 문제입니다. 본 논문에서는 단일 단계에서 다중 사람과 다중 작업을 처리하는 통합적이고 유연한 프레임워크(HQNet)를 소개합니다. 우리의 접근 방식은 개별 사람의 복잡한 인스턴스 수준 특성을 포착하고, 다중 사람 상황을 분리하는 통합된 인간 쿼리 표현인 'Human Query'를 학습하는 데 중점을 두고 있습니다. 각각의 HCP(사람 중심 인식) 작업은 충분히 연구되었지만, 단일 단계에서의 다중 작업 학습은 포괄적인 벤치마크 데이터셋이 부족하여 문헌에서 완전히 활용되지 않았습니다. 이 간극을 메우기 위해, 우리는 모델 개발과 포괄적인 평가를 가능하게 하는 COCO-UniHuman 벤치마크를 제안합니다. 실험 결과는 제안된 방법이 다중 작업 HCP 모델 중 최신 기술 수준의 성능을 보여주며, 작업 전용 HCP 모델과 비교해도 경쟁력 있는 성능을 나타내는 것을 입증하였습니다. 또한, 우리의 실험은 Human Query가 새로운 HCP 작업에 적응할 수 있음을 강조하며, 이는 그 강건한 일반화 능력을 보여줍니다. 코드와 데이터는 https://github.com/lishuhuai527/COCO-UniHuman에서 제공됩니다.