11일 전

합성 이미지와 부분 적대적 도메인 적응을 이용한 지속적 레이블 공간을 위한 심층 헤드 포즈 추정

{ Jorn Ostermann, Felix Kuhnke}
합성 이미지와 부분 적대적 도메인 적응을 이용한 지속적 레이블 공간을 위한 심층 헤드 포즈 추정
초록

머리 자세 추정은 이미지에서 정확한 자세를 예측하는 것을 목표로 한다. 현재의 접근 방식은 일반적으로 대량의 레이블이 필요한 감독 학습 기반의 딥러닝 기법에 의존하고 있다. 머리 자세에 대한 수동 또는 센서 기반의 레이블링은 오류 발생에 취약하다. 이를 해결하기 위해 3D 얼굴 모델을 렌더링하여 합성 학습 데이터를 생성하는 방법이 제안된다. 그러나 렌더링된 이미지(소스 도메인)와 실제 세계 이미지(타겟 도메인) 사이의 차이(도메인 갭)로 인해 성능 저하가 발생할 수 있다. 시각적 도메인 적응(visual domain adaptation) 기술의 발전은 적대적 신경망을 활용하여 도메인 간 특징 공간을 일치시키고, 도메인 불변 특징을 강제함으로써 도메인 차이의 영향을 줄이는 데 기여한다. 그러나 기존의 시각적 도메인 적응 연구는 일반적으로 이산적이고 공유되는 레이블 공간을 전제로 하며, 이러한 가정은 머리 자세 추정 작업에서는 모두 성립하지 않는다. 본 연구는 부분적으로 공유되고 연속적인 레이블 공간을 고려한 머리 자세 추정을 위한 도메인 적응 기법을 최초로 제안한다. 구체적으로, 학습 과정에서 소스 도메인에 대해 가중치 기반 리샘플링 기법을 연속적인 레이블 공간에 적응시켜 주로 사용되는 가중치 조정 방법을 확장하였다. 제안된 방법의 성능을 평가하기 위해 기존 데이터셋을 재구성하고 확장하여, 시각적 도메인 적응을 위한 새로운 벤치마크를 제안하였다. 실험 결과, 본 방법은 합성 이미지의 레이블만을 사용함에도 불구하고 실제 세계 이미지에 대한 머리 자세 추정 정확도를 향상시킴을 입증하였다.

합성 이미지와 부분 적대적 도메인 적응을 이용한 지속적 레이블 공간을 위한 심층 헤드 포즈 추정 | 최신 연구 논문 | HyperAI초신경