18일 전

업페로센트 동작 과제에서의 LLM 포즈 추정

{Zdenĕk Krňoul, Jakub Kanis, Marek Hrúz}
초록

이 논문에서는 주관적 시점(egocentric viewpoint)에서 손이 다양한 물체와 상호작용할 때의 손 자세 추정 문제를 다룬다. 이 과정에서는 물체에 의해 손의 일부가 자주 가려지는 경우와 손 자체의 자기 가림(self-occlusion)이 자주 발생한다. 우리는 손 관절 위치에 대한 가정을 도출하기 위해 Voxel-to-Voxel 접근법을 사용하고, 이를 통합하여 여러 후처리 전략을 적용하여 성능을 향상시킨다. 또한, 손 자세에 대한 사전 지식 모델로서 절단된 특이값 분해(Truncated Singular Value Decomposition, SVD)와 시간적 맥락(temporal context)을 활용하여 보다 정교한 손 관절 위치를 산출한다. 본 연구에서는 후처리 과정에서 각각의 특징이 미치는 영향을 분석하기 위해 아블레이션(study)을 수행하였다. 제안한 방법을 통해 HANDS19 챌린지의 Task 2 – 물체와 상호작용 중인 깊이 기반 3D 손 자세 추정에서 최신 기술 수준의 성과를 달성하였으며, 미리 보지 못한 테스트 데이터에 대해 정밀도(정확도)는 33.09 mm를 기록하였다.

업페로센트 동작 과제에서의 LLM 포즈 추정 | 최신 연구 논문 | HyperAI초신경