18일 전

MuTr: 전체 장면 깊이 이미지에서 손 자세 추정을 위한 다단계 변환기

{Marek Hrúz, Jakub Straka, Matyáš Boháček, Zdeněk Krňoul, Ivan Gruber, Jakub Kanis}
초록

본 연구에서는 손 자세 추정을 위한 새로운 트랜스포머 기반 방법인 DePOTR를 제안한다. 우리는 DePOTR 방법을 네 가지 벤치마크 데이터셋에서 검증하였으며, 다른 트랜스포머 기반 방법들과 비교해 우수한 성능을 보였고, 다른 최첨단 방법들과 경쟁 가능한 결과를 달성하였다. DePOTR의 강점을 더욱 입증하기 위해, 전체 장면 깊이 이미지에서부터 손 자세를 추정하는 새로운 다단계 접근 방식인 MuTr를 제안한다. MuTr는 손 위치 추정과 자세 추정을 위한 두 가지 별도 모델이 필요하지 않도록 하면서도 우수한 성능을 유지한다. 우리 지식으로는, 본 연구가 표준 및 동시에 전체 장면 이미지 설정에서 동일한 모델 아키텍처를 사용하여 둘 다 경쟁 가능한 성능을 달성한 최초의 성공적인 시도이다. NYU 데이터셋에서 DePOTR와 MuTr는 각각 7.85mm 및 8.71mm의 정밀도를 달성하였다.

MuTr: 전체 장면 깊이 이미지에서 손 자세 추정을 위한 다단계 변환기 | 최신 연구 논문 | HyperAI초신경