16일 전
YOLOv5-6D: 변동하는 X선 영상 기하학에서의 6-DoF 기구 자세 추정 향상
{Fons van der Sommen, Peter H.N. De With, Maurice Termeer, Lena Filatova, Christiaan G.A. Viviers}
초록
미니멀 인바시브 수술 중 외과 기구의 정확한 6-DoF 자세 추정은 치료 전략 개선과 최종 수술 결과 향상에 크게 기여할 수 있다. 기존의 딥러닝 기반 방법들은 높은 정확도를 달성하고 있으나, 각 객체마다 맞춤형 접근법이 필요하고, 험난한 설정 및 학습 환경이 종종 광범위한 시뮬레이션에 이르며, 실시간 계산 능력이 부족한 문제가 있다. 본 연구에서는 X선 시스템에서 6-DoF 자세 추정 작업을 위한 일반적인 데이터 수집 방식, 정확하고 빠른 객체 자세 추정을 위한 새로운 일반적 YOLOv5-6D 자세 추정 아키텍처, 그리고 단일 광선-빔 X선 이미지에서 획득 기하학적 조건을 고려한 외과용 나사의 자세 추정을 위한 완전한 방법론을 제안한다. 제안된 YOLOv5-6D 자세 모델은 공개 벤치마크에서 경쟁력 있는 성능을 보이며, GPU 기반으로 42 FPS의 빠른 처리 속도를 달성한다. 또한, 다양한 X선 획득 기하학적 조건과 시맨틱 이미지 복잡도에 걸쳐 일반화 가능하여, 다양한 도메인에서 정확한 자세 추정이 가능하다. 마지막으로, 본 방법은 척추 수술 중 컴퓨터 지원 안내를 위한 뼈-나사 자세 추정에 적용되었으며, 0.1∙d ADD-S 지표 기준으로 92.41%의 정확도를 달성하여 수술 정밀도 및 환자 치료 결과 향상에 유망한 접근법임을 입증하였다. YOLOv5-6D 모델의 코드는 공개적으로 제공되며, 다음 링크에서 확인할 수 있다: https://github.com/cviviers/YOLOv5-6D-Pose.