要約
最小侵襲手術中の外科用手術器具の6自由度(6-DoF)姿勢推定を正確に行うことは、治療戦略の改善および最終的な手術結果の向上に大きく寄与する。従来の深層学習手法は高い精度を達成しているが、各対象物に対してカスタマイズされたアプローチを必要とし、実装や学習環境の構築が煩雑で、広範なシミュレーションを要する一方、リアルタイム計算が困難であるという課題がある。本研究では、X線システムにおける6-DoF姿勢推定タスク向けの汎用的データ取得手法、高精度かつ高速な物体姿勢推定を実現する新規で汎用的なYOLOv5-6D姿勢推定アーキテクチャ、および単眼コーンビームX線画像から撮影幾何学的要因を考慮した外科用スクリュー姿勢推定の包括的な手法を提案する。提案するYOLOv5-6D姿勢推定モデルは、公開ベンチマークにおいて競争力のある性能を示すとともに、GPU上で42FPSという顕著な高速性を実現している。さらに、本手法は異なるX線撮影幾何学や画像の意味的複雑性に対しても汎化性を有しており、異なるドメイン間での高精度な姿勢推定を可能にする。最後に、本手法は脊椎手術中のコンピュータ支援ガイドラインとしての骨-スクリュー姿勢推定に適用され、0.1∙d ADD-S評価指標において92.41%の精度を達成した。これは、手術精度と患者の治療結果を向上させる有望なアプローチであることを示している。YOLOv5-6Dのコードは、https://github.com/cviviers/YOLOv5-6D-Pose にて公開されている。