17日前
細部に鬼がある:人間の姿勢推定における偏りのないデータ処理の探求
Junjie Huang, Zheng Zhu, Feng Guo, Guan Huang, Dalong Du

要約
人間のポーズ推定分野において、学習および推論の基本的要素であるデータ処理は、本稿の知見に依拠すると、体系的に検討されていない。本論文ではこの問題に注目し、ポーズ推定技術の進化における根本的な課題が偏ったデータ処理にあることを明らかにした。具体的には、最先端手法に共通して用いられる座標系変換およびキーポイント形式変換(すなわち符号化とデコード)という標準的なデータ処理プロセスを検証した結果、一般的に採用される反転(flipping)戦略によって得られる結果が、元の推論結果と整合しないことが判明した。さらに、一部のキーポイント形式変換手法には統計的な誤差が存在することが明らかになった。これらの二つの問題が相互に影響し合い、ポーズ推定性能を著しく低下させ、研究コミュニティに誤った方向性を誘導する「罠」を形成している。この罠は、多くの非最適な対処策を生み出し、それらは常に報告されず、混乱を招きながらも広く影響を与えている。報告されないこれらの対処策は、再現性の失敗や比較の不公正を引き起こし、技術の発展を深刻に阻害している。この根本的な問題に立ち向かうため、本研究では二つの問題に対応する技術的側面を備えた「不偏データ処理(Unbiased Data Processing, UDP)」を提案する。すなわち、不偏な座標系変換と不偏なキーポイント形式変換の二つの技術を統合した。UDPはモデルに依存しないアプローチとして、ポーズ推定の性能限界を明確に押し広げ、研究コミュニティにより高精度かつ信頼性の高い基準を提供する。コードはGitHubにて公開されており、https://github.com/HuangJunJie2017/UDP-Pose から入手可能である。