7日前
スマートフォンで撮影された胸部X線画像の分類における合成データを用いた画像射影変換補正
Chak Fong Chong, Yapeng Wang, Benjamin Ng, Wuman Luo, Xu Yang

要約
スマートフォンで撮影された胸部X線画像(CXR)の分類において、カメラの非理想な位置によって生じる射影変換(projective transformation)の影響により、病変の検出は困難である。近年、文書画像やナンバープレート画像など、さまざまな画像補正タスクに対して、多様な補正手法が提案されてきた。しかしながら、本研究では、CXR画像特有の変換タイプ、画像の外観、アノテーションの形式などの理由から、これらの既存手法がCXR画像には適していないことを確認した。本論文では、射影変換行列を予測することで、CXR画像を自動的に補正する新たな深層学習ベースの射影変換補正ネットワーク(Projective Transformation Rectification Network; PTRN)を提案する。筆者の知る限り、画像補正の学習目標として射影変換行列を直接予測するという点で、本研究は初の試みである。さらに、実データの収集コストを抑えるために、自然なノイズや追加のスクリーン(例えば、X線フィルムの反射やガラス面の干渉)などの要因を考慮した合成CXR画像を生成した。本手法はスタンフォード大学機械学習グループが主催する「CheXphoto」スマートフォン撮影CXR画像分類コンペティションにおいて評価され、AUCで0.850という優れた性能を達成し、2位の0.762を大きく上回り、1位を獲得した。さらに深い分析により、PTRNを用いることで、空間的に変形されたCXR画像に対する分類性能が、高品質なデジタルCXR画像と同等の水準まで向上することが明らかになった。これにより、PTRNがCXR画像における射影変換によるあらゆる悪影響を効果的に除去可能であることが示された。