17日前

CTおよびMRIスキャンにおける3次元スーパーレゾリューションのための中間損失を備えた畳み込みニューラルネットワーク

Mariana-Iuliana Georgescu, Radu Tudor Ionescu, Nicolae Verga
CTおよびMRIスキャンにおける3次元スーパーレゾリューションのための中間損失を備えた畳み込みニューラルネットワーク
要約

現在、病院で一般的に使用されているCTスキャナは、最大512ピクセルまでの低解像度画像を生成する。この画像における1ピクセルは、組織の1ミリメートルの領域に対応している。腫瘍を正確にセグメンテーションし、治療計画を立案するためには、より高解像度のCTスキャンが必要となる。MRIにおいても同様の問題が生じる。本論文では、3D CTまたはMRIスキャンに対する単一画像スーパーレゾリューションのための手法を提案する。本手法は、10層の畳み込み層と、最初の6層の畳み込み層の後に配置された中間的な拡大層を含む深層畳み込みニューラルネットワーク(CNN)に基づいている。最初のCNNは幅と高さの2軸における解像度向上を実現し、その後に配置された2番目のCNNが深度方向(3軸目)の解像度向上を処理する。他の手法とは異なり、最後の畳み込み層の後に加えて、拡大層の直後に真値(ground-truth)高解像度出力との誤差を計算する中間損失を導入している。この中間損失により、ネットワークが真値に近い出力を生成するよう強制され、より優れた結果が得られる。明確な結果を得るための一般的なアプローチとして、固定された標準偏差を用いたガウスノイズの適用が行われるが、本研究では、固定された標準偏差に過剰適合(overfitting)を避けるために、異なる標準偏差を用いたガウス平滑化を採用している。本手法は、2つのデータベースから得られたCTおよびMRIスキャンを対象に、2次元および3次元スーパーレゾリューションの評価を実施し、文献に掲載された関連研究およびさまざまな補間方式に基づくベースラインと比較した。評価では2倍および4倍のスケーリング因子を用いた。実験結果から、本手法が他のすべての手法を上回る優れた性能を発揮することが示された。さらに、人間によるアノテーション評価では、医師および一般アノテーターの両方が、2倍拡大の場合には97.55%、4倍拡大の場合には96.69%の割合で、本手法をランチョス補間(Lanczos interpolation)よりも好む結果を示した。