1ヶ月前

再帰的注目変換ネットワーク:小器官セグメンテーションのための多段階視覚的ヒントの組み込み

Qihang Yu; Lingxi Xie; Yan Wang; Yuyin Zhou; Elliot K. Fishman; Alan L. Yuille
再帰的注目変換ネットワーク:小器官セグメンテーションのための多段階視覚的ヒントの組み込み
要約

我々は腹部CTスキャンから小さな臓器(例えば、膵臓)をセグメンテーションすることを目指しています。対象が入力画像において比較的小さな領域を占めるため、深層ニューラルネットワークは複雑で変動する背景によって容易に混乱することがあります。これを緩和するために、研究者たちは粗い段階から細かい段階へのアプローチを提案しました。この方法では、最初の(粗い)段階での予測結果を用いて、次の(細かい)段階の入力範囲を狭めることで精度向上を図りました。しかし、このアルゴリズムは各段階を個別に処理していたため、全体的なエネルギー関数の最適化が不足しており、多段階の視覚的ヒントを取り入れる能力も制限されていました。コンテクスト情報の欠如により反復処理での収束が不十分となり、場合によっては細かい段階でのセグメンテーション精度が粗い段階よりも低くなることがありました。本論文では再帰的サリエンシー変換ネットワーク(Recurrent Saliency Transformation Network)を提案します。その主な革新点はサリエンシー変換モジュールです。このモジュールは前回の反復処理からのセグメンテーション確率マップを空間的な重みとして繰り返し変換し、これらの重みを現在の反復処理に適用します。これにより二つの利点があります。訓練時には異なる入力スケールに対応する深層ネットワーク間での共同最適化が可能になります。テスト時には反復処理を通じて多段階の視覚情報を伝播させることでセグメンテーション精度が向上します。NIH膵臓セグメンテーションデータセットにおける実験結果は最先端の精度を示しており、従来の最高値に対して平均2%以上の改善が見られました。また、我々自身が収集したより大きなデータセットにおけるいくつかの小さな臓器についても大幅な精度向上が報告されています。さらに、当方針はより良い収束特性を持ち、実際の使用において効率的かつ信頼性が高いことが確認されています。