2ヶ月前

DoubleU-Net: 医療画像セグメンテーションのための深層畳み込みニューラルネットワーク

Debesh Jha; Michael A. Riegler; Dag Johansen; Pål Halvorsen; Håvard D. Johansen
DoubleU-Net: 医療画像セグメンテーションのための深層畳み込みニューラルネットワーク
要約

セマンティック画像セグメンテーションは、画像の各ピクセルを対応するクラスでラベリングするプロセスである。U-Netやその変種のようなエンコーダー-デコーダーに基づくアプローチは、医療画像セグメンテーションタスクを解決するための人気のある戦略である。U-Netの様々なセグメンテーションタスクにおける性能向上を目指し、当研究では2つのU-Netアーキテクチャを重ね合わせた新しいアーキテクチャであるDoubleU-Netを提案する。最初のU-Netでは、事前学習されたVGG-19を使用してエンコーダーとして機能させる。これはすでにImageNetから特徴を学習しており、他のタスクに容易に転用できる。より効率的にセマンティック情報を捉えるために、さらに下位に別のU-Netを追加した。また、ネットワーク内で文脈情報を捉えるためにAtrous Spatial Pyramid Pooling(ASPP)も採用している。DoubleU-Netの評価には4つの医療セグメンテーションデータセットを使用し、コロノスコピー、デルモスコピー、顕微鏡撮像などの様々なイメージングモダリティが含まれている。MICCAI 2015 セグメンテーションチャレンジ、CVC-ClinicDB、2018 Data Science Bowl チャレンジ、および病変境界セグメンテーションデータセットでの実験結果は、DoubleU-NetがU-Netと基準モデルを上回ることを示している。特にCVC-ClinicDBとMICCAI 2015 セグメンテーションチャレンジデータセットにおいては、小さな平坦ポリープなど困難な画像でもより正確なセグメンテーションマスクが生成されることが確認された。これらの結果は既存のU-Netモデルに対する改善を示している。様々な医療画像セグメンテーションデータセットで得られた有望な結果は、DoubleU-Netが医療画像セグメンテーションとクロスデータセット評価テストの強力な基線モデルとして使用できることを示唆しており、深層学習(Deep Learning, DL)モデルの汎化能力を測定するために利用できる可能性がある。