17日前
埋め込み集団知識を用いた医療画像セグメンテーションにおけるマルチレベルコンテキストゲート機構
Maryam Asadi-Aghbolaghi, Reza Azad, Mahmood Fathy, Sergio Escalera

要約
医療画像のセグメンテーションは、症例間における解剖学的変異が極めて大きいため、長年にわたり大きな課題であった。近年、ディープラーニングフレームワークの進展により、画像セグメンテーションにおいて高速かつ高精度な性能が実現されている。既存のネットワークの中でも、U-Netは医療画像セグメンテーションへの応用において成功を収めている。本稿では、U-Netの拡張モデルを提案し、U-Net、Squeeze and Excitation(SE)ブロック、双方向ConvLSTM(BConvLSTM)、および密接接続畳み込み(dense convolutions)のメカニズムを活用することで、性能をさらに向上させる。(I) SEモジュールをU-Net内に導入することで、モデルの複雑さをほとんど増加させることなくセグメンテーション性能を向上させた。このブロックは、特徴マップのグローバルな情報埋め込みを用いた自己ゲート機構により、チャネルごとの特徴応答を適応的に再調整する。(II) 特徴の伝搬を強化し、特徴の再利用を促進するために、エンコーディングパスの最終畳み込み層に密接接続畳み込みを適用した。(III) U-Netのスキップ接続における単純な結合ではなく、ネットワークのすべてのレベルでBConvLSTMを用いて、対応するエンコーディングパスから抽出された特徴マップと、前のデコーディングアップ畳み込み層の特徴マップを非線形に結合した。提案モデルは、DRIVE、ISIC 2017および2018、肺セグメンテーション、$PH^2$、細胞核セグメンテーションの6つのデータセットで評価され、最先端の性能を達成した。