17日前

Focal-UNet:医療画像セグメンテーション向けのUNet型フォーカルモジュレーション

MohammadReza Naderi, MohammadHossein Givkashi, Fatemeh Piri, Nader Karimi, Shadrokh Samavi
Focal-UNet:医療画像セグメンテーション向けのUNet型フォーカルモジュレーション
要約

近年、Transformerを基盤とするU字型アーキテクチャの構築が多数試みられており、CNNベースの手法を上回る新たな手法も提案されている。しかし、Transformerのパッチ分割処理に起因する、予測マスクにおけるブロッキングノイズや切り取りエッジといった深刻な問題が依然として残っている。本研究では、新しく導入されたフォーカルモジュレーション機構を活用して、医療画像セグメンテーション向けの新しいU字型アーキテクチャを提案する。提案アーキテクチャはエンコーダとデコーダで非対称な深さを採用している。フォーカルモジュールが局所的およびグローバルな特徴を効果的に統合できるという特性により、本モデルはTransformerの広い受容 field とCNNの局所的視認性の両方の利点を同時に活かすことができる。これにより、局所特徴とグローバル特徴のバランスを適切に調整し、Swit-UNetと呼ばれる最も強力なTransformerベースのU字型モデルを上回る性能を達成した。Synapseデータセットにおいて、DICEスコアは1.68%向上し、HDメトリクスも0.89向上した。また、極めて限られたデータ条件下でも、NeoPolypデータセットにおいてDICEスコアが4.25%向上した。本研究の実装コードは以下のURLで公開されている:https://github.com/givkashi/Focal-UNet