Squeeze and Excitation Reasoning Attention Networkを用いたMR画像のスーパーレゾリューション

高品質な高解像度(HR)磁気共鳴(MR)画像は、信頼性の高い診断および定量的画像解析に向けたより詳細な情報を提供する。低解像度(LR)MR画像を入力として、深層畳み込みニューラルネットワーク(CNN)は、MR画像の超解像(SR)において有望な性能を示している。しかし、通常のLR MR画像は、繰り返しパターンや比較的単純な構造、情報量の少ない背景といった共通の視覚的特徴を有している。従来のCNNベースのSR手法は、空間的なピクセル(背景を含む)を均等に扱う傾向があり、入力全体の空間情報を適切に捉えることができないという課題を抱えている。これは高品質なMR画像SRにおいて極めて重要な欠陥である。この問題に対処するため、我々は「圧縮・励起推論注意ネットワーク(Squeeze and Excitation Reasoning Attention Networks: SERAN)」を提案する。本手法では、入力画像のグローバル空間情報を圧縮し、グローバル記述子(global descriptors)を獲得する。これらのグローバル記述子は、MR画像におけるより情報量の多い領域や構造に注目する能力をネットワークに強化する。さらに、これらのグローバル記述子間の関係性を構築し、基本的な関係性推論注意(primitive relationship reasoning attention)を導入する。得られたグローバル記述子は、学習された注意機構によりさらに精緻化される。集約された情報を効果的に活用するため、学習された適応的注意ベクトルを用いて特徴応答を動的に再調整する。これらの注意ベクトルは、特定の空間位置における詳細な再構成やテクスチャ再現に寄与するグローバル記述子のサブセットを選択する。さらに、残差スケーリングを用いた圧縮・励起注意機構を提案することで、学習の安定性を向上させるとともに、他の基本ネットワークへの柔軟な適用性を確保している。広範な実験結果により、本手法が提案するSERANが、定量的および定性的な観点から、既存の最先端手法を明確に上回っていることが確認された。