7日前

ViT-V-Net:教師なしボリュメトリック医療画像登録のためのビジョントランスフォーマー

Junyu Chen, Yufan He, Eric C. Frey, Ye Li, Yong Du
ViT-V-Net:教師なしボリュメトリック医療画像登録のためのビジョントランスフォーマー
要約

過去10年間、畳み込みニューラルネットワーク(ConvNet)は、多様な医療画像応用分野において優れた性能を発揮し、最先端の成果を達成してきた。しかし、ConvNetの性能は、画像内の長距離空間的関係を十分に理解できないという限界に直面している。近年提案された画像分類用のビジョントランスフォーマー(ViT)は、純粋に自己注意(self-attention)に基づくモデルを採用しており、画像の関連領域に注目するための長距離空間的関係の学習が可能である。しかし、連続的なダウンサンプリングのため、ViTは低解像度特徴に重点を置く傾向があり、詳細な局在情報の復元が不十分となる。このため、画像登録(image registration)には不向きである。近年、複数のViTベースの画像セグメンテーション手法がConvNetと組み合わせられ、詳細な局在情報の回復を改善する試みがなされている。こうした研究に着想を得て、本研究ではViTとConvNetを統合する新しいアーキテクチャ「ViT-V-Net」を提案する。この手法は、ボリューム医療画像登録に適した性能を提供することを目的としている。本研究で示される実験結果から、提案手法が複数の最先端登録手法を上回る優れた性能を発揮することが明らかになった。

ViT-V-Net:教師なしボリュメトリック医療画像登録のためのビジョントランスフォーマー | 最新論文 | HyperAI超神経