17日前
Trans2Unet:ニューラル融合を用いた核の意味セグメンテーション
Dinh-Phu Tran, Quoc-Anh Nguyen, Van-Truong Pham, Thi-Thao Tran

要約
核のセグメンテーションは、組織病理学画像解析において基礎的な役割を果たすものの、依然として困難な課題である。このタスクの主な課題は、核同士が重なり合う領域が存在することであり、それにより独立した核を分離することがさらに複雑になる。本論文では、UnetとTransUnetネットワークを統合した新たな二本枝アーキテクチャを提案する。提案するアーキテクチャ、すなわちTrans2Unetでは、入力画像がまずUnetブランチに送られる。このブランチでは、最後の畳み込み層を削除し、入力画像の異なる空間領域からの特徴を統合することで、関心領域(ROI)をより正確に局在化する。同時に、入力画像は第二のブランチ、すなわちTransUnetブランチにも入力される。TransUnetブランチでは、入力画像が小さなパッチに分割され、Vision Transformer(ViT)をアーキテクチャに組み込むことで、医療画像セグメンテーションタスクにおける強力なエンコーダとして機能し、局所的な空間情報を復元することで画像の詳細を強化する。Trans2Unetの効率性と性能を向上させるために、本研究では「ウォーターフォール」アトロス空間プーリング(WASP)モジュールを基にした計算効率の高い変種、すなわち「スイップ接続付きウォーターフォールアトロス空間プーリング(WASP-KC)」モジュールをTransUnetに組み込む手法を提案した。2018年Data Science Bowlベンチマークにおける実験結果から、従来のセグメンテーションモデルと比較して、提案手法の有効性と高い性能が確認された。