17日前

COMMA:補完的マルチレベル集約ネットワークを用いたポリープセグメンテーション

{Sung Won Han, Min Seok Lee, WooSeok Shin}
要約

大腸内視鏡検査は、大腸がんの予防を目的としたポリープの検出に有効な手法である。従来の研究では、畳み込みニューラルネットワーク(CNN)において低レベルの境界情報と高レベルの領域情報を統合することで、大腸内視鏡画像におけるポリープの高精度なセグメンテーションが実現されてきた。しかし、異なる層の表現を統合する際に生じる分布の不一致(distribution discrepancy)のため、多層統合によるポリープセグメンテーションの性能向上は限定的である。この問題に対処するため、従来の手法では低レベルと高レベルの補完的な表現を用いるアプローチが採用されてきた。本研究では、それらの手法とは異なり、補完的な情報を効果的に伝播させることに焦点を当て、低レベルの明示的な境界情報と高レベルの抽象化された表現を統合することで、分布の不一致を低減することを目指す。本研究では、分布の不一致を低減するための補完的多層統合を伝播させる「COMMA(Complementary Multi-level Aggregation)」を提案する。COMMAは、補完的マスキングモジュール(CMM)と境界伝播モジュール(BPM)を備えたマルチデコーダ構造で構成される。CMMは高レベルの抽象化された表現を用いて低レベルの境界ノイズをマスクし、マスク後の情報を両レベルで活用する。同様に、BPMは最低レベルと最高レベルの表現を統合して明確な境界情報を取得し、その境界情報をCMMに伝播させることで、ポリープ検出性能を向上させる。CMMは境界情報と補完的表現に基づいて、従来のCMMよりもより精細なポリープの識別が可能となる。さらに、ポリープセグメンテーションにおけるクラス不均衡およびノイズの多いアノテーションを緩和するため、ハイブリッド損失関数を提案する。COMMAの性能評価として、5つのベンチマークデータセットを用いて5つの評価指標で実験を実施した。その結果、すべてのデータセットにおいて、提案手法が最先端の手法を上回ることが実証された。特に、既存の最先端手法と比較して、すべてのデータセットにおいて平均でmIoUが0.043向上した。