2ヶ月前
多カーネル位置埋め込み ConvNeXt によるポリープ分割
Trong-Hieu Nguyen Mau; Quoc-Huy Trinh; Nhat-Tan Bui; Minh-Triet Tran; Hai-Dang Nguyen

要約
医療画像セグメンテーションは、特に大腸がんにおいて、医師が視覚的に確認し、精密な診断を行うための技術です。特に症例の増加に伴い、多くの患者に対して迅速かつ正確な診断と識別が必要となっています。内視鏡画像においては、ポリープや病変部位の位置を正しく特定するために、セグメンテーションタスクが重要となっています。これにより、深層学習を用いてポリープセグメンテーションを自動化する試みが多く行われています。主に U 形構造の改良を目指しています。しかし、UNet の単純なスキップ接続方式では、コンテキスト情報が不足し、エンコーダーとデコーダーからの特徴マップ間で意味的なギャップが生じます。この問題に対処するため、私たちは ConvNeXt バックボーンとマルチカーネル位置埋め込みブロックからなる新しいフレームワークを提案します。提案されたモジュールのおかげで、当方法はポリープセグメンテーションタスクにおいてより高い精度と汎化能力を得ることができます。広範な実験結果から、当モデルは Kvasir-SEG データセット上で Dice 係数 0.8818 および IOU スコア 0.8163 を達成しました。さらに、様々なデータセットにおいても他の最先端手法と競合する優れた成果を上げています。(注:「ache」は一般的には「痛み」と訳しますが、「病変」の方が医学的な文脈に適していると考えられますので、「病変」を使用しました。)