
要約
本稿では、少量の医療画像から効果的に学習し、一般化能力を発揮する新しい教師あり畳み込みニューラルネットワークアーキテクチャ「DUCK-Net」を提案する。本モデルは、エンコーダー部において複数の解像度での画像情報の捕捉と処理を可能にするために、残差ダウンサンプリング機構とカスタム畳み込みブロックを備えたエンコーダー・デコーダー構造を採用している。さらに、データ拡張技術を用いてトレーニングデータセットを豊かにすることで、モデルの性能向上を図っている。本アーキテクチャは汎用性が高く、さまざまなセグメンテーションタスクに適用可能であるが、本研究では、大腸内視鏡画像におけるポリープセグメンテーションに特化してその有効性を示している。Kvasir-SEG、CVC-ClinicDB、CVC-ColonDB、ETIS-LARIBPOLYPDB の4つの代表的なポリープセグメンテーションベンチマークデータセットにおいて本手法の性能を評価した結果、平均Dice係数、Jaccard指数、精度(Precision)、再現率(Recall)、正解率(Accuracy)の各指標において最先端の性能を達成した。本手法は、限られたトレーニングデータでも優れた一般化能力を示しており、実用性の高い性能を発揮することが明らかになった。コードはGitHub上で公開されており、以下のURLからアクセス可能である:https://github.com/RazvanDu/DUCK-Net