17日前
HarDNet-MSEG:0.9以上のMean Diceと86 FPSを達成するシンプルなエンコーダデコーダ型ポリープセグメンテーションニューラルネットワーク
Chien-Hsiang Huang, Hung-Yu Wu, Youn-Long Lin

要約
我々は、ポリープセグメンテーション向けに新たな畳み込みニューラルネットワーク「HarDNet-MSEG」を提案する。このモデルは、5つの代表的なデータセットにおいて、精度と推論速度の両面でSOTA(最新の最良性能)を達成している。特にKvasir-SEGデータセットにおいて、GeForce RTX 2080 Ti GPU上で86.7 FPSの推論速度を維持しつつ、平均Dice係数0.904を実現した。HarDNet-MSEGは、バックボーンとデコーダーの2つの主要構成要素から構成されている。バックボーンは、画像分類、物体検出、複数オブジェクト追跡、セマンティックセグメンテーションなど、さまざまなコンピュータビジョン(CV)タスクに成功裏に適用されてきた低メモリトラフィック型CNN「HarDNet68」である。デコーダー部分は、高速かつ高精度な顕著オブジェクト検出で知られる「カスケード部分デコーダー(Cascaded Partial Decoder)」のアーキテクチャを着想源としている。本研究では、上述の5つの代表的なデータセットを用いてHarDNet-MSEGの性能を評価した。コードおよびすべての実験詳細はGitHubにて公開されている。https://github.com/james128333/HarDNet-MSEG