
要約
深層ネットワークの成功的な訓練には、多くの注釈付き訓練サンプル(数千以上)が必要であるという認識が広まっています。本論文では、利用可能な注釈付きサンプルをより効率的に使用するため、データ拡張を強力に活用したネットワークと訓練戦略を提案します。このアーキテクチャは、コンテキストを捉えるために縮小パスと、精密な位置特定を可能にする対称的な拡大パスから構成されています。我々は、このようなネットワークが非常に少ない画像からエンドツーエンドで訓練できることを示し、電子顕微鏡画像の神経細胞構造のセグメンテーションにおけるISBIチャレンジで従来の最良手法(スライドウィンドウ畳み込みネットワーク)を上回ることが確認されました。同じネットワークを透過光顕微鏡画像(位相差コントラストとDIC)で訓練することで、2015年のISBI細胞追跡チャレンジにおいてこれらのカテゴリーで大幅に優勝しました。さらに、このネットワークは高速です。最近のGPUを使用すると、512x512ピクセルの画像のセグメンテーションに1秒未満しかかかりません。本研究の完全な実装(Caffeに基づく)および学習済みネットワークは、以下のURLから入手可能です: http://lmb.informatik.uni-freiburg.de/people/ronneber/u-net 。