11日前

EVICAN:細胞および核セグメンテーションにおけるアルゴリズム開発のためのバランスされたデータセット

{Sapun H Parekh, Ronald E Unger, Mischa Schwendy}
要約

深層学習を定量的画像解析に活用する傾向は急激に増加している。しかし、高精度で広範に展開可能な深層学習アルゴリズムを訓練するには、大量のアノテーション済み(真値)データが必要となる。画像データセットには、十分な数の例示対象(例えば細胞)を含むだけでなく、画像の多様性(異質性)も十分に確保されている必要がある。本研究では、複数の顕微鏡、コントラスト手法、倍率から得られた30種類の異なる細胞株の部分的にアノテーションされたグレースケール画像から構成される新規データセット「EVICAN(Expert Visual Cell Annotation)」を提示する。このデータセットは、コンピュータビジョン応用における学習データとして直ちに利用可能である。4600枚の画像と約26,000個のセグメンテーション済み細胞を含み、細胞生物学における深層学習アプリケーション開発に向けた、類を見ないほど多様性に富んだトレーニングデータセットを提供する。マスクR-CNNの実装を用いて、明視野画像からの細胞および核の自動セグメンテーションを実現し、Jaccard指数が0.5を超える条件下で平均精度(mean average precision)61.6%を達成した。

EVICAN:細胞および核セグメンテーションにおけるアルゴリズム開発のためのバランスされたデータセット | 最新論文 | HyperAI超神経