
ディープラーニングはますます生物医療分野の研究を加速しており、画像分類、オブジェクト検出、セマンティックセグメンテーションなどの多様なタスクにニューラルネットワークを活用している。しかし、通常のニューラルネットワークは大規模なラベル付きデータセットを用いて教師あり学習で訓練される。このような前提条件は、生物医療画像認識において問題を引き起こす。なぜなら、生物医療データセットは一般に小規模であり、取得が困難で、ラベリングに費用がかかる上、ラベル付けの方法が異なり(異質性を持つ)がちであるからである。さらに、異質なラベルは教師あり手法にとって大きな課題となる。個々のサンプルについてすべてのクラスがラベル付けされていない場合、教師ありディープラーニング手法は各サンプルに共通するラベルを持つサブセットのみを学習対象として扱う必要がある。その結果、生物医療画像認識の研究者たちは、ラベルおよび真値(ground truth)の要求に対して極めて節約的なアプローチを取らざるを得ない。本論文では、節約的なラベリング戦略の影響について検討し、新たな目的関数に基づいて、異質にラベル付けされたデータ上で多クラスセマンティックセグメンテーション用のニューラルネットワークを訓練する手法を提案する。この目的関数は、クラス非対称損失(class asymmetric loss)とDice損失を組み合わせたものである。本手法は、異質ラベルデータセットにおけるスパースな真値に対する訓練、転移学習(transfer learning)環境下での訓練、および複数の異質ラベルデータセットを統合するユースケースの実現を示している。これに際して、小規模かつ多クラスの生物医療セマンティックセグメンテーションデータセットを用いた。本研究で用いる「heartSeg」データセットは、マスカツイワシ(medaka fish)を心臓モデル系として位置づけたものである。画像認識およびセマンティックセグメンテーションの自動化により、高スループットな実験が可能となり、生物医療研究において不可欠である。本研究のアプローチと分析結果は、教師あり学習環境下で競争力ある性能を示しており、生物医療画像認識における節約的ラベリングの推奨を示唆している。