11日前
ミニマックス類似度:外科用ツールのセグメンテーションのための対照的半教師付き深層学習ネットワーク
Ange Lou, Kareem Tawfik, Xing Yao, Ziteng Liu, Jack Noble

要約
ニューラルネットワークを用いた医療画像のセグメンテーションにおける一般的な課題は、学習に必要なピクセルレベルのラベル付きデータを十分に取得することが難しいことである。この問題に対処するため、本研究ではコントラスト学習に基づく半教師ありセグメンテーションネットワークを提案する。従来の最先端手法と異なり、我々は「最小最大類似度(Min-Max Similarity: MMS)」という新しいコントラスト学習フレームワークを導入した。この手法では、分類器とプロジェクタを用いて、すべての負例ペア(all-negative pairs)と正例・負例ペア(positive and negative pairs)を構築し、双視点学習(dual-view training)の枠組みの中でMMS問題として学習を定式化する。すべての負例ペアは、異なる視点からのネットワーク学習を監督し、一般化された特徴を捉えるために用いられ、一方で、正例ペアと負例ペア間のピクセル単位のコントラスト損失により、ラベルなしデータに対する予測の一貫性を評価する。提案手法の有効性を定量的・定性的に評価するため、4つの公開された内視鏡手術ツールセグメンテーションデータセットおよび手動でラベル付けした1つの耳硬化症インプラント手術データセットを用いて実験を行った。その結果、提案手法は、最先端の半教師ありおよび完全教師ありセグメンテーションアルゴリズムを一貫して上回る性能を示した。さらに、本手法は未知の手術ツールの識別にも成功し、良好な予測を提供することが可能である。また、MMSアプローチは約40フレーム/秒(fps)の推論速度を達成でき、リアルタイム動画セグメンテーションにも適している。