2ヶ月前

自己監督学習手法の手術用コンピュータビジョンへの解剖

Ramesh, Sanat ; Srivastav, Vinkle ; Alapatt, Deepak ; Yu, Tong ; Murali, Aditya ; Sestini, Luca ; Nwoye, Chinedu Innocent ; Hamoud, Idris ; Sharma, Saurav ; Fleurentin, Antoine ; Exarchakis, Georgios ; Karargyris, Alexandros ; Padoy, Nicolas
自己監督学習手法の手術用コンピュータビジョンへの解剖
要約

手術用コンピュータビジョン分野は、深層ニューラルネットワークを基にした手法の普及に伴い、近年大きな進展を遂げています。しかし、このようなモデルの学習に必要な標準的な完全教師ありアプローチは、大量の注釈付きデータを必要とし、特に臨床分野では非常に高いコストが課せられます。自己教師あり学習(Self-Supervised Learning, SSL)手法は、一般的なコンピュータビジョンコミュニティで注目を集めつつある方法であり、これらの注釈コストを軽減する潜在的な解決策となっています。この手法は、ラベルなしデータのみから有用な表現を学習することが可能であるためです。しかし、医学や手術などのより複雑で影響力のある分野におけるSSL手法の有効性はまだ限られており、十分に研究されていません。本研究では、この重要なニーズに対応するために、手術用コンピュータビジョンの文脈において4つの最先端のSSL手法(MoCo v2, SimCLR, DINO, SwAV)を調査します。私たちはこれらの手法がCholec80データセット上でどのように機能するかについて詳細な分析を行い、手術状況理解における2つの基本的かつ人気のあるタスクであるフェーズ認識とツール存在検出に焦点を当てます。まずパラメータ化について検討し、次に半教師あり設定における訓練データ量に対する各手法の挙動を評価します。本研究で説明および実施されたように、これらの手法を手術へ適切に転用することで、一般的なSSLの使用よりも最大7.4%のフェーズ認識性能向上と最大20%のツール存在検出性能向上が達成されました。また、最新の半教師ありフェーズ認識アプローチに対して最大14%の性能向上も示されています。さらに多様な手術データセットでの追加結果は強い汎化能力を示しています。コードは以下のURLから入手可能です: https://github.com/CAMMA-public/SelfSupSurg.

自己監督学習手法の手術用コンピュータビジョンへの解剖 | 最新論文 | HyperAI超神経