HyperAIHyperAI

Command Palette

Search for a command to run...

自己監督学習手法の手術用コンピュータビジョンへの解剖

Sanat Ramesha, Vinkle Srivastava, Deepak Alapatta, Tong Yu, Aditya Murali, Luca Sestini, Chinedu Innocent Nwoye, Idris Hamouda, Saurav Sharma, Antoine Fleurentin, Georgios Exarchakis, Alexandros Karargyris, Nicolas Padoya

概要

手術用コンピュータビジョン分野は、深層ニューラルネットワークを基にした手法の普及に伴い、近年大きな進展を遂げています。しかし、このようなモデルの学習に必要な標準的な完全教師ありアプローチは、大量の注釈付きデータを必要とし、特に臨床分野では非常に高いコストが課せられます。自己教師あり学習(Self-Supervised Learning, SSL)手法は、一般的なコンピュータビジョンコミュニティで注目を集めつつある方法であり、これらの注釈コストを軽減する潜在的な解決策となっています。この手法は、ラベルなしデータのみから有用な表現を学習することが可能であるためです。しかし、医学や手術などのより複雑で影響力のある分野におけるSSL手法の有効性はまだ限られており、十分に研究されていません。本研究では、この重要なニーズに対応するために、手術用コンピュータビジョンの文脈において4つの最先端のSSL手法(MoCo v2, SimCLR, DINO, SwAV)を調査します。私たちはこれらの手法がCholec80データセット上でどのように機能するかについて詳細な分析を行い、手術状況理解における2つの基本的かつ人気のあるタスクであるフェーズ認識とツール存在検出に焦点を当てます。まずパラメータ化について検討し、次に半教師あり設定における訓練データ量に対する各手法の挙動を評価します。本研究で説明および実施されたように、これらの手法を手術へ適切に転用することで、一般的なSSLの使用よりも最大7.4%のフェーズ認識性能向上と最大20%のツール存在検出性能向上が達成されました。また、最新の半教師ありフェーズ認識アプローチに対して最大14%の性能向上も示されています。さらに多様な手術データセットでの追加結果は強い汎化能力を示しています。コードは以下のURLから入手可能です: https://github.com/CAMMA-public/SelfSupSurg.


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています