
要約
医療画像解析において、高品質なデータの取得および専門家によるアノテーションにかかるコストは、多くの医療応用において障壁となっている。現在用いられている大多数の手法は教師あり学習フレームワークに基づいており、満足のいく性能を達成するためには大量のアノテーション済みデータが必要となる。こうした課題に対し、本稿では、膝関節の医療状態診断を目的として、磁気共鳴(MR)動画クリップのフレームから空間的解剖学的表現を学習するための自己教師学習(Self-Supervised Learning, SSL)手法を提案する。本研究で用いる事前学習モデル(pretext model)は、意味のある空間的文脈不変表現を学習する。本研究の下流タスクは、クラス不均衡を示す多ラベル分類である。異なる実験を通じて、事前学習モデルによって学習された特徴量が下流タスクにおいて競争力のある性能を発揮することが示された。さらに、データセットにおける不均衡に特段の対策を講じることなく、少数クラスの表現学習においても本手法の効率性および信頼性が結果から明らかになった。筆者らの知る限り、本研究は、MR動画を対象としたクラス不均衡な多ラベル分類タスクにおいて、自己教師学習アルゴリズムの有効性と信頼性を示した初の研究である。本研究の評価コードは、https://github.com/sadimanna/skid にて公開されている。