
教師あり学習に基づくアプローチは、エンドツーエンドの形でラベル付きデータを用いることで、分類問題において従来の最先端技術として広く用いられてきた。しかし、特にデータ量が少ない状況(低データ環境)では、汎化能力に限界がある可能性がある。本研究では、既存のメタデータを活用し、複数の事前タスク(pretext tasks)を同時に学習する教師あり対比学習(supervised contrastive learning)を用いて、データの優れた表現(representation)を学習することで、この課題に取り組む。本手法を呼吸音分類タスクに適用した。このタスクは、性別や年齢といった人口統計学的情報が肺疾患の有無と相関しているため、本手法の設定に適しており、これらの情報をシステムが暗黙的にエンコードすることで、異常の検出精度が向上する可能性がある。教師あり対比学習は、同じクラスラベルを持つサンプルに対して類似した表現を学習し、異なるクラスラベルを持つサンプルに対しては非類似な表現を学習する学習フレームワークである。この手法によって学習された特徴抽出器は、データから有用な特徴を抽出でき、2つの異なるデータセットにおいて、従来の交差エントロピー(cross-entropy)損失関数を用いた手法よりも優れた呼吸異常分類性能を示した。また、クラスラベルを用いずにメタデータのみで表現を学習する場合でも、クラスラベルを用いた交差エントロピー学習と同等の性能が達成された。さらに、性別と年齢が同一の患者群をグループ化する追加タスクを解くように拡張された教師あり対比学習を、クラスラベルとメタデータを組み合わせて用いることで、より情報量の多い特徴が学習されることが示された。本研究は、クラス不均衡やデータ量が少ない環境において、複数のメタデータソースを教師あり対比学習の枠組みで活用する可能性を示唆している。本研究のコードは、https://github.com/ilyassmoummad/scl_icbhi2017 にて公開されている。