ドメイン間少データ学習の広範な研究

最近の少サンプル学習(few-shot learning)の進展は、メタ学習に向けたアノテーション付きデータに大きく依存しており、ベースクラスは新しいクラス(novel classes)と同一のドメインからサンプリングされることが一般的である。しかし、多くの実用的応用において、メタ学習用のデータ収集は現実的または不可能な場合がある。これにより、ベースクラスと新しいクラスのドメイン間に大きなズレが生じる「クロスドメイン少サンプル学習」(cross-domain few-shot learning)という課題が生じる。これまでにクロスドメイン少サンプル学習のシナリオに関する研究は存在するが、それらは依然として視覚的に高い類似性を持つ自然画像に限定されており、現実世界で見られる異なる画像取得手法(例:航空画像と医療画像)を対象とした研究はまだ存在しない。本論文では、多様な画像取得手法から得られた画像データを含む、より広範な設定を想定した「クロスドメイン少サンプル学習の広範な検証ベンチマーク」(Broader Study of Cross-Domain Few-Shot Learning; BSCD-FSL)を提案する。このベンチマークには、作物病害画像など自然画像に加えて、衛星画像、皮膚科画像、放射線画像など、自然画像との視覚的類似性が徐々に低下する画像も含まれる。提案されたベンチマーク上で、最先端のメタ学習手法、転移学習手法、および近年提案されたクロスドメイン少サンプル学習向けの新手法を広範に評価した実験を行った。その結果、最先端のメタ学習手法が、以前のメタ学習アプローチに意外にも劣ることが明らかになった。さらに、すべてのメタ学習手法は、単純なファインチューニングに比べて平均12.8%の精度低下を示した。また、これまでクロスドメイン少サンプル学習に特化した手法で観察されていた性能向上は、より困難な本ベンチマークでは消失した。最終的に、すべての手法の性能は、データセットが自然画像にどれだけ近いかという類似性と相関することが確認された。これは、本ベンチマークが実践で遭遇するデータの多様性をより適切に反映しており、今後の研究の方向性を示す価値があることを裏付けている。