
要約
ラベルなしデータを用いながら、クラスごとにたった1つのサンプルのみをラベル付けることで、完全教師あり学習と同等の性能に到達することは、ディープラーニング応用において理想的な状況である。本研究では、CIFAR-10およびSVHNデータセットにおいて、クラスごとに1サンプルしかラベルを付与しない状況でも、完全教師あり学習と同等のテスト精度に到達可能な「ワンショット半教師あり学習(BOSS:Building One-shot Semi-supervised learning)」の可能性を初めて示した。本手法は、クラスプロトタイプの精緻化、クラスバランスの調整、および自己学習(self-training)を統合している。特に、適切なプロトタイプの選定が極めて重要であり、本研究では象徴的な例(iconic examples)を取得するための手法を提案した。さらに、クラスバランスの調整手法が半教師あり学習における精度向上に顕著な効果をもたらし、自己学習が完全教師あり学習と同等の性能に達する水準まで向上することを実証した。厳密な実証評価により、深層ニューラルネットワークの学習に大規模なラベル付きデータセットを用意する必要はないと示された。本研究のコードは、https://github.com/lnsmith54/BOSS にて公開しており、再現性の確保および今後の実世界応用への活用を促進することを目的としている。