
要約
ラベル付きデータが少量しか利用できない状況での深層ニューラルネットワークを用いたデータ効率的な画像分類は、最近の研究において活発な領域となっています。しかし、既存の研究では評価に異なるデータセットが使用され、しばしばデフォルトのハイパーパラメータを持つ未調整のベースラインと比較されるため、公開された手法間での客観的な比較は困難です。本研究では、自然画像、医療画像、衛星データなど様々なドメインとデータタイプ(RGB、グレースケール、マルチスペクトル)をカバーする6つの多様なデータセットから構成されるデータ効率的な画像分類のベンチマークを設計しました。このベンチマークを使用して、2017年から2021年にかけて著名な会議で発表された標準的なクロスエントロピー基準と8つのデータ効率的な深層学習手法を再評価しました。公平かつ現実的な比較のために、各データセットに対してすべての手法のハイパーパラメータを慎重に調整しました。驚くことに、別個の検証分割上で学習率、重み減衰、バッチサイズを調整した結果、非常に競争力のある基準モデルが得られました。この基準モデルは専門的手法のうち1つ以外全てを上回り、残りの1つとも同等以上の性能を示しました。