2ヶ月前

MetaAudio: 少数ショット音声分類ベンチマーク

Heggan, Calum ; Budgett, Sam ; Hospedales, Timothy ; Yaghoobi, Mehrdad
MetaAudio: 少数ショット音声分類ベンチマーク
要約

現在利用可能な少サンプル学習(少ない訓練データで行う機械学習)のベンチマークは、主に画像分類に焦点を当てており、対象とするドメインが限定されています。本研究では、これらの画像ベースのベンチマークへの依存を軽減することを目指し、多様な音響ドメインと実験設定をカバーする最初の包括的かつ公開された音声ベースの代替ベンチマークを提供します。私たちは7つの音声データセット(環境音から人間の言葉まで)を使用して、さまざまな手法の少サンプル分類性能を比較しました。さらに、結合訓練(すべてのデータセットが訓練中に使用される)とクロスデータセット適応プロトコルについて詳細な分析を行い、汎用的な音声少サンプル分類アルゴリズムの可能性を確立しました。実験結果は、MAMLやMeta-Curvatureなどの勾配ベースのメタ学習方法が、計量法および基準法よりも一貫して優れた性能を示すことを示しています。また、結合訓練ルーチンが環境音データベース全体での汎化能力向上に寄与することを示し、クロスデータセット/ドメイン設定に対処するための比較的有效な方法であることも明らかにしました。

MetaAudio: 少数ショット音声分類ベンチマーク | 最新論文 | HyperAI超神経