15日前
自己教師付き事前学習による音声分離のラベル割り当ての安定化
Sung-Feng Huang, Shun-Po Chuang, Da-Rong Liu, Yi-Chen Chen, Gene-Ping Yang, Hung-yi Lee

要約
音声分離技術は、非常に成功したパーミュテーション不変訓練(PIT)アプローチを経て著しく発展しているが、より高い収束速度と性能を求める場合、PIT学習中に頻発するラベル割り当ての切り替え問題は依然として課題となっている。本論文では、音声分離モデルの学習におけるラベル割り当ての安定化を図るため、自己教師学習による事前学習を導入する手法を提案する。さまざまな自己教師学習アプローチ、代表的な音声分離モデル、および2種類の異なるデータセットを用いた実験の結果、適切な自己教師学習手法を選択すれば、著しい性能向上が実現可能であることが示された。