HyperAIHyperAI

Command Palette

Search for a command to run...

vq-wav2vec:離散音声表現の自己教師学習

Alexei Baevski Steffen Schneider Michael Auli

概要

本研究では、wav2vecスタイルの自己教師ありコンテキスト予測タスクを通じて音声セグメントの離散表現を学習する手法であるvq-wav2vecを提案する。このアルゴリズムは、密度関数表現を量子化するために、Gumbel-Softmaxまたはオンラインk-meansクラスタリングを用いる。離散化により、離散入力を必要とする自然言語処理(NLP)分野の手法を直接適用可能となる。実験の結果、BERT事前学習がTIMIT音声分類およびWSJ音声認識において、新たな最良性能を達成した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
vq-wav2vec:離散音声表現の自己教師学習 | 記事 | HyperAI超神経