6ヶ月前

音声および音声処理

監視付き微調整

アプローチ／フレームワーク

オーディオ

Qiantong Xu Tatiana Likhomanenko Jacob Kahn Awni Hannun Gabriel Synnaeve Ronan Collobert

概要

最近、擬似ラベル付け（pseudo-labeling）はエンドツーエンド自動音声認識（ASR）において有望な手法として注目されている。本研究では、音声モデルの進化に伴い、未ラベルデータに対して複数回にわたる擬似ラベル付けを効率的に行う半教師付き学習アルゴリズム「反復的擬似ラベル付け（Iterative Pseudo-Labeling: IPL）」を検討する。具体的には、各反復において既存モデルをラベル付きデータおよび未ラベルデータのサブセットを用いて微調整する。IPLの主要な構成要素として、言語モデルを用いたデコーディングとデータ拡張の効果を分析した。その結果、標準的および低リソース設定の両方において、LibriSpeechテストセットで最先端の単語誤り率（Word Error Rate）を達成することを実証した。さらに、異なるコーパスで学習された言語モデルの影響を検討し、IPLが追加のテキストデータを効果的に活用できることを示した。最後に、LibriSpeechの学習用転写データと重複しない新たな大規模なドメイン内テキストコーパスを公開することで、低リソース・半教師付きASR分野の研究を促進することを目的としている。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

音声および音声処理

監視付き微調整

アプローチ／フレームワーク

オーディオ

Qiantong Xu Tatiana Likhomanenko Jacob Kahn Awni Hannun Gabriel Synnaeve Ronan Collobert

概要

最近、擬似ラベル付け（pseudo-labeling）はエンドツーエンド自動音声認識（ASR）において有望な手法として注目されている。本研究では、音声モデルの進化に伴い、未ラベルデータに対して複数回にわたる擬似ラベル付けを効率的に行う半教師付き学習アルゴリズム「反復的擬似ラベル付け（Iterative Pseudo-Labeling: IPL）」を検討する。具体的には、各反復において既存モデルをラベル付きデータおよび未ラベルデータのサブセットを用いて微調整する。IPLの主要な構成要素として、言語モデルを用いたデコーディングとデータ拡張の効果を分析した。その結果、標準的および低リソース設定の両方において、LibriSpeechテストセットで最先端の単語誤り率（Word Error Rate）を達成することを実証した。さらに、異なるコーパスで学習された言語モデルの影響を検討し、IPLが追加のテキストデータを効果的に活用できることを示した。最後に、LibriSpeechの学習用転写データと重複しない新たな大規模なドメイン内テキストコーパスを公開することで、低リソース・半教師付きASR分野の研究を促進することを目的としている。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

音声認識における反復的擬ラベル付け | 記事 | HyperAI超神経