2ヶ月前

アラビア語放送音声における自動方言検出

Ahmed Ali; Najim Dehak; Patrick Cardinal; Sameer Khurana; Sree Harsha Yella; James Glass; Peter Bell; Steve Renals
アラビア語放送音声における自動方言検出
要約

アラビア語の放送音声における方言識別に関する異なる手法を調査し、音声認識システムから得られる音韻および語彙特徴量と、i-ベクトルフレームワークを使用した音響特徴量を用いました。生成モデルと判別モデルの両方の分類器を研究し、これらの特徴量を多クラスサポートベクターマシン(SVM)を使用して組み合わせました。我々は、アラビア語/英語の言語識別タスクで結果を検証し、精度が100%となりました。また、これらの特徴量を二値分類器に使用して、現代標準アラビア語(MSA)と方言アラビア語を区別し、精度も100%となりました。さらに、提案手法を使用して最も広く使用されている5つのアラビア方言(エジプト方言、湾岸方言、レバント方言、北アフリカ方言、およびMSA)を区別する結果について報告します。その精度は52%でした。我々は、MSAと方言アラビア語との間でのコードスイッチングの文脈において方言識別の誤りについて議論し、手動でラベル付けされたデータと分類器からの出力との間の誤りパターンを比較しました。また、訓練データとテストデータを標準コーパスとして公開しています。この翻訳では以下の点に注意しました:1. 専門用語や技術概念(例:i-ベクトルフレームワーク, サポートベクターマシン, コードスイッチング)は一般的な日本語訳を使用しました。2. 用詞や文節の順序は日本語の表現習慣に合わせて調整しました。3. 正式かつ客観的な科学技術文献の文体を使用しました。4. 原文内容に忠実でありつつも、日本語読者にとって自然な文章構造になるように最適化しました。