11日前

アラビア語テキストの自動ダイアクリティゼーションのための効果的なディープラーニングモデル

{Ali Mustafa Qamar, Mokthar Ali Hasan Madhfar}
要約

アラビア語向けの音声合成システムを構築する過程で、システムが多くの発音誤りを含む音声を合成していることが判明した。この誤りの主な原因は、現代標準アラビア語の表記法に「トゥンクィール(diacritics)」と呼ばれる母音記号が欠如していることにある。トゥンクィールは、各文字の上または下に付く小さな記号であり、発音や文法的情報を示すものである。本研究では、深層学習を用いた音声合成システムの開発を踏まえ、アラビア語テキストのトゥンクィールを復元するための3つの深層学習モデルを提案する。最初のモデルは、シンプルな深層学習モデルがコーパス上でいかに性能を発揮するかを検証するためのベースラインモデルである。2番目のモデルは、エンコーダ・デコーダ構造に基づいており、音声合成モデルを参考にしながらも、本問題に適応するため多数の改良を加えている。3番目のモデルは、音声合成モデルのエンコーダ部分のみを活用したものであり、単語誤り率(WER)およびトゥンクィール誤り率(DER)という指標において、最先端の性能を達成している。これらのモデルは、音声合成、品詞タグ付け、機械翻訳など、幅広い自然言語処理アプリケーションに貢献することが期待される。

アラビア語テキストの自動ダイアクリティゼーションのための効果的なディープラーニングモデル | 最新論文 | HyperAI超神経