2ヶ月前

ニューラルアラビア語テキストの母音記号付与:最先端の成果と機械翻訳への新しいアプローチ

Ali Fadel; Ibraheem Tuffaha; Bara' Al-Jawarneh; Mahmoud Al-Ayyoub
ニューラルアラビア語テキストの母音記号付与:最先端の成果と機械翻訳への新しいアプローチ
要約

本研究では、アラビア語テキストの自動ディアクリティゼーションに使用される複数の深層学習モデルを提示します。これらのモデルは、フィードフォワードニューラルネットワーク(FFNN)と再帰型ニューラルネットワーク(RNN)という2つの主要な手法を基盤として構築され、100-hot符号化、埋め込み、条件付き確率場(CRF)、ブロック正規化勾配(BNG)などの様々な改良が施されています。モデルは唯一自由に利用可能なベンチマークデータセットで評価され、結果は当社のモデルが他の言語依存的な後処理ステップを必要とするモデルと同等かそれ以上であることを示しています。さらに、アラビア語のディアクリティカル記号が機械翻訳(MT)などの自然言語処理タスクのモデルを強化するために使用できることを示すために、ディアクリティゼーション上の翻訳(ToD)手法を提案しています。

ニューラルアラビア語テキストの母音記号付与:最先端の成果と機械翻訳への新しいアプローチ | 最新論文 | HyperAI超神経