2ヶ月前

アラビア語と英語の詩の韻律を再帰型ニューラルネットワークで学習する:言語理解と合成への一歩前進

Waleed A. Yousef; Omar M. Ibrahime; Taha M. Madbouly; Moustafa A. Mahmoud
アラビア語と英語の詩の韻律を再帰型ニューラルネットワークで学習する:言語理解と合成への一歩前進
要約

文章を詩または散文と認識することは、多くの人にとって通常は容易であるが、詩の韻律を特定できるのは専門家だけである。本論文では、平文から詩の韻律を分類する再帰型ニューラルネットワーク(Recurrent Neural Network, RNN)モデルを構築した。入力テキストは文字レベルで符号化され、特徴量の手動設計なしに直接モデルに供給される。これは言語の一般的な機械理解と合成、特にアラビア語において一歩前進となる。アラビア語の16種類の詩の韻律と英語の4種類の韻律について、ネットワークは全体的な精度96.38%と82.31%でそれぞれ正しく分類することができた。この研究のために使用された詩データセットは大規模であり、150万行以上の詩句が含まれており、さまざまな非技術的なソースからクロールされたものである。ほとんどがアラビア文学サイトと英文学サイトで、異なる異質かつ非構造化された形式で収集された。これらのデータセットは現在、クリーンで構造化されドキュメント化された形式で公開されており、今後の他の研究に利用可能である。著者らの知る限りでは、本研究は機械学習手法を用いて詩の韻律分類に取り組んだ最初のものであり、特にRNNによる特徴量なしアプローチに基づいた最初の研究である。さらに、このデータセットは未来の計算機科学研究のために準備された最初の公開データセットである。

アラビア語と英語の詩の韻律を再帰型ニューラルネットワークで学習する:言語理解と合成への一歩前進 | 最新論文 | HyperAI超神経