
要約
私たちは、文書の読みやすさを決定するための新しい神経망監督学習および非監督学習アプローチのセットを提示します。非監督設定では、神経言語モデルを利用し、監督設定では3つの異なる神経分類アーキテクチャを試験します。提案された神経非監督アプローチが堅牢であり、言語間で転送可能であることを示し、特定の読みやすさタスクやデータセットへの適応も可能であることを確認しました。本研究では、2つの言語における複数のベンチマークと新規ラベル付き読みやすさデータセットに対して、いくつかの神経アーキテクチャを系統的に比較することで、読みやすさ分類における異なる神経アプローチの包括的な分析を提供しています。これらの手法の長所と短所を明らかにし、現在の最先端の読みやすさ分類手法(多くの場合、広範な特徴量エンジニアリングに依存している)との性能を比較し、改善の可能性について提案しています。