
要約
読解性評価は、学習者に適したレベルのテキストを自動的に分類することを目的としている。従来のアプローチは、言語学的根拠に基づく多様な特徴量と単純な機械学習モデルを組み合わせる手法を採用していた。近年の手法では、これらの特徴量を排除し、深層学習モデルを用いることで性能が向上している。しかし、深層学習モデルに言語学的根拠を持つ特徴量を追加することで、さらなる性能向上が可能かどうかは明らかでない。本研究では、これらの二つのアプローチを統合し、モデル全体の性能向上とこの問題の解明を目的としている。2つの大規模な読解性コーパスを用いた評価の結果、十分な訓練データが与えられた場合、深層学習モデルに言語学的根拠を持つ特徴量を追加しても、最先端の性能は向上しなかった。本研究の結果は、最先端の深層学習モデルが読解性に関連するテキストの言語学的特徴をすでに十分に捉えているという仮説に対する初期的な証拠を示している。今後の研究において、これらのモデルが形成する表現の本質を解明することで、学習された特徴量と従来のアプローチで仮定される言語学的特徴量との関係についての理解が深まる可能性がある。