
要約
近年、事前学習モデルは自然言語処理(NLP)の大多数のタスクで主流となっている。しかし、自動エッセイ採点(AES)の分野においては、BERTのような事前学習モデルが、LSTMなどの他の深層学習モデルを上回る形で適切に活用されていないのが現状である。本論文では、BERT向けの新しいマルチスケールエッセイ表現を提案し、これを共同学習可能とする手法を導入する。さらに、複数の損失関数を用い、ドメイン外のエッセイからの転移学習を活用することで、性能のさらなる向上を図っている。実験の結果、マルチスケールエッセイ表現の共同学習により著しい効果が得られ、ASAPタスクにおいてすべての深層学習モデルの中でほぼ最先端の性能を達成した。また、提案するマルチスケールエッセイ表現は、CommonLit Readability Prizeデータセットに対しても良好な汎化性能を示しており、本研究で提唱する新しいテキスト表現が、長文処理タスクにおける新たな有効な選択肢となり得ることが示唆される。