11日前

BERT埋め込みを用いた自動可読性評価

Joseph Marvin Imperial
BERT埋め込みを用いた自動可読性評価
要約

自動読解性評価(Automatic Readability Assessment: ARA)とは、対象読者層に対してテキストドキュメントの読みやすさまたは難易度を評価するタスクである。研究者にとって、この分野における未解決問題の一つは、このタスクに特化して訓練されたモデルが、リソースが乏しい言語に対しても有効に機能することを確保することである。本研究では、BERTモデルの情報豊富な埋め込み表現と手動で設計された言語学的特徴量を統合する手法を用いて、読解性評価のための新たなアプローチを提案する。実験結果から、英語およびフィリピン語(フィリピン語)のデータセットを用いた読解性評価において、提案手法が従来のアプローチを上回ることが示された。特に、F1スコアにおいて最大で12.4%の向上が達成された。さらに、BERT埋め込みに含まれる一般的な情報は、意味的・構文的自然言語処理ツールが限られているリソースが乏しい言語(例:フィリピン語)において、タスクに必要な特徴量を明示的に抽出することが困難な状況でも、代替的な特徴量セットとして利用可能であることを示した。

BERT埋め込みを用いた自動可読性評価 | 最新論文 | HyperAI超神経