2ヶ月前

大規模並列注釈を用いた二言語間の修辞構造解析

Elena Chistova
大規模並列注釈を用いた二言語間の修辞構造解析
要約

ディスコース解析は、自然言語処理における重要なタスクであり、テキスト内の高次関係を明らかにするのが目的です。クロスリンギアルなディスコース解析への関心が高まっている一方で、並行データの不足や言語間・コーパス間での修辞構造理論(RST)適用の不整合により、課題が残っています。これらの課題に対処するため、大規模かつ多様な英語GUM RSTコーパスの並行ロシア語注釈を導入しました。最近の進歩を活用し、我々のエンドツーエンドRSTパーサーは英語とロシア語の両コーパスにおいて最先端の結果を達成しています。これは単一言語環境だけでなく二言語環境でも効果的であることを示しており、第二言語の注釈が限られている場合でも成功裏に転送することが可能です。当該研究では、手動で注釈された並行コーパスを用いてクロスリンギアルなエンドツーエンドRST解析の可能性を評価した初めてのものであると認識しています。

大規模並列注釈を用いた二言語間の修辞構造解析 | 最新論文 | HyperAI超神経