
要約
私たちは、UCCA(Universal Conceptual Cognitive Annotation)という意味表現のための言語間適用可能なフレームワーク向けに、初めてのパーサーを提案します。このフレームワークは広範な言語類型学的研究に基づいており、迅速なアノテーションをサポートしています。UCCAは既存のパース技術にとって挑戦的な特徴を持っています。それは再入性(DAG構造を生成する)、非連続構造、および複雑な意味単位に対応する非終端ノードを示しているからです。私たちの知る限り、これらの形式的特性が組み合わさったものは、どの既存のパーサーでもサポートされていません。私たちが開発した遷移ベースのパーサーは、新しい遷移セットと双方向LSTM(Long Short-Term Memory)に基づく特徴を使用しており、UCCAパースだけでなく、より一般的なグラフ構造の処理能力も持っています。これは他の意味DAG構造用のパーサー開発や、非連続構造を頻繁に使用する言語での解析にも役立つ可能性があります。