Command Palette
Search for a command to run...
ツイートを普遍的依存関係に解析する
ツイートを普遍的依存関係に解析する
Yijia Liu; Yi Zhu; Wanxiang Che; Bing Qin; Nathan Schneider; Noah A. Smith
概要
我々は、Universal Dependencies(普遍依存関係)を用いたツイートの解析問題について研究しています。UDガイドラインを拡張し、トークン化、品詞タグ付け、ラベル付き依存関係に影響を与えるツイート特有の構造をカバーするようにしました。この拡張されたガイドラインを使用して、Kongら(2014)が導入した(ラベルなしの)Tweebank v1よりも4倍大きい新しい英語のツイートコーパス(Tweebank v2)を作成しました。我々のアノテーター間の不一致を特徴づけ、ツイートの理解と説明における曖昧さにより一貫性のあるアノテーションを提供することが困難であることを示しました。しかし、新しいツリーバンクを使用することで、生データのツイートをUDにパースするパイプラインシステムを構築しました。アノテーションノイズを解消しつつ計算効率を犠牲にしないため、20個の遷移ベースパーサーから単一のパーサーへと蒸留する新方法を提案しました。我々のパーサーは、アンサンブル前の基準モデルに対してLASで2.2ポイント向上し、他のツリーバンクで最先端レベルの精度と速度を持つパーサーを上回る性能を達成しています。