
要約
私たちは、品詞タグ付け(Part-of-Speech: POS)と依存関係解析の同時処理を行う新しいニューラルネットワークモデルを提案します。当モデルは、既知のBISTグラフベース依存関係解析器(KiperwasserとGoldberg, 2016)を拡張し、BiLSTMに基づくタギングコンポーネントを組み込むことで、解析器に自動的に予測されたPOSタグを生成します。ベンチマークとなる英語Penn Treebankにおいて、当モデルは94.51%のUAS(未ラベル添付精度)と92.87%のLAS(ラベル付き添付精度)という高いスコアを達成し、BISTグラフベース依存関係解析器に対して1.5%以上の絶対的な改善をもたらしました。また、97.97%という最先端のPOSタグ付け精度も得ています。さらに、61の大規模Universal Dependenciesツリーバンクから生テキストを解析する実験結果では、基準となるUDPipe(StrakaとStraková, 2017)よりも平均POSタグ付けスコアで0.8%高く、平均LASスコアで3.6%高い性能を示しています。加えて、当モデルを使用することで、バイオメディカルイベント抽出や意見分析アプリケーションにおける下流タスクでも最先端のスコアを得ています。当モデルのコードおよびすべての事前学習済みモデルは以下のURLで公開されています: https://github.com/datquocnguyen/jPTDP