2ヶ月前

POSタグ付けから依存関係解析へ:バイオメディカルイベント抽出のための手法

Dat Quoc Nguyen; Karin Verspoor
POSタグ付けから依存関係解析へ:バイオメディカルイベント抽出のための手法
要約

背景:バイオメディカル研究論文から関係やイベントを抽出することの重要性が知識の獲得と統合を支援するために認識されており、この情報抽出タスクに対するアプローチは構文情報に強く依存しています。したがって、バイオメディカルテキストの構文処理における最高の性能を持つアプローチを理解することは価値があります。結果:私たちは、GENIAおよびCRAFTという2つの基準となるバイオメディカルコーパスにおいて、品詞タグ付け(Part-of-Speech, POS)と従属関係解析という2つの核心的な自然言語処理タスクについて、最先端の伝統的な特徴量ベースモデルとニューラルネットワークベースモデルを比較する実証的研究を行いました。私たちの知る限りでは、最近このような比較を行うバイオメディカル分野での研究は存在せず、特にこのデータに対するニューラルモデルの詳細な分析は利用可能ではありませんでした。実験結果は、一般的にニューラルモデルがGENIAおよびCRAFTという2つの基準となるバイオメディカルコーパスで特徴量ベースモデルよりも優れていることを示しました。また、これらのモデルがバイオメディカルイベント抽出の下流アプリケーションに及ぼす影響を調査するためのタスク指向評価も行い、内在的な解析性能が高いことが必ずしも外在的なイベント抽出性能が高いことを意味しないことを示しました。結論:私たちは、バイオメディカル分野における品詞タグ付けと従属関係解析に関する伝統的な特徴量ベースモデルとニューラルネットワークベースモデルを比較する詳細な実証的研究を行い、さらに下流タスクであるバイオメディカルイベント抽出におけるパーサ選択の影響も調査しました。データおよび資料の入手可能性:再学習済みモデルは https://github.com/datquocnguyen/BioPosDep で公開されています。

POSタグ付けから依存関係解析へ:バイオメディカルイベント抽出のための手法 | 最新論文 | HyperAI超神経