
要約
生体医科学的イベント抽出は、科学文書コーパスに記述された生体分子相互作用を理解する上で極めて重要である。主な課題の一つとして、非指示的トリガー語と関連するネスト構造を持つイベントを特定することが挙げられる。本研究では、事前学習済み言語モデルに統合医療用語体系(UMLS)からのドメイン知識を、グラフエッジ条件付きアテンションネットワーク(GEANet)および階層的グラフ表現を用いて統合することを提案する。トリガー語のより良い認識を実現するため、まず各文をUMLSからの共同でモデリングされた階層的知識グラフに基づいて文グラフに接地する。その後、これらの接地グラフは、複雑なイベントの推論能力を強化するための新規グラフニューラルネットワークであるGEANetによって伝搬される。BioNLP 2011 GENIAイベント抽出タスクにおける実験結果から、本手法は全イベントおよび複雑イベントにおいて、それぞれ1.41%および3.19%のF1スコア向上を達成した。アブレーションスタディにより、GEANetおよび階層的知識グラフの重要性が確認された。