16日前
医療分野における新しいスキーマおよび遠隔監督を用いたNER
{Kamalakar Karlapalem, Veera Raghavendra Chikka, Alok Kar, Anshita Khandelwal}

要約
バイオメディカル名前付きエンティティ認識(BMNER)は、バイオメディカルテキストマイニング分野における最も重要なタスクの一つである。これまでの研究では、実際のバイオメディカルデータセットに顕著に存在する非連続的かつ重複するエンティティの同定に焦点を当てたものはほとんどなかった。本論文では、複雑なエンティティを捉えるための新たなアノテーションスキーマを提案し、遠隔教師付き学習(distant supervision)が深層学習に基づくシーケンスラベリングモデルに与える影響を検討する。BMNERタスクにおいて、我々のアノテーションスキーマは、同様のモデルを用いた他のBIOベースのアノテーションスキーマを上回る性能を示した。また、埋め込み表現のファインチューニングを施さずに複数のコーパスにおいて最先端モデルを上回るF1スコアを達成したことで、本モデルによるニューラル特徴抽出の有効性が明らかになった。