17日前

スケールに応じた正確な臨床および生物医学固有表現認識

{David, Veysel; Talby, Kocaman}
要約

本稿では、Apache Spark上に構築された改良型BiLSTM-CNN-Char深層学習(DL)アーキテクチャに基づく、柔軟かつ本格的な臨床および生物医学分野向け名前付きエンティティ認識(NER)アルゴリズムを紹介する。当該NER実装は、既知の8つの生物医学NERベンチマークのうち7つおよび3つの臨床概念抽出課題において、新たな最先端の精度を達成した。具体的には、2010年i2b2/VA臨床概念抽出、2014年n2c2匿名化処理(de-identification)、2018年n2c2薬剤抽出の各課題で優れた性能を示した。さらに、本実装を用いて訓練された臨床NERモデルは、メモリ集約的な言語モデルを用いない状態で、商用エンティティ抽出ソリューションであるAWS Medical ComprehendおよびGoogle Cloud Healthcare APIの精度をそれぞれ8.9%および6.7%上回った。

スケールに応じた正確な臨床および生物医学固有表現認識 | 最新論文 | HyperAI超神経