
要約
同一概念は、科学的報告書や学術論文においてしばしば異なる表現形式で現れる。エンティティ正規化(またはエンティティリンク)とは、これらの異なる表現形式を標準的な概念に一致させるタスクである。本論文では、自由テキスト中の微生物学関連エンティティを標準語彙に正規化するための2段階アンサンブルCNN手法を提案する。この手法は、訓練に利用可能な微生物学関連バイオメディカルコーパスが限られている場合でもエンティティを適切にリンク可能であり、BioNLP-OST19共同タスクBacteria Biotopeのオンラインテストにおいて、妥当な性能を達成した。