動機:バイオメディカル研究において、化学物質は重要なエンティティの一つであり、化学物質名エンティティ認識(Chemical Named Entity Recognition, NER)はバイオメディカル情報抽出分野における重要なタスクである。しかし、現在一般的に用いられている化学物質NER手法の多くは従来の機械学習に基づいており、特徴工学(feature engineering)に強く依存している。さらに、これらの手法は文単位での処理に限られており、同じトークンが文書内で複数回出現する場合にタグ付けの一貫性が保てないという問題がある。結果:本論文では、文書レベルの化学物質NERを実現するため、注意機構(attention mechanism)を用いた双方向長短期記憶ネットワークと条件付き確率場(Conditional Random Field, CRF)層を組み合わせたニューラルネットワークアプローチ、すなわちAtt-BiLSTM-CRFを提案する。このアプローチは、注意機構により得られる文書レベルのグローバル情報を活用し、同一トークンが文書内で複数回出現する場合にもタグ付けの一貫性を強制する。この手法は、他の最先端手法と比較して極めて少ない特徴工学で優れた性能を達成し、BioCreative IV化学化合物および薬剤名認識(CHEMDNER)コーパスおよびBioCreative V化学物質-疾患関係(CDR)タスクコーパスにおいて、それぞれFスコア91.14%および92.57%を達成した。利用可能性と実装:データおよびコードは、https://github.com/lingluodlut/Att-ChemdNER にて公開されている。連絡先:[email protected] または [email protected]。補足情報:補足データはBioinformaticsオンライン版にて公開されている。