
要約
本研究では、BioCreative VIIチャレンジのDrugProtタスクへの参加について報告します。薬物-標的相互作用(DTIs)は、新薬の発見や再利用において極めて重要であり、しばしば実験論文から手動で抽出されます。PubMedには3200万件以上の生物医学文献が存在し、これほど巨大な知識ベースからDTIsを手動で抽出することは困難です。この問題を解決するために、Track 1向けのソリューションを提供しました。このトラックの目的は、薬物とタンパク質エンティティ間の10種類の相互作用を抽出することです。我々は、最先端の言語モデルであるBioMed-RoBERTaと畳み込みニューラルネットワーク(CNN)を組み合わせたアンサンブル分類器モデルを適用しました。BioCreative VII DrugProtテストコーパスにおけるクラス不均衡にもかかわらず、我々のモデルはチャレンジ内の他の提出平均と比較して良好な性能を示し、マイクロF1スコアは55.67%(BioCreative VI ChemProtテストコーパスでは63%)でした。これらの結果は、深層学習がさまざまなタイプのDTIsを抽出する潜在能力を持っていることを示しています。