
要約
エンティティ正規化は、情報抽出における重要なタスクであり、過去10年間で再び注目を集めている。特に生物医療および生命科学分野においては、このタスクは依然として課題を抱えている。より広く特殊分野全般にわたっても、最新の機械学習ベースのアプローチは、高次元多クラス分類および少数サンプル学習(few-shot learning)の問題に対処する際に困難を抱えている。この課題に対応するため、本研究ではC-Normを提案する。これは、標準的な教師あり学習と弱教師あり学習を統合的に組み合わせ、オントロジー知識の統合、および分布意味論(distributional semantics)を融合した新しいニューラルアプローチである。