2ヶ月前
研究論文から科学的概念をドメインに依存せずに抽出する
Arthur Brack; Jennifer D'Souza; Anett Hoppe; Sören Auer; Ralph Ewerth

要約
我々は学術論文の要約からドメインに依存しない科学的概念を抽出する新しい課題を検討し、二つの貢献を示します。第一に、体系的なアノテーションプロセスで特定された一連の一般的な科学的概念を提案します。これらの概念は、科学、技術、医学の10分野の専門家との共同作業により、フレーズレベルで科学的要約のコーパスをアノテートするために利用されました。得られたデータセットは、(a) この課題における基準性能を提供し、(b) 分野間での概念の転送可能性を検討するための一連のベンチマーク実験に使用されました。第二に、二つの深層学習システムを基準として提示します。特に、異なる分野に対処するためにアクティブラーニングを提案しています。実験結果は以下のことを示しています。(1) 非専門家が分野専門家と相談することで相当程度の合意が達成可能である、(2) 基準システムは比較的高いF1スコアを達成している、(3) アクティブラーニングにより必要な訓練データ量をほぼ半分にすることができます。