
要約
少数ショット命名エンティティ認識(NER)タスクにおいて、近年いくつかの二段階型プロトタイプネットワークが成功を収めているが、スパン検出段階での過剰検出(誤検出)や、タイプ分類段階における不正確かつ不安定なプロトタイプの問題は依然として課題となっている。本論文では、これらの課題を解決するため、新しいタイプ認識型分解フレームワークTadNERを提案する。まず、タイプ名から意味的に離れているスパンを除去することで、誤検出スパンを効果的にフィルタリングするタイプ認識型スパンフィルタリング戦略を提示する。次に、サポートサンプルとタイプ名を併用して参照として活用することで、より正確かつ安定したプロトタイプを構築するタイプ認識型対照学習戦略を提案する。複数のベンチマークにおける広範な実験により、本研究で提案するTadNERフレームワークが新たなSOTA(最先端)性能を達成することが実証された。本研究のコードおよびデータは、https://github.com/NLPWM-WHU/TadNER にて公開される予定である。