18日前

ドキュメントレベル関係抽出のための適応型ヘンジバランス損失

{Cailian Chen, Xiaodi Peng, Xinyi Le, Jize Wang}
ドキュメントレベル関係抽出のための適応型ヘンジバランス損失
要約

ドキュメントレベル関係抽出(Document-Level Relation Extraction)は、複数文にわたる文書からエンティティ間の関係を予測することを目的としている。一般的な手法として、エンティティペア間の関係が存在するかどうかを判断するために、多ラベル分類の閾値を設定する方法が用いられる。しかし、ドキュメントレベルのタスクでは、大多数のエンティティペアは関係を示さないため、正例(positive)と負例(negative)のクラス間で著しい不均衡が生じる。本研究では、この不均衡問題が閾値選定に悪影響を及ぼし、誤った「関係なし」の予測を引き起こす可能性があると指摘する。そこで本論文では、各関係の予測スコアと分類閾値との距離を用いて、容易な負例(easy negatives)を低重み化する新たなアプローチを提案する。本研究で提案する新しい「適応的ヒンジバランス損失(Adaptive Hinge Balance Loss)」は、この距離を用いて各関係クラスの難易度を測定し、誤分類されがちな難易度の高い関係、特に少数派の正例関係に重点を置く。Re-DocREDデータセットを用いた実験結果から、他のバランス化手法に比べて本手法の優位性が確認された。ソースコードは以下のGitHubページで公開されている:https://github.com/Jize-W/HingeABL。