Perte d'équilibre à charnière adaptative pour l'extraction de relations à l'échelle du document

L'extraction de relations à l'échelle du document vise à prédire les relations entre des entités à partir de plusieurs phrases. Une pratique courante consiste à sélectionner des seuils pour la classification multi-étiquettes afin de déterminer si une relation existe entre une paire d'entités. Toutefois, dans le cadre de cette tâche à l'échelle du document, la majorité des paires d'entités ne manifestent aucune relation, ce qui entraîne une distribution fortement déséquilibrée entre les classes positives et négatives. Nous soutenons que ce déséquilibre affecte la sélection des seuils et peut conduire à des prédictions erronées de « pas de relation ». Dans cet article, nous proposons de réduire le poids des négatifs faciles en exploitant la distance entre le seuil de classification et le score prédit pour chaque relation. Notre nouvelle fonction de perte, Adaptive Hinge Balance Loss (ABL), évalue la difficulté de chaque classe de relation à l’aide de cette distance, accordant ainsi une attention accrue aux relations difficiles et mal classées, c’est-à-dire les relations positives rares. Les résultats expérimentaux sur le jeu de données Re-DocRED démontrent l’efficacité de notre approche par rapport aux autres méthodes d’équilibrage. Le code source est disponible à l’adresse suivante : https://github.com/Jize-W/HingeABL.