12일 전
SemEval-2022 Task 4에서 DH-FBK: 관여자 간 불일치 및 다중 데이터 시각화를 활용한 공손한 언어 탐지
{Elisa Leonardelli, Alan Ramponi}

초록
대중 매체에서 흔히 무의식적으로 사용되는 경시적이고 비하하는 언어(PCL, Patronizing and Condescending Language)는 흔히 고정관념을 부추기고 권력-지식 관계를 강화하여 취약 계층에 대한 차별을 지속시킨다. 이 PCL은 주관적이고 미묘한 특성을 지니고 있어, 계산적 방법과 인간 평가자 모두에게 여전히 열려 있고 도전적인 문제로 남아 있다. 본 논문에서는 SemEval-2022 Task 4에 제출한 DH-FBK 팀의 시스템을 소개하며, 영어 매체 텍스트 내에서 취약 계층을 대상으로 한 PCL 탐지를 목표로 한다. 인간 해석의 주관성에 착안하여, 다중 작업 및 다중 관점 학습 프레임워크에서 평가자들의 불확실성과 이견을 활용하여 PCL의 미묘한 양상을 더 잘 포착하는 접근법을 제안한다. 제안한 방법은 경쟁적인 성능을 달성하였으며, PCL 식별 및 분류 모두에서 벤치마크를 크게 능가하고 리더보드의 상좌측에 위치하는 성과를 기록하였다. 특히, 본 방법은 외부 데이터나 모델 앙상블에 의존하지 않아 실용적이고 매력적인 솔루션으로서 실제 적용 가능성을 갖추고 있다.