2달 전

독일 온라인 신문 댓글에서 성차별을 감지하는 방법: 오픈 소스 텍스트 임베딩을 활용한 연구 (팀 GDA, GermEval2024 공유 작업 1: GerMS-Detect, 하위 작업 1 및 2, 폐쇄 트랙)

Florian Bremm; Patrick Gustav Blaneck; Tobias Bornheim; Niklas Grieger; Stephan Bialonski
독일 온라인 신문 댓글에서 성차별을 감지하는 방법: 오픈 소스 텍스트 임베딩을 활용한 연구 (팀 GDA, GermEval2024 공유 작업 1: GerMS-Detect, 하위 작업 1 및 2, 폐쇄 트랙)
초록

온라인 미디어 댓글에서의 성차별은 종종 은밀하게 나타나는 보편적인 문제로, 성차별을 구성하는 요소에 대한 해석이 개인마다 다르기 때문에 관리가 복잡해집니다. 우리는 단일 언어 및 다중 언어 오픈 소스 텍스트 임베딩을 활용하여 오스트리아 신문의 독일어 온라인 댓글에서 성차별과 여성혐오를 안정적으로 감지하는 방법을 연구하였습니다. 텍스트 임베딩으로 학습된 분류기가 인간 주석자의 개별 판단을 매우 유사하게 모방함을 확인할 수 있었습니다. 우리의 방법은 GermEval 2024 GerMS-Detect 서브태스크 1 도전에서 평균 매크로 F1 점수 0.597(코다벤치에서 보고된 4위)를 달성하며 견고한 성능을 보였습니다. 또한 GerMS-Detect 서브태스크 2에서는 인간 주석자의 분포를 정확히 예측하여 평균 Jensen-Shannon 거리 0.301(2위)를 기록하였습니다. 우리 접근 방식의 계산 효율성이 다양한 언어와 언어적 맥락에서 확장 가능한 응용 프로그램의 가능성을 시사합니다.

독일 온라인 신문 댓글에서 성차별을 감지하는 방법: 오픈 소스 텍스트 임베딩을 활용한 연구 (팀 GDA, GermEval2024 공유 작업 1: GerMS-Detect, 하위 작업 1 및 2, 폐쇄 트랙) | 최신 연구 논문 | HyperAI초신경