
초록
온라인 미소지니(남성우월주의), 즉 온라인에서 나타나는 여성에 대한 폭력적 언어는 심각하고 해로운 사회적 결과를 초래한다. 이러한 언어를 자동으로 탐지하는 것은 필수적이지만, 데이터 수집, 데이터 주석화, 편향 완화 측면에서 복잡한 도전 과제를 안고 있다. 이는 해당 유형의 데이터가 언어적으로 복잡하고 다양하기 때문이다. 본 논문은 이 분야에서 세 가지 주요 기여를 한다. 첫째, 반복적인 주석화 과정과 코드북의 구체적인 설계를 설명한다. 둘째, 자연어로 표현된 미소지니를 주석화하기 위한 포괄적인 레이블 체계(분류 체계)를 제시한다. 셋째, 소셜미디어 게시물에서 샘플링한 고품질 주석화된 게시물 데이터셋을 소개한다.