
소셜 미디어 플랫폼에서의 공격적 언어 사용과 이에 따른 영향이 현대 사회에서 주요한 문제로 대두되고 있습니다. 매일 엄청난 양의 콘텐츠가 생성됨에 따라, 이러한 유형의 콘텐츠를 감지하고 처리하기 위한 자동화된 방법이 필요하게 되었습니다. 지금까지 대부분의 연구는 영어 문제 해결에 초점을 맞추었지만, 이 문제는 다국어적 성격을 가지고 있습니다.우리는 \textit{Reddit} 및 \textit{Facebook}에서 사용자 생성 댓글을 포함하는 덴마크 데이터셋을 구축하였습니다. 이 데이터셋은 다양한 소셜 미디어 플랫폼에서 생성된 사용자 댓글을 포함하며, 우리 지식으로는 이와 같은 종류의 데이터셋이 처음입니다. 우리의 데이터셋은 공격적 언어의 다양한 유형과 표적을 포착하기 위해 주석이 달려 있습니다. 우리는 영어와 덴마크어 모두에서 작동하도록 설계된 네 가지 자동 분류 시스템을 개발하였습니다. 영어에서의 공격적 언어 감지에서 가장 우수한 시스템은 매크로 평균 F1 점수가 $0.74$를 기록하였으며, 덴마크어에서는 $0.70$를 기록하였습니다. 공격적인 게시물이 표적으로 삼았는지를 감지하는 데 있어서, 영어에서 가장 우수한 시스템은 매크로 평균 F1 점수가 $0.62$를 기록하였고, 덴마크어에서는 $0.73$를 기록하였습니다. 마지막으로, 표적이 된 공격적인 게시물의 표적 유형을 감지하는 데 있어서, 영어에서 가장 우수한 시스템은 매크로 평균 F1 점수가 $0.56$를 기록하였으며, 덴마크어에서는 $0.63$를 기록하였습니다.우리의 연구는 영어와 덴마크어 모두에서 공격적 언어의 유형과 표적을 포착하며, 증오 발언(hate speech) 및 사이버 괴롭힘(cyberbullying) 등 다양한 종류의 공격적 언어를 감지하기 위한 자동화된 방법들을 제시합니다.