
초록
사용자 대화에서 독성(Toxicity)을 이해하는 것은 분명히 중요한 문제입니다. "은밀한(Covert)" 또는 암시적인 독성 사례를 해결하는 것은 특히 어려우며, 이는 문맥을 필요로 합니다. 그러나 이전 연구 중 대화 문맥이 인간의 인식이나 자동 감지 모델에 미치는 영향을 분석한 연구는 매우 적습니다. 우리는 이러한 두 방향 모두에 대해 더 깊게 탐구하였습니다.우리는 먼저 기존의 문맥 데이터셋을 분석하여, 일반적으로 인간이 독성을 라벨링할 때 대화 구조, 극성(Polarity), 그리고 주제(Topic) 등 문맥 요소들이 영향을 미친다는 결론을 도출하였습니다. 그 다음으로, 이러한 결과를 계산적 감지 모델에 적용하기 위해 (a) 대화 구조를 인식하는 컨텍스트 독성 감지용 신경망 아키텍처와 (b) 컨텍스트 독성 감지를 개선할 수 있는 데이터 증강 전략을 소개하고 평가하였습니다.연구 결과, 대화 구조를 인식하는 신경망 아키텍처의 유망한 잠재력이 확인되었습니다. 또한 이러한 모델들이 특히 소셜 미디어 영역에서 합성 데이터로부터 혜택을 받을 수 있음을 입증하였습니다.