2달 전

대화에서 맥락적 유해성 검출 재검토

Atijit Anuchitanukul; Julia Ive; Lucia Specia
대화에서 맥락적 유해성 검출 재검토
초록

사용자 대화에서 독성(Toxicity)을 이해하는 것은 분명히 중요한 문제입니다. "은밀한(Covert)" 또는 암시적인 독성 사례를 해결하는 것은 특히 어려우며, 이는 문맥을 필요로 합니다. 그러나 이전 연구 중 대화 문맥이 인간의 인식이나 자동 감지 모델에 미치는 영향을 분석한 연구는 매우 적습니다. 우리는 이러한 두 방향 모두에 대해 더 깊게 탐구하였습니다.우리는 먼저 기존의 문맥 데이터셋을 분석하여, 일반적으로 인간이 독성을 라벨링할 때 대화 구조, 극성(Polarity), 그리고 주제(Topic) 등 문맥 요소들이 영향을 미친다는 결론을 도출하였습니다. 그 다음으로, 이러한 결과를 계산적 감지 모델에 적용하기 위해 (a) 대화 구조를 인식하는 컨텍스트 독성 감지용 신경망 아키텍처와 (b) 컨텍스트 독성 감지를 개선할 수 있는 데이터 증강 전략을 소개하고 평가하였습니다.연구 결과, 대화 구조를 인식하는 신경망 아키텍처의 유망한 잠재력이 확인되었습니다. 또한 이러한 모델들이 특히 소셜 미디어 영역에서 합성 데이터로부터 혜택을 받을 수 있음을 입증하였습니다.

대화에서 맥락적 유해성 검출 재검토 | 최신 연구 논문 | HyperAI초신경