2달 전
희망 발언 감지 연구: 자원 부족 캐나다어의 경우
Adeep Hande; Ruba Priyadharshini; Anbukkarasi Sampath; Kingston Pal Thamburaj; Prabakaran Chandran; Bharathi Raja Chakravarthi

초록
최근 몇 년 동안 사회 미디어 플랫폼에서 저속하고 공격적인 댓글을 제거하여 부정적 정보의 확산을 모니터링하기 위한 다양한 방법이 개발되었습니다. 그러나 온라인 포럼에서 긍정성을 증진시키고 지지적이며 위로하는 내용을 강화하는 연구는 상대적으로 적습니다. 따라서 본 연구에서는 영어-칸나다어 희망 발언 데이터셋인 KanHope를 생성하고, 이 데이터셋의 벤치마킹을 위해 여러 실험을 비교하는 것을 제안합니다. KanHope 데이터셋은 유튜브에서 수집한 6,176개의 사용자 생성 코드 믹스드(Codemixed) 칸나다어 댓글로 구성되어 있으며, 수작업으로 희망 발언 또는 비희망 발언으로 주석이 달려 있습니다. 또한, 우리는 KanHope의 영어 번역을 추가 학습에 활용하여 희망 발언 검출을 촉진하는 듀얼 채널 모델인 DC-BERT4HOPE를 소개합니다. 이 접근 방식은 가중 F1 점수 0.756를 달성하여 다른 모델들보다 우수한 성능을 보입니다. 따라서 KanHope는 칸나다어 관련 연구를 촉진하며, 널리 연구자들에게 긍정적이고 지지적인 온라인 콘텐츠에 대한 실용적인 접근 방식을 취하도록 권장합니다.