11일 전

질문 응답 웹사이트의 질문에 대한 주관적 특성을 BERT를 사용하여 예측하기

Issa Annamoradnejad, Mohammadamin Fazli, Jafar Habibi
질문 응답 웹사이트의 질문에 대한 주관적 특성을 BERT를 사용하여 예측하기
초록

질문-답변(Q&A) 커뮤니티 웹사이트, 예를 들어 StackOverflow와 Quora는 콘텐츠의 품질을 유지하기 위해 사용자들이 특정 가이드라인을 준수하도록 기대하고 있다. 이러한 시스템은 주로 커뮤니티 사용자들의 신고를 통해 콘텐츠를 평가하지만, 이 방식에는 위반 사항 처리의 지연, 정상적이고 경험 많은 사용자들의 시간 낭비, 일부 신고의 낮은 품질, 그리고 신규 사용자에게는 회피적인 피드백을 유도하는 등의 심각한 문제들이 존재한다. 따라서 Q&A 웹사이트에서 모더레이션 작업을 자동화하는 데 총괄적인 목표를 두고, 본 연구는 Q&A 사이트 내 질문의 20개의 품질 또는 주관적 측면을 예측할 수 있는 모델을 제안한다. 이를 위해 우리는 2019년 구글 리서치의 CrowdSource 팀이 수집한 데이터와 문제에 맞게 미세 조정(fine-tuned)된 사전 훈련된 BERT 모델을 사용하였다. 평가 기준으로 평균 제곱 오차(Mean-Squared Error, MSE)를 사용한 결과, 모델은 2 에포크 훈련 후 0.046의 값을 기록하였으며, 이후 에포크에서는 큰 개선이 관측되지 않았다. 실험 결과는 간단한 미세 조정만으로도 짧은 시간 내에 적은 양의 데이터로도 정확한 모델을 구축할 수 있음을 확인해주고 있다.

질문 응답 웹사이트의 질문에 대한 주관적 특성을 BERT를 사용하여 예측하기 | 최신 연구 논문 | HyperAI초신경