12일 전
FABSA: 사용자 리뷰에 대한 어спект 기반 감성 분석 데이터셋
{Aji Ghose, Hassan Tahir, Patrycja Sliwiak, Thomas Metcalfe, Georgia Harrison, Jordan Clive, Georgios Kontonatsios}
초록
기반별 감성 분석(Aspect-based Sentiment Analysis, ABSA)은 엔티티의 기반을 자동으로 추출하고 각각의 기반에 대한 감성 극성(polarity)을 분류하는 것을 목표로 한다. 현재까지 제공되는 ABSA 시스템의 대부분은 지도 학습 기반의 머신러닝 모델을 훈련시키기 위해 수작업으로 레이블링된 데이터셋에 크게 의존하고 있다. 그러나 이러한 수작업 데이터셋의 개발은 인력과 시간이 많이 소요되는 과정이므로, 기존의 ABSA 데이터셋은 다루는 도메인 수가 매우 제한적이며, 데이터 규모도 작다. 이에 대응하여, 우리는 피드백 리뷰를 대상으로 하는 대규모이고 다중 도메인의 ABSA 데이터셋인 FABSA(Feedback ABSA)를 제안한다. FABSA는 10개의 다양한 도메인을 아우르는 약 10,500개의 리뷰로 구성되어 있다. 우리는 최신의 딥러닝 모델들이 FABSA 데이터셋에 적용되었을 때의 성능을 평가하기 위해 다수의 실험을 수행하였다. 실험 결과, FABSA 데이터셋을 기반으로 훈련된 ABSA 모델은 다양한 도메인 간에 일반화 가능함을 입증하였으며, 더 큰 규모의 훈련 데이터셋을 사용할수록 모델의 성능이 향상됨을 확인하였다. 본 연구에서 제안하는 FABSA 데이터셋은 공개적으로 제공된다.