2달 전
YASO: 개방형 리뷰를 위한 대상 감성 분석 평가 데이터셋
Matan Orbach; Orith Toledo-Ronen; Artem Spector; Ranit Aharonov; Yoav Katz; Noam Slonim

초록
현재 다중 도메인 환경에서의 TSA 평가는 기존 데이터셋에 포함된 제한적인 리뷰 도메인 집합에 국한되어 있습니다. 이러한 평가는 한정적이며, 아마존이나 예플과 같은 다양한 도메인의 리뷰를 제공하는 사이트에서의 실제 성능을 반영하지 못할 가능성이 있습니다. 이 문제를 해결하기 위해, 우리는 YASO - 새로운 오픈 도메인 사용자 리뷰 평가 데이터셋을 소개합니다. YASO는 수십 개의 리뷰 도메인에서 추출된 2,215개의 영어 문장으로 구성되며, 대상 용어와 그 감정을 주석으로 달아놓았습니다. 우리의 분석은 이러한 주석의 신뢰성을 확인하고, 수집된 데이터의 특성을 탐구합니다. 현대적인 5개의 TSA 시스템을 사용한 벤치마크 결과는 이 어려운 새로운 데이터셋에서 여전히 향상 여지가 많음을 보여줍니다. YASO는 https://github.com/IBM/yaso-tsa에서 이용 가능합니다.