12일 전
SEDTWik: 위키백과를 이용한 트윗 기반의 분할 기반 이벤트 탐지
{Neti Lalita Bhanu Murthy, Keval Morabia, Surender Samant, Aruna Malapati}

초록
이벤트 탐지는 최근 10년간 텍스트 마이닝 분야에서 주목받아온 연구 주제 중 하나로, 특히 소셜 미디어 데이터, 특히 트위터 데이터의 광범위한 접근성으로 인해 부각되었다. 트위터는 해시태그의 사용과 짧은 글자 제한으로 인해 실제 세계의 사건을 간결하게 전달할 수 있다는 점에서 중요한 정보 원천으로 자리 잡았다. 기존의 트윗에서의 이벤트 탐지 연구는 대부분 지역적 사건이나 긴급 뉴스에 한정되거나, 많은 중요한 사건을 놓치는 문제를 가지고 있었다. 본 논문은 트윗에서의 이벤트 탐지와 관련된 문제점을 제시하고, 이전 연구의 확장된 형태인 SEDTWik이라는 트윗 세그멘테이션 기반의 이벤트 탐지 시스템을 제안한다. 이 시스템은 세계 각지에서 발생하는 다양한 분야의 주목할 만한 사건을 탐지할 수 있다. 주요 아이디어는 각 트윗과 해시태그를 세그먼트로 분할하고, 급증하는 세그먼트를 추출하여 군집화하고 요약하는 것이다. 제안한 방법은 잘 알려진 Events2012 코퍼스를 기반으로 평가되었으며, 최신 기술 수준의 성능을 달성하였다.키워드: 이벤트 탐지, 트위터, 소셜 미디어, 마이크로블로깅, 트윗 세그멘테이션, 텍스트 마이닝, 위키백과, 해시태그