12日前

SEDTWik:Wikipediaを用いたツイートからのセグメンテーションベースのイベント検出

{Neti Lalita Bhanu Murthy, Keval Morabia, Surender Samant, Aruna Malapati}
SEDTWik:Wikipediaを用いたツイートからのセグメンテーションベースのイベント検出
要約

イベント検出は、近年、特にソーシャルメディア、特にTwitterデータの広範な利用が進んだことにより、テキストマイニング分野で注目を集めてきた研究分野の一つである。Twitterはハッシュタグの使用や短い文字制限という特徴から、現実世界の出来事に関する情報を効果的に伝える主要な情報源としての役割を果たしている。これまでのツイートからのイベント検出に関する研究は、いずれも局所的なイベントや緊急ニュースに限定して適用可能であるか、あるいは多くの重要なイベントを漏れてしまうという課題を抱えていた。本稿では、ツイートからのイベント検出における課題を提示し、前人の研究を拡張したツイートセグメンテーションに基づくイベント検出システム「SEDTWik」を提案する。このシステムは、世界中のさまざまな地域で発生する多様なカテゴリに属する報道価値のあるイベントを検出することが可能である。本手法の核心は、各ツイートおよびハッシュタグをセグメントに分割し、急増するセグメントを抽出・クラスタリングし、その後要約を行うことにある。本研究では、広く知られた「Events2012コーパス」を用いて評価を行い、最先端の性能を達成した。キーワード:イベント検出、Twitter、ソーシャルメディア、マイクロブログ、ツイートセグメンテーション、テキストマイニング、Wikipedia、ハッシュタグ

SEDTWik:Wikipediaを用いたツイートからのセグメンテーションベースのイベント検出 | 最新論文 | HyperAI超神経