2ヶ月前

TACO -- Twitterの会話から抽出された議論

Marc Feger; Stefan Dietze
TACO -- Twitterの会話から抽出された議論
要約

Twitterは、オンラインでの会話に参加するための世界的なハブとして、またそのユーザー生成コンテンツの重要性を認識したさまざまな学問分野の研究コーパスとして台頭しています。議論マイニングは、オンラインディスコースの処理と理解において重要な分析タスクです。特に、情報と推論(inference)を表す議論の構造的要素を特定することを目指しています。これらの要素は静的なものではなく、会話内の文脈を必要とする場合がありますが、Twitterにおけるこの動的側面に対応するデータやアノテーションフレームワークが不足しています。我々はTACOというデータセットを提供します。これは、6人の専門家による0.718のKrippendorff's alphaの合意度で、6つの異なるトピックにわたる200件の完全な会話をカバーする1,814件のツイートから構成される最初のTwitter議論データセットです。さらに、Cambridge Dictionaryからの定義を組み込んだアノテーションフレームワークも提供します。これにより、Twitter上の議論の構成要素を定義し識別することができます。我々のトランスフォーマーベースの分類器は、議論検出において85.06%のマクロF1基準スコアを達成しました。また、データからはTwitterユーザーが情報に基づいた推論と情報を含むディスカッションに積極的に参加している傾向があることが明らかになりました。TACOは複数の目的に役立ちます。例えば、ツイート分類器を訓練して推論と情報要素に基づいてツイートを管理したり、ツイートの返信パターンに関する貴重な洞察を得たりすることが可能です。

TACO -- Twitterの会話から抽出された議論 | 最新論文 | HyperAI超神経