HyperAIHyperAI

Command Palette

Search for a command to run...

TACO -- Twitterの会話から抽出された議論

Marc Feger Stefan Dietze

概要

Twitterは、オンラインでの会話に参加するための世界的なハブとして、またそのユーザー生成コンテンツの重要性を認識したさまざまな学問分野の研究コーパスとして台頭しています。議論マイニングは、オンラインディスコースの処理と理解において重要な分析タスクです。特に、情報と推論(inference)を表す議論の構造的要素を特定することを目指しています。これらの要素は静的なものではなく、会話内の文脈を必要とする場合がありますが、Twitterにおけるこの動的側面に対応するデータやアノテーションフレームワークが不足しています。我々はTACOというデータセットを提供します。これは、6人の専門家による0.718のKrippendorff's alphaの合意度で、6つの異なるトピックにわたる200件の完全な会話をカバーする1,814件のツイートから構成される最初のTwitter議論データセットです。さらに、Cambridge Dictionaryからの定義を組み込んだアノテーションフレームワークも提供します。これにより、Twitter上の議論の構成要素を定義し識別することができます。我々のトランスフォーマーベースの分類器は、議論検出において85.06%のマクロF1基準スコアを達成しました。また、データからはTwitterユーザーが情報に基づいた推論と情報を含むディスカッションに積極的に参加している傾向があることが明らかになりました。TACOは複数の目的に役立ちます。例えば、ツイート分類器を訓練して推論と情報要素に基づいてツイートを管理したり、ツイートの返信パターンに関する貴重な洞察を得たりすることが可能です。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています