7ヶ月前

自然言語処理

データセット

AIインフラストラクチャ

アプローチ／フレームワーク

自然言語処理

Philipp Cimiano Moritz Plenz Juri Opitz Anette Frank Philipp Heinisch

概要

本稿は、第9回議論マイニングワークショップ（ArgMining 2022）の一環として実施された「議論の妥当性および新規性予測共同タスク」について概観するものである。本タスクは、与えられた本文（前提文）に基づいて、その結論の妥当性および新規性を予測することを目的としている。妥当性とは、前提に対して結論がどの程度正当化されているかを示す指標であり、新規性とは、結論が前提に対してどの程度新しい内容を含んでいるかを示す指標である。本タスクには6つの研究グループが参加し、二値分類サブタスクに対して合計13のシステム実行、相対分類サブタスクに対して2のシステム実行が提出された。結果から、本タスクの難易度が高く、最高の性能は、妥当性予測で75％のF1スコア、新規性予測で70％のF1スコア、両方のタスクを正しく予測する場合で45％のF1スコアであった。本稿では、タスクの定義および使用されたデータセットについて要約する。また、参加システムが得た結果の概要と、多様な貢献から得られる知見についても述べる。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

自然言語処理

データセット

AIインフラストラクチャ

アプローチ／フレームワーク

自然言語処理

Philipp Cimiano Moritz Plenz Juri Opitz Anette Frank Philipp Heinisch

概要

本稿は、第9回議論マイニングワークショップ（ArgMining 2022）の一環として実施された「議論の妥当性および新規性予測共同タスク」について概観するものである。本タスクは、与えられた本文（前提文）に基づいて、その結論の妥当性および新規性を予測することを目的としている。妥当性とは、前提に対して結論がどの程度正当化されているかを示す指標であり、新規性とは、結論が前提に対してどの程度新しい内容を含んでいるかを示す指標である。本タスクには6つの研究グループが参加し、二値分類サブタスクに対して合計13のシステム実行、相対分類サブタスクに対して2のシステム実行が提出された。結果から、本タスクの難易度が高く、最高の性能は、妥当性予測で75％のF1スコア、新規性予測で70％のF1スコア、両方のタスクを正しく予測する場合で45％のF1スコアであった。本稿では、タスクの定義および使用されたデータセットについて要約する。また、参加システムが得た結果の概要と、多様な貢献から得られる知見についても述べる。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています