3달 전

2022년 타당성 및 신규성 예측 공동 과제 개요

{Philipp Cimiano Moritz Plenz Juri Opitz Anette Frank Philipp Heinisch}

초록

이 논문은 2022년 제9회 논증 마이닝 워크숍(ArgMining 2022)의 일환으로 개최된 ‘논증 타당성 및 독창성 예측 공동 과제(Argument Validity and Novelty Prediction Shared Task)’에 대한 개요를 제시한다. 본 과제는 텍스트 형태의 전제(premise)가 주어졌을 때 그에 대한 결론의 타당성(validity)과 독창성(novelty)을 예측하는 것을 목표로 한다. 타당성은 주어진 전제에 비추어 결론이 얼마나 타당하게 지지되는지를 나타내며, 독창성은 결론이 전제에 비해 얼마나 새로운 내용을 포함하고 있는지를 의미한다. 총 6개의 팀이 과제에 참여하여 이진 분류 하위 과제에 대해 총 13개의 시스템 실행을 제출하였고, 상대적 분류 하위 과제에는 2개의 시스템 실행을 제출하였다. 결과는 과제의 도전성과 높은 난이도를 보여주며, 타당성 예측의 경우 최고 F1 점수가 약 75% 수준, 독창성 예측은 약 70% 수준, 타당성과 독창성을 동시에 올바르게 예측한 경우는 45% F1 점수에 달했다. 본 논문에서는 과제의 정의와 사용된 데이터셋을 요약하며, 참가 시스템들이 도출한 결과를 전반적으로 살펴보고, 다양한 기여로부터 도출할 수 있는 통찰을 제시한다.

벤치마크

벤치마크	방법론	지표
valnov-on-valnov-subtask-a	ACCEPT-1	JOINT-F1: 43.13 NOV-F1: 70.00 VAL-F1: 59.20
valnov-on-valnov-subtask-a	Baseline	JOINT-F1: 23.90 NOV-F1: 36.12 VAL-F1: 59.96
valnov-on-valnov-subtask-a	CSS	JOINT-F1: 42.40 NOV-F1: 59.86 VAL-F1: 70.76
valnov-on-valnov-subtask-a	System Average	JOINT-F1: 35.94 NOV-F1: 52.97 VAL-F1: 62.74
valnov-on-valnov-subtask-a	NLP@UIT	JOINT-F1: 25.89 NOV-F1: 43.36 VAL-F1: 61.72
valnov-on-valnov-subtask-a	CLTeamL-3	JOINT-F1: 45.16 NOV-F1: 61.75 VAL-F1: 74.64
valnov-on-valnov-subtask-a	Harshad	JOINT-F1: 17.35 NOV-F1: 39.00 VAL-F1: 56.31
valnov-on-valnov-subtask-b	AXiS@EdUni	JOINT-F1: 29.16 NOV-F1: 25.86 VAL-F1: 32.47
valnov-on-valnov-subtask-b	NLP@UIT	JOINT-F1: 41.50 NOV-F1: 38.39 VAL-F1: 44.60
valnov-on-valnov-subtask-b	Baseline	JOINT-F1: 21.46 NOV-F1: 23.09 VAL-F1: 19.82

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩

즉시 사용 가능한 GPU

최적 가격

시작하기

Hyper Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

2022년 타당성 및 신규성 예측 공동 과제 개요

{Philipp Cimiano Moritz Plenz Juri Opitz Anette Frank Philipp Heinisch}

초록

벤치마크

AI로 AI 구축

Hyper Newsletters