2달 전
IAM: 통합된 논거 채굴 작업을 위한 포괄적이고 대규모 데이터셋
Liying Cheng; Lidong Bing; Ruidan He; Qian Yu; Yan Zhang; Luo Si

초록
전통적으로 토론은 많은 기사들을 읽고 주장(claims)을 선택하며, 그 주장의 입장(stances)을 식별하고 증거(evidence)를 찾는 등의 수작업 준비 과정이 필요했습니다. 최근 AI 토론에 대한 관심이 높아짐에 따라, 이러한 번거로운 과정을 자동화할 수 있는 방법을 탐구하는 것이 가치가 있습니다. 본 연구에서는 주장 추출, 입장 분류, 증거 추출 등 일련의 주장 채굴 작업에 적용될 수 있는 포괄적이고 대규모 데이터셋인 IAM(Integrated Argument Mining)을 소개합니다. 이 데이터셋은 123개 주제와 관련된 1,000여 개의 기사에서 수집되었습니다. 데이터셋 내 약 70,000개 문장은 주장 특성(예: 주장, 입장, 증거 등)에 따라 완전히 주석이 달려 있습니다. 또한 우리는 토론 준비 과정과 관련된 두 가지 새로운 통합된 주장 채굴 작업을 제안합니다: (1) 주장 추출 및 입장 분류(CESC: Claim Extraction with Stance Classification)와 (2) 주장-증거 쌍 추출(CEPE: Claim-Evidence Pair Extraction). 각 통합 작업에 대해 파이프라인 접근 방식과 엔드투엔드 방법을 채택하였습니다. 실험 결과는 우리의 제안한 작업들의 가치와 도전 과제를 보여주며, 앞으로의 주장 채굴 연구를 유도합니다.