17일 전
프로젝트 PIAF: 네이티브 프랑스어 질문-응답 데이터셋 구축
Rachel Keraron, Guillaume Lancrenon, Mathilde Bras, Frédéric Allary, Gilles Moyse, Thomas Scialom, Edmundo-Pavel Soriano-Morales, Jacopo Staiano

초록
영어 이외의 언어에 대한 데이터 부족, 특히 질의응답(Question Answering)과 같은 하류 작업 평가를 위한 데이터 부족 문제에 힘입어, 본 연구에서는 프랑스어 원어민을 대상으로 한 질의응답 데이터셋 수집을 위한 공동 참여형 노력( participatory effort )을 제안한다. 또한, 데이터 수집 작업을 위해 개발한 주석(annotation) 도구를 설명하고 공개하며, 수집된 데이터 및 초기 기준 성능(baselines)도 함께 공개한다.