17일 전

프랑스어로 된 법령 조항 검색 데이터셋

Antoine Louis, Gerasimos Spanakis
프랑스어로 된 법령 조항 검색 데이터셋
초록

법조문 검색은 법적 질문에 관련된 법조문을 자동으로 검색하는 작업이다. 최근 자연어 처리 분야의 발전으로 여러 법적 업무에 대한 관심이 높아졌지만, 대규모이고 고품질의 주석 데이터셋이 부족한 탓에 법조문 검색은 여전히 주로 미개발 상태에 있다. 이 제약을 극복하기 위해 우리는 벨기에 법조문 22,600건 이상을 포함한 문헌집에서 관련 조문을 경험 많은 법조인들이 주석한 프랑스어로 작성된 1,100건 이상의 벨기에 법적 질문을 포함한 ‘벨기에 법조문 검색 데이터셋(BSARD)’을 제안한다. BSARD를 활용해, 키워드 기반 및 밀도 기반 아키텍처를 포함한 여러 최첨단 검색 방법을 제로샷 및 지도 학습 설정에서 평가하였다. 그 결과, 미세조정된 밀도 기반 검색 모델이 다른 시스템보다 훨씬 우수한 성능을 보였다. 최고 성능을 기록한 기준 모델은 R@100에서 74.8%의 정확도를 달성하였으며, 이는 해당 작업의 실현 가능성에 대한 긍정적인 신호를 제시하며, 여전히 개선 여지가 있음을 시사한다. 해당 분야의 특수성과 구체적인 작업 요구사항을 고려할 때, BSARD는 향후 법적 정보 검색 연구에 있어 독특한 도전 과제를 제시한다. 본 데이터셋과 소스 코드는 공개적으로 제공된다.