16일 전
TIMEN: 오픈 타임스탬프 표현 정규화 자원
{Robert Gaizauskas, Leon Derczynski, Hector Llorens, Estela Saquete}
초록
시제 표현은 시간의 특정 시점, 지속 기간 또는 반복 여부를 설명하는 단어나 구문을 의미한다. 이러한 표현을 자동으로 주석화하는 것은 점점 더 주목받는 연구 목표이다. 이러한 표현을 인식하는 것은 최소한의 감독 학습 기반 기계 학습을 통해 가능하지만, 정확한 해석(정규화)은 인간의 지식이 필요한 복잡한 과정이다. 본 논문에서는 시제 표현 정규화를 위한 커뮤니티 주도형 도구인 TIMEN을 제안한다. TIMEN은 현재 최선의 접근 방식을 기반으로 개발되었으며, 독립형 도구로서 기존 시스템에 쉽게 통합할 수 있다. 우리는 시제 표현 정규화는 대규모 지식 기반과 규칙 세트를 통해만 효과적으로 수행될 수 있다고 주장한다. 우리의 해결책은 다양한 언어에 대해 이러한 지식을 수집할 수 있는 프레임워크 및 시스템이다. 기존 데이터와 새로 주석화된 데이터를 활용하여 경쟁력 있는 성능을 보여주는 결과를 제시하며, 정보 추출(Irregular Extraction, IE) 커뮤니티가 지식 기반을 공유하고 공동으로 발전시켜 시제 표현 정규화 문제를 해결할 수 있도록 초대한다.