13일 전

문서 날짜 매핑을 위한 버스트성 인지 접근법

{Kjetil Nørvåg, Nattiya Kanhabua, Dimitrios Gunopulos, Dimitrios Kotzias, Theodoros Lappas, Dimitrios Kotsakos}
문서 날짜 매핑을 위한 버스트성 인지 접근법
초록

다수의 주류 응용 분야, 예를 들어 시간적 검색(temporal search), 사건 탐지(event detection), 추세 식별(trend identification) 등은 주어진 텍스트 컬렉션 내 모든 문서의 타임스탬프를 알고 있다고 가정한다. 그러나 많은 경우에 필요한 타임스탬프가 제공되지 않거나 모호한 경우가 있다. 이러한 문제의 대표적인 사례는 오래된 디지털화된 문서의 대규모 저장소 상황에서 나타난다. 이러한 문서의 경우, 디지털화 과정 중 타임스탬프가 손상될 수 있으며, 또는 단순히 타임스탬프가 존재하지 않을 수도 있다. 본 논문에서는 문서의 타임스탬프를 근사하는 작업, 즉 문서 날짜 부여(document dating) 문제를 탐구한다. 우리는 콘텐츠 기반의 접근 방식을 제안하며, 최근의 용어 급증성(term burstiness) 분야의 발전을 활용함으로써 기존 문서 날짜 부여 방법의 단점을, 예를 들어 고정된 시간 구간 전략(fixed time partition strategy)의 한계를 극복할 수 있도록 한다. 다양한 데이터셋을 대상으로 광범위한 실험 평가를 수행하여 제안하는 방법론의 효과성과 우수성을 검증하였으며, 기존 최고 수준의 방법들에 비해 본 방법이 문서 날짜 부여 과제에서 더 우수한 성능을 보임을 보여주었다.

문서 날짜 매핑을 위한 버스트성 인지 접근법 | 최신 연구 논문 | HyperAI초신경