12일 전
ICDAR 2024 고대 문헌의 소수 샘플 및 다수 샘플 레이아웃 세그멘테이션 경진대회 (SAM)
{Claudio Piciarelli, Emanuela Colombi, Gian Luca Foresti, Axel De Nardin, Silvia Zottin}
초록
레이아웃 분석은 고대 문헌과 같은 문서 이미지 분석 분야에서 매우 중요한 요소이다. 이는 광학 문자 인식(OCR) 및 자동 전사와 같은 후속 작업을 효율적으로 수행하기 위한 기초 단계로 작용한다. 그러나 이 분야에서 직면하는 주요 과제 중 하나는 지도 학습에 필요한 정답 데이터(ground truth)의 부족이다. 이러한 정답 데이터는 생성이 매우 시간이 오래 걸리기 때문에 흔히 가용하지 않으며, 이로 인해 많은 연구 접근법이 전면적인 지도 학습(paradigm)에 크게 의존하고 있다. 그러나 현실 세계에서는 이러한 완전한 지도 학습 환경은 드물다. 이러한 이유로 본 대회에서는 소수의 예시(피처)만을 사용하여 학습하는 소수 학습(few-shot learning) 접근법을 활용하여 이 과제를 해결하는 것을 제안한다. 즉, 학습에 단지 세 장의 이미지만을 사용하는 방식이다. 본 대회에서 제공하는 데이터셋인 U-DIADS-Bib는 네 가지 서로 다른 고대 문헌으로 구성되어 있으며, 레이아웃 구조의 이질성, 손상 정도의 다양성, 사용된 언어의 차이 등 다양한 특징을 지닌다. 이러한 다양성은 대회 과제에 흥미로운 복잡성을 더한다. 또한, 전통적인 다수 학습(many-shot learning) 접근법을 활용한 참가도 허용되며, 이 경우 U-DIADS-Bib의 전체 학습 데이터셋이 공개된다.