17일 전
다양한 인스턴스 생성과 국소 임계값을 통한 소수 샘플 기반 픽셀 정밀 문서 레이아웃 세그멘테이션
{Gian Luca Foresti, Emanuela Colombi, Claudio Piciarelli, Silvia Zottin, Axel De Nardin}
초록
지난 수년간 인문학 분야는 문화유산 연구를 지원할 수 있는 인공지능 프레임워크 구축을 점점 더 요청해왔다. 문서 페이지의 다양한 구조적 구성 요소를 식별하는 것을 목표로 하는 문서 레이아웃 세그멘테이션은 특히 수기 문서에 관해 이와 같은 추세와 밀접하게 관련된 특히 흥미로운 과제이다. 이 문제에 대해 효과적인 접근법은 여러 가지 존재하지만, 모두 기반 모델의 학습을 위해 대량의 데이터를 필요로 한다. 그러나 현실 세계에서는 이러한 데이터 확보가 거의 불가능하다. 왜냐하면 픽셀 단위의 정밀도를 요구하는 지상 진실(ground truth) 세그멘테이션 태스크를 생성하는 과정은 매우 시간이 오래 걸리며, 종종 대상 문서에 대한 특정한 도메인 지식이 필요하기 때문이다. 이에 따라 본 논문에서는 동적 인스턴스 생성과 세그멘테이션 정밀화 모듈이라는 두 가지 새로운 구성 요소를 기반으로 한 효과적인 소수 학습(few-shot learning) 프레임워크를 제안한다. 이 방법은 기존 최고 수준의 성능과 비교 가능한 결과를 인기 있는 Diva-HisDB 데이터셋에서 달성할 수 있으며, 사용 가능한 데이터의 일부만으로도 가능하다.