2달 전
ImageNet 사전 학습을 활용한 역사적 문서 이미지 분석에 대한 종합 연구
Linda Studer; Michele Alberti; Vinaychandran Pondenkandath; Pinar Goktepe; Thomas Kolonko; Andreas Fischer; Marcus Liwicki; Rolf Ingold

초록
스캔된 역사적 문서의 자동 분석은 이미지 분석 작업의 광범위한 범위를 포함하며, 이는 종종 학습 샘플이 부족하여 기계 학습에 어려움을 초래합니다. 딥 뉴럴 네트워크의 등장으로 인해, 훈련 데이터 부족 문제를 해결하기 위한 유망한 방법 중 하나는 다른 도메인의 이미지를 사용하여 모델을 사전 훈련시키고 그 다음에 역사적 문서에서 미세 조정하는 것입니다. 현재 연구에서는 이러한 크로스-도메인 전이 학습의 대표적인 예로, ImageNet 데이터베이스에서 객체 인식을 위해 사전 훈련된 신경망의 사용이 있습니다. 그러나 이 사전 훈련이 ImageNet과 근본적으로 다른 이미지 속성을 가진 역사적 문서 분석에 도움이 되는지는 아직 대부분 열린 질문입니다. 본 논문에서는 문자 인식, 스타일 분류, 원고 연대 측정, 의미 세분화, 및 콘텐츠 기반 검색을 포함하는 다양한 역사적 문서 분석 작업에 대한 ImageNet 사전 훈련의 영향에 대해 포괄적인 실증 조사를 제시합니다. 픽셀 수준의 의미 세분화에서는 혼합된 결과를 얻었지만, 다양한 네트워크 구조에서 ImageNet 사전 훈련이 분류 및 콘텐츠 기반 검색에 긍정적인 영향을 미친다는 명확한 경향을 관찰하였습니다.