17일 전
DIVA-DAF: 역사적 문서 이미지 분석을 위한 딥러닝 프레임워크
Lars Vögtlin, Anna Scius-Bertrand, Paul Maergner, Andreas Fischer, Rolf Ingold

초록
딥러닝 기법은 역사적 문서 이미지 분석 작업에서 뛰어난 성능을 보여주고 있다. 그러나 현재 존재하는 라이브러리와 프레임워크에도 불구하고, 실험 또는 실험 세트를 프로그래밍하고 실행하는 과정은 여전히 시간이 많이 소요된다. 이를 해결하기 위해 우리는 PyTorch Lightning 기반의 오픈소스 딥러닝 프레임워크 DIVA-DAF를 제안한다. 이 프레임워크는 역사적 문서 분석에 특화되어 있으며, 이미 구현된 작업들(예: 세그멘테이션, 분류)을 간편하게 사용하거나 사용자 정의할 수 있다. 또한 데이터 로딩 모듈과 다양한 형태의 정답 레이블(ground truth)을 처리할 수 있는 강력한 모듈을 제공함으로써, 사용자가 자신만의 작업을 쉽게 구현할 수 있다. 실제 적용 사례를 통해, 문서 분석 작업의 프로그래밍 시간을 크게 단축할 수 있었으며, 사전 학습 또는 아키텍처 변경과 같은 다양한 시나리오에서도 효율성을 입증하였다. 특히 데이터 모듈의 도입으로 인해 모델 학습 시간도 크게 단축될 수 있다.