DIVA-DAF: Ein tiefes Lernframework für die Analyse historischer Dokumentbilder

Tiefenlernmethoden haben sich bei der Lösung von Aufgaben der Analyse historischer Dokumentbilder als äußerst leistungsfähig erwiesen. Dennoch ist das Programmieren eines Experiments oder einer Reihe von Experimenten sowie deren Ausführung trotz bestehender Bibliotheken und Frameworks oft zeitaufwendig. Aus diesem Grund stellen wir ein quelloffenes Deep-Learning-Framework namens DIVA-DAF vor, das auf PyTorch Lightning basiert und speziell für die Analyse historischer Dokumente entwickelt wurde. Vorimplementierte Aufgaben wie Segmentierung und Klassifikation können einfach verwendet oder angepasst werden. Auch die Erstellung eigener Aufgaben gestaltet sich nahezu problemlos dank leistungsstarker Module zur Datenladung, auch großer Datensätze, sowie zur Handhabung unterschiedlicher Arten von Ground-Truth-Daten. Die durchgeführten Anwendungen haben gezeigt, dass sich die Programmierzeit für Dokumentenanalyseaufgaben sowie für verschiedene Szenarien wie Pre-Training oder Architekturänderungen erheblich verkürzt. Durch das integrierte Datamodul ermöglicht das Framework zudem eine signifikante Reduktion der Trainingszeit von Modellen.