DIVA-DAF : Un cadre d'apprentissage profond pour l'analyse d'images de documents historiques

Les méthodes d’apprentissage profond ont démontré une performance remarquable dans la résolution de tâches d’analyse d’images de documents historiques. Toutefois, malgré la disponibilité actuelle de bibliothèques et de frameworks, la programmation d’une expérience ou d’un ensemble d’expériences, ainsi que leur exécution, peut s’avérer longue et fastidieuse. C’est pourquoi nous proposons un cadre d’apprentissage profond open source, DIVA-DAF, basé sur PyTorch Lightning et spécifiquement conçu pour l’analyse de documents historiques. Des tâches pré-implementées telles que la segmentation ou la classification peuvent être facilement utilisées ou personnalisées. Il est également aisé de concevoir ses propres tâches, profitant de modules puissants pour le chargement des données, même de grands jeux de données, ainsi que de diverses formes de vérités terrain. Les applications réalisées ont montré une réduction significative du temps nécessaire à la programmation d’une tâche d’analyse de documents, ainsi qu’à la mise en œuvre de scénarios variés tels que l’entraînement préalable ou la modification d’architectures. Grâce à son module de gestion des données, ce cadre permet également de réduire considérablement le temps d’entraînement des modèles.