Détection de table dans le monde réel : un nouveau jeu de données et une nouvelle méthode de détection de tables diversifiées

Les approches récentes basées sur l’apprentissage profond pour la détection de tableaux ont atteint des performances remarquables et se sont avérées efficaces dans l’identification des mises en page de documents. Toutefois, les benchmarks actuellement disponibles pour la détection de tableaux présentent de nombreuses limites, notamment un manque de diversité des échantillons, des structures de tableaux simplistes, un faible nombre de cas d’entraînement et une qualité inégale des échantillons. Dans cet article, nous introduisons un jeu de données large échelle et diversifié pour la détection de tableaux, comprenant plus de sept mille échantillons regroupant une grande variété de structures de tableaux, collectés à partir de sources très diverses. Par ailleurs, nous proposons également des résultats de base obtenus à l’aide d’une méthode basée sur les réseaux de neurones convolutifs pour la détection des structures de tableaux dans les documents. Les résultats expérimentaux démontrent l’avantage de l’application des méthodes d’apprentissage profond convolutif par rapport aux méthodes classiques de vision par ordinateur. La mise à disposition de ce jeu de données diversifié ouvrira la voie à la communauté scientifique pour développer des méthodes d’apprentissage profond à haut débit afin de mieux comprendre les mises en page de documents et traiter les données tabulaires. Le jeu de données est disponible à l’adresse suivante :1. https://www.kaggle.com/datasets/mrinalim/stdw-dataset2. https://huggingface.co/datasets/n3011/STDW