Reconnaissance guidée de la structure des tableaux par optimisation des ancres

Ce document présente une nouvelle approche pour la reconnaissance de la structure des tableaux en utilisant des ancres guidées. Cette méthode diffère des approches actuelles de pointe qui appliquent naïvement des méthodes de détection d'objets à la reconnaissance de la structure des tableaux. Contrairement aux techniques précédentes, nous commençons par estimer les ancres viables pour la reconnaissance de la structure des tableaux. Ensuite, ces ancres sont exploitées pour localiser les lignes et les colonnes dans les images tabulaires. De plus, le document introduit une méthode simple et efficace qui améliore les résultats en utilisant des mises en page tabulaires dans des scénarios réalistes. La méthode proposée a été évaluée de manière exhaustive sur deux jeux de données publics de reconnaissance de la structure des tableaux, à savoir ICDAR-2013 et TabStructDB. Nous avons obtenu des résultats d'état de l'art sur le jeu de données ICDAR-2013 avec un F-mesure moyen de 95,05 % (94,6 % pour les lignes et 96,32 % pour les colonnes) et surpassé les résultats de référence sur le jeu de données TabStructDB avec un F-mesure moyen de 94,17 % (94,08 % pour les lignes et 95,06 % pour les colonnes).