HyperAIHyperAI
il y a 2 mois

DocTr : Document Transformer pour l’extraction d’informations structurées dans les documents

Haofu Liao; Aruni RoyChowdhury; Weijian Li; Ankan Bansal; Yuting Zhang; Zhuowen Tu; Ravi Kumar Satzoda; R. Manmatha; Vijay Mahadevan
DocTr : Document Transformer pour l’extraction d’informations structurées dans les documents
Résumé

Nous présentons une nouvelle formulation pour l'extraction d'informations structurées (EIS) à partir de documents visuellement riches. Cette approche vise à surmonter les limitations des formulations actuelles basées sur l'étiquetage IOB ou les graphes, qui sont soit trop dépendantes de l'ordre correct du texte d'entrée, soit peinent à décoder un graphe complexe. Inspirés par les détecteurs d'objets basés sur des ancres dans le domaine de la vision, nous représentons une entité par un mot ancre et une boîte englobante, et nous représentons le lien entre les entités par l'association entre les mots ancre. Cette méthode est plus robuste face à l'ordre du texte et maintient un graphe compact pour le lien entre les entités. La formulation nous incite à introduire 1) un transformateur de document (DocTr) destiné à détecter et associer des boîtes englobantes d'entités dans des documents visuellement riches, et 2) une stratégie de pré-entraînement simple qui aide à apprendre la détection d'entités dans le contexte linguistique. Les évaluations sur trois benchmarks d'EIS montrent l'efficacité de la formulation proposée, et l'approche globale surpassant les solutions existantes.

DocTr : Document Transformer pour l’extraction d’informations structurées dans les documents | Articles de recherche récents | HyperAI