Command Palette
Search for a command to run...
Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench
Date
URL du document
Licence
Apache 2.0
L'ensemble de données d'évaluation des capacités d'analyse syntaxique de documents ParseBench a été publié par l'équipe LlamaIndex en 2024-2025, et les résultats des articles associés sont les suivants : ParseBench : un banc d’essai d’analyse de documents pour les agents d’IAIl vise à promouvoir l'évolution de l'analyse syntaxique des documents, passant de la reconnaissance optique de caractères traditionnelle à une compréhension structurée, et à soutenir l'évaluation et l'optimisation des modèles multimodaux et des systèmes d'extraction d'informations. Cet ensemble de données contient environ 2 000 pages validées et annotées manuellement, ainsi que 169 011 règles de test réparties sur cinq dimensions. Ces pages proviennent de documents d'entreprises accessibles au public, couvrant les secteurs de l'assurance, de la finance, du gouvernement et autres. Elles comprennent différents types de pages, notamment des PDF, des images numérisées et des pages contenant des tableaux et des structures de mise en page. Les résultats d'analyse syntaxique standardisés sont fournis et alignés sur les annotations humaines afin d'évaluer les performances du modèle en matière de compréhension structurelle et d'extraction d'informations.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.