Command Palette
Search for a command to run...
Des heuristiques aux modèles linguistiques : un voyage à travers l’univers de l’interprétation des tableaux sémantiques avec DAGOBAH
{Jixiong Liu and Raphaël Troncy Thomas Labbé Yoan Chabot Viet-Phi Huynh}

Résumé
Ce papier présente DAGOBAH SL 2022, un système d’interprétation sémantique de tableaux, qui a été continuellement amélioré au cours des quatre dernières années dans le cadre du défi SemTab. Cette année, nous avons augmenté la couverture des recherches grâce à l’utilisation de ressources externes, et intégré des modèles linguistiques afin d’améliorer la compréhension des en-têtes de tableaux. Nous avons également mis en œuvre diverses optimisations du système, conduisant à une réduction d’environ 30 % du temps d’exécution. Dans ce travail, nous mettons également en évidence l’intérêt des approches fondées sur l’apprentissage profond pour résoudre certaines ambiguïtés, et discutons des limites des corpus et des systèmes existants dans le développement futur de ce domaine de recherche.
Benchmarks
| Benchmark | Méthodologie | Métriques |
|---|---|---|
| cell-entity-annotation-on-toughtables-wd | DAGOBAH | F1 (%): 94.5 |
| column-type-annotation-on-toughtables-wd | DAGOBAH | F1 (%): 40.9 |
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.