RuDaS : Jeux de données synthétiques pour l'apprentissage et l'évaluation des règles

Les règles logiques constituent un langage de représentation des connaissances largement utilisé dans de nombreux domaines, permettant de représenter les connaissances de base et d'encoder l'information qui peut être dérivée des faits donnés sous une forme concise. Cependant, la formulation de règles est un processus complexe qui nécessite une expertise approfondie du domaine et est encore davantage compliquée par les graphes de connaissances actuels, souvent grands, hétérogènes et incomplets. Au fil du temps, plusieurs approches pour apprendre automatiquement des règles à partir d'un ensemble de faits exemples ont été proposées, notamment plus récemment des systèmes neuronaux. Néanmoins, ce domaine manque de jeux de données et d'approches d'évaluation adéquates : les jeux de données existants ressemblent souvent à des exemples simplifiés qui ne couvrent ni les différents types de dépendances entre les règles ni ne permettent de tester la scalabilité. Nous présentons un outil pour générer différents types de jeux de données et évaluer les systèmes d'apprentissage de règles, y compris des mesures de performance nouvelles.