Command Palette
Search for a command to run...
Apprentissage de représentation des entités et des documents à partir des descriptions de la base de connaissances
Apprentissage de représentation des entités et des documents à partir des descriptions de la base de connaissances
Ikuya Yamada Hiroyuki Shindo Yoshiyasu Takefuji
Résumé
Dans cet article, nous décrivons TextEnt, un modèle de réseau neuronal qui apprend des représentations distribuées d'entités et de documents directement à partir d'une base de connaissances (KB). Étant donné un document dans une KB composé de mots et d'annotations d'entités, nous formons notre modèle pour prédire l'entité que le document décrit et rapprocher le document et son entité cible dans un espace vectoriel continu. Notre modèle est entraîné en utilisant un grand nombre de documents extraits de Wikipedia. Les performances du modèle proposé sont évaluées à travers deux tâches, à savoir la typologie fine-grainée des entités et la classification multiclasse du texte. Les résultats montrent que notre modèle atteint des performances de pointe sur les deux tâches. Le code source et les représentations entraînées sont mis à disposition en ligne pour des recherches académiques ultérieures.