SentiHood : Jeu de données pour l'analyse de sentiment basée sur les aspects ciblés dans les quartiers urbains

Dans cet article, nous présentons la tâche d'analyse de sentiment basée sur des aspects ciblés. L'objectif est d'extraire des informations détaillées concernant les entités mentionnées dans les commentaires des utilisateurs. Ce travail étend à la fois l'analyse de sentiment basée sur des aspects, qui suppose qu'un seul entité est présente par document, et l'analyse de sentiment ciblée, qui suppose qu'il y a un seul sentiment envers une entité cible. Plus précisément, nous identifions le sentiment exprimé à l'égard de chaque aspect d'une ou plusieurs entités. Comme terrain d'essai pour cette tâche, nous introduisons le jeu de données SentiHood, extrait d'une plateforme de questions-réponses (QA) où les utilisateurs discutent des quartiers urbains. Dans ce contexte, les unités de texte mentionnent souvent plusieurs aspects d'un ou plusieurs quartiers. C'est la première fois qu'une plateforme générique des médias sociaux, dans ce cas une plateforme QA, est utilisée pour l'extraction détaillée d'opinions. Le texte provenant des plateformes QA est beaucoup moins contraint comparé au texte issu des plateformes spécialisées dans les avis, sur lesquelles reposent actuellement les jeux de données. Nous développons plusieurs bases solides, s'appuyant sur la régression logistique et les réseaux neuronaux récurrents d'avant-garde.