Intégration de multiples sources de connaissance pour une analyse ciblée du sentiment financier basée sur les aspects

L’intégration des méthodes symboliques et subsymboliques est devenue une stratégie prometteuse au fur et à mesure que les tâches de recherche en intelligence artificielle deviennent de plus en plus complexes et exigent un niveau de compréhension plus élevé. L’analyse de sentiment financière basée sur les aspects ciblés (TABFSA, Targeted Aspect-based Financial Sentiment Analysis) constitue l’un de ces problèmes complexes, car elle implique l’extraction d’informations, la spécification fine et l’adaptation au domaine. Les connaissances externes se sont révélées utiles pour l’analyse de sentiment à usage général, mais leur apport reste peu exploré dans le domaine financier. Pourtant, les modèles actuels d’analyse de sentiment financière (FSA, Financial Sentiment Analysis) de pointe ont négligé l’importance de ces connaissances externes. Afin de combler cette lacune, nous proposons d’utiliser des réseaux de neurones convolutifs attentifs (CNN) et des réseaux récurrents à mémoire à long terme (LSTM) pour intégrer de manière stratégique plusieurs sources de connaissances externes dans le processus de finetuning des modèles pré-entraînés sur langage, spécifiquement pour la TABFSA. Des expérimentations menées sur les jeux de données FiQA Task 1 et SemEval 2017 Task 5 montrent que les modèles enrichis par des connaissances améliorent systématiquement leurs homologues fondés uniquement sur l’apprentissage profond, certains dépassant même les résultats de l’état de l’art en matière d’analyse de sentiment par aspect.