HyperAIHyperAI
il y a 8 jours

ColBERT : Utilisation des embeddings de phrases BERT dans des réseaux neuronaux parallèles pour l’humour computationnel

Issa Annamoradnejad, Gohar Zoghi
ColBERT : Utilisation des embeddings de phrases BERT dans des réseaux neuronaux parallèles pour l’humour computationnel
Résumé

L’automatisation de la détection et du classement de l’humour présente des applications intéressantes dans les technologies modernes, telles que les robots humanoïdes, les chatbots et les assistants virtuels. Dans cet article, nous proposons une nouvelle approche pour détecter et évaluer l’humour dans des textes courts, fondée sur une théorie linguistique populaire de l’humour. La méthode technique proposée commence par la segmentation des phrases du texte donné, suivie de la génération d’embeddings à l’aide du modèle BERT pour chaque phrase. Ces embeddings sont ensuite introduits dans des lignes distinctes de couches cachées d’un réseau neuronal (une ligne par phrase) afin d’extraire des caractéristiques latentes. Enfin, ces lignes parallèles sont concaténées pour évaluer la cohérence et d’autres relations entre les phrases, et prédire la valeur cible. Nous accompagnons cet article d’un nouveau jeu de données dédié à la détection de l’humour, comprenant 200 000 textes courts formels. En plus de l’évaluation de notre méthode sur ce jeu de données original, nous avons participé à une compétition en temps réel de machine learning portant sur le classement de l’humour dans des tweets en espagnol. Le modèle proposé a obtenu des scores F1 de 0,982 et 0,869 dans les expériences de détection de l’humour, dépassant ainsi les modèles généraux et les modèles de pointe. L’évaluation menée dans deux configurations contrastées confirme la puissance et la robustesse du modèle, tout en mettant en évidence deux facteurs clés pour atteindre une haute précision dans cette tâche : 1) l’utilisation d’embeddings de phrases, et 2) l’exploitation de la structure linguistique de l’humour dans la conception du modèle proposé.

ColBERT : Utilisation des embeddings de phrases BERT dans des réseaux neuronaux parallèles pour l’humour computationnel | Articles de recherche récents | HyperAI