HyperAI

Résumé Automatique

Le résumé automatique est le processus de raccourcissement de documents texte à l'aide d'un logiciel afin de créer un résumé contenant les points principaux du document original. Il fait actuellement partie du domaine de l'apprentissage automatique et de l'exploration de données, et son objectif est de trouver des sous-ensembles de données contenant des « informations » pertinentes.

Il existe actuellement deux méthodes de résumé automatique : l’extraction et l’abstraction. L'extraction consiste à former un résumé basé sur un sous-ensemble de mots, d'expressions ou de phrases du texte original ; L'abstraction consiste à établir une représentation sémantique interne, puis à utiliser la technologie de génération de langage naturel pour créer un résumé proche de l'expression humaine.

Il existe deux grands types de tâches de résumé extractif en fonction de ce sur quoi le résumé se concentre : le premier est le résumé général, qui se concentre sur l'obtention d'un résumé général d'une collection ou d'un résumé d'un article, etc. Le second est le résumé dépendant de la requête, qui résume les objets spécifiques à une requête.

Une façon courante d’évaluer le résumé automatique est de le comparer au résumé humain, qui peut être principalement divisé en évaluation interne et évaluation externe, et entre le texte et à l’intérieur du texte.

Évaluations internes et externes

L'évaluation interne est utilisée pour tester le système de résumé lui-même, en évaluant principalement la cohérence et le caractère informatif du résumé ; L'évaluation externe est basée sur l'impact du résumé sur la réalisation d'autres tâches, y compris l'impact du résumé sur l'évaluation de la pertinence, la compréhension de la lecture et d'autres tâches.

Intertextuel et intratextuel

Les méthodes intra-textuelles évaluent la sortie d’un système de résumé spécifique ; Les méthodes intertextuelles se concentrent sur l’analyse comparative des résultats de plusieurs systèmes de résumé.