HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données Simplifiées En Texte Chinois MCTS

Date

il y a 10 mois

Taille

71.7 MB

Organisation

Université des langues et des cultures de Pékin
Université Tsinghua

URL de publication

github.com

URL de l'article

aclanthology.org

MCTS signifie Multi-Reference Chinese Text Simplification Dataset, qui est un ensemble de données de simplification de texte chinois publié en 2024 par une équipe de recherche de l'Université des langues et de la culture de Pékin, de l'Université du Nord-Est et de l'Université Tsinghua.MCTS : un ensemble de données de simplification de textes chinois multi-références", vise à fournir des ressources riches et un support pour les tâches de simplification de texte dans le domaine du traitement du langage naturel.

L'ensemble de données contient 723 phrases structurées complexes sélectionnées à partir d'un corpus d'actualités basé sur la norme Penn Chinese Treebank (CTB), et chaque phrase est équipée de plusieurs versions simplifiées manuellement, ce qui en fait l'ensemble de données d'évaluation le plus grand et le plus référencé pour la tâche de simplification de texte chinois. De plus, MCTS définit trois types de méthodes de réécriture de phrases : la paraphrase, la compression de phrases et la transformation de structure. Cette diversité recouvre différentes stratégies de simplification de texte.

L'ensemble de données MCTS convient non seulement aux domaines de recherche tels que la lecture graduée et la traduction automatique, mais peut également aider les apprenants en langues à mieux comprendre et traiter des textes complexes.

En termes d'utilisation, MCTS fournit des données parallèles pour la formation, qui peuvent être utilisées pour former et optimiser le modèle de simplification de texte chinois. Dans le même temps, les chercheurs peuvent également quantifier les performances du système en comparant le texte simplifié généré par le système avec plusieurs versions simplifiées de référence dans l'ensemble de données, en utilisant des indicateurs d'évaluation automatique tels que SARI, BLEU et HSK Level.

MCTS-CN.torrent
Partage 0Téléchargement 1Terminés 134Téléchargements totaux 232
  • MCTS-CN/
    • README.md
      2.01 KB
    • README.txt
      4.01 KB
      • data/
        • mcts-main.zip
          71.7 MB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Ensemble De Données Simplifiées En Texte Chinois MCTS | Ensembles de données | HyperAI