HyperAIHyperAI

Command Palette

Search for a command to run...

Corpus d'extraction d'informations À Grande Échelle IEPile 

Date

il y a 2 ans

Taille

1.83 MB

Organisation

Université du Zhejiang

URL de publication

github.com

IEPile est un ensemble de données d'instructions d'extraction d'informations (IE) bilingue (chinois et anglais) à grande échelle et de haute qualité, développé par l'Université du Zhejiang, couvrant trois sous-tâches principales : la reconnaissance d'entités nommées (NER), l'extraction de relations (RE) et l'extraction d'événements (EE). L'ensemble de données contient environ 2 millions d'échantillons d'instructions, totalisant environ 320 millions de jetons, couvrant plusieurs domaines tels que le général, le médical et le financier.

L'équipe de recherche a assuré la haute qualité de l'ensemble de données en intégrant soigneusement 26 ensembles de données IE anglais et 7 chinois et en adoptant la « méthode de construction d'instructions de sondage basée sur un schéma » proposée, y compris la création d'un dictionnaire d'échantillons négatifs difficiles et la génération d'instructions de sondage. La construction d'IEPile améliore considérablement les performances des grands modèles dans les tâches d'extraction d'informations, en particulier les capacités de généralisation à zéro coup, fournissant des ressources précieuses pour la recherche sur l'extraction d'informations.

IEPile.torrent
Seeding 1Téléchargement 0Terminé 333Total Downloads 721
  • IEPile/
    • README.md
      1.47 KB
    • README.txt
      2.94 KB
      • data/
        • IEPile-main.zip
          1.83 MB

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp