HyperAI

Wikipédia Ensemble De Données Wikipédia

Date

il y a un an

Taille

57.98 GB

Organisation

URL de publication

huggingface.co

Licence

CC BY-NC-SA 3.0

Résumé de l'ensemble de données

L'ensemble de données Wikipédia contient des articles nettoyés dans toutes les langues.

Cet ensemble de données est fourni par Dépotoirs Wikipédia  Construire, avec un sous-ensemble par langue et chaque sous-ensemble concaténé avec une division de colonne.

Chaque exemple contient le contenu d'un article Wikipédia complet, nettoyé pour supprimer le balisage et les parties indésirables (comme les « références », etc.).

Visualisation des données

Cliquez Atlas nomique  Carte, visualisant 6,4 millions d'échantillons de la division 20231101.en.

Informations sur les licences

Informations sur la licence de droits d'auteur :https://dumps.wikimedia.org/legal.html

Tout le contenu du texte original est basé sur Licence de documentation libre GNU (GFDL) etLicence Creative Commons Attribution-Share Alike 3.0Autorisation. Certains textes peuvent être disponibles uniquement sous une licence Creative Commons ; voir leurconditions d'utilisation. Certains textes écrits par des auteurs peuvent être publiés sous des licences supplémentaires ou entrer dans le domaine public.

wikipedia.torrent
Partage 1Téléchargement 2Terminés 181Téléchargements totaux 453
  • wikipedia/
    • README.md
      1.54 KB
    • README.txt
      3.09 KB
      • data/
        • wikipedia.zip
          57.98 GB