Wikipédia Ensemble De Données Wikipédia
Date
Taille
URL de publication
Licence
CC BY-NC-SA 3.0
Catégories
Résumé de l'ensemble de données
L'ensemble de données Wikipédia contient des articles nettoyés dans toutes les langues.
Cet ensemble de données est fourni par Dépotoirs Wikipédia Construire, avec un sous-ensemble par langue et chaque sous-ensemble concaténé avec une division de colonne.
Chaque exemple contient le contenu d'un article Wikipédia complet, nettoyé pour supprimer le balisage et les parties indésirables (comme les « références », etc.).
Visualisation des données
Cliquez Atlas nomique Carte, visualisant 6,4 millions d'échantillons de la division 20231101.en.
Informations sur les licences
Informations sur la licence de droits d'auteur :https://dumps.wikimedia.org/legal.html
Tout le contenu du texte original est basé sur Licence de documentation libre GNU (GFDL) etLicence Creative Commons Attribution-Share Alike 3.0Autorisation. Certains textes peuvent être disponibles uniquement sous une licence Creative Commons ; voir leurconditions d'utilisation. Certains textes écrits par des auteurs peuvent être publiés sous des licences supplémentaires ou entrer dans le domaine public.