aclImdb_v1 Grand Ensemble De Données De Critiques De Films
Date
Taille
URL de publication
AclImdb – v1 Dataset est un ensemble de données de critiques de films à grande échelle pour la classification des sentiments binaires. Il couvre plus de données que l'ensemble de données de référence, avec 25 000 critiques de films pour la formation et 25 000 pour les tests. Des données supplémentaires non étiquetées sont également disponibles. L'ensemble de données contient à la fois du texte brut et des formats de sacs de mots traités.
L'ensemble de données AclImdb-v1 a été publié par le Stanford AI Lab en 2011 dans les actes de la 49e conférence annuelle de l'Association for Computational Linguistics : Human Language Technologies. Les principaux éditeurs sont Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng et Christopher Potts. L'article connexe est « Apprentissage de vecteurs de mots pour l'analyse des sentiments ».