il y a 2 mois
Sac de trucs pour une classification textuelle efficace
Armand Joulin; Edouard Grave; Piotr Bojanowski; Tomas Mikolov

Résumé
Ce document explore une méthode de base simple et efficace pour la classification de texte. Nos expériences montrent que notre classifieur de texte rapide, fastText, est souvent comparable aux classifieurs basés sur l'apprentissage profond en termes de précision, tout en étant beaucoup plus rapide pour l'entraînement et l'évaluation. Nous pouvons entraîner fastText sur plus d'un milliard de mots en moins de dix minutes à l'aide d'un CPU multicœur standard, et classer cinq cent mille phrases parmi 312 000 classes en moins d'une minute.