vor 2 Monaten
Wichtige Tricks für effiziente Textklassifizierung
Armand Joulin; Edouard Grave; Piotr Bojanowski; Tomas Mikolov

Abstract
Dieses Papier untersucht eine einfache und effiziente Baseline für die Textklassifizierung. Unsere Experimente zeigen, dass unser schneller Textklassifizierer fastText in Bezug auf Genauigkeit oft mit tiefen Lernalgorithmen vergleichbar ist und gleichzeitig um mehrere Größenordnungen schneller bei der Trainings- und Evaluationsphase ist. Wir können fastText auf mehr als einer Milliarde Wörtern in weniger als zehn Minuten mit einem Standard-Multicore-CPU trainieren und 500.000 Sätze unter 312.000 Klassen in weniger als einer Minute klassifizieren.