
摘要
本文探讨了一种简单且高效的文本分类基线方法。实验结果表明,我们提出的快速文本分类器fastText在准确性方面通常与深度学习分类器相当,而在训练和评估速度上则快几个数量级。使用标准多核CPU,我们可以在不到十分钟的时间内对超过十亿个单词进行fastText训练,并在不到一分钟的时间内将五十万句句子分类到312,000个类别中。
本文探讨了一种简单且高效的文本分类基线方法。实验结果表明,我们提出的快速文本分类器fastText在准确性方面通常与深度学习分类器相当,而在训练和评估速度上则快几个数量级。使用标准多核CPU,我们可以在不到十分钟的时间内对超过十亿个单词进行fastText训练,并在不到一分钟的时间内将五十万句句子分类到312,000个类别中。