2 个月前

用于高效文本分类的技巧集锦

Armand Joulin; Edouard Grave; Piotr Bojanowski; Tomas Mikolov
用于高效文本分类的技巧集锦
摘要

本文探讨了一种简单且高效的文本分类基线方法。实验结果表明,我们提出的快速文本分类器fastText在准确性方面通常与深度学习分类器相当,而在训练和评估速度上则快几个数量级。使用标准多核CPU,我们可以在不到十分钟的时间内对超过十亿个单词进行fastText训练,并在不到一分钟的时间内将五十万句句子分类到312,000个类别中。

用于高效文本分类的技巧集锦 | 最新论文 | HyperAI超神经