Command Palette

Search for a command to run...

隐狄利克雷分布 Latent Dirichlet Allocation

日期

7 年前

隐狄利克雷分布 LDA 是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式表达,同时它也是一种无监督学习算法,训练时不需要手工标注的训练集,仅需要文档集、指定主题的数量 K 即可,此外,对于每个主题均可找出一些词语来描述。

LDA 起初由 Blei 、 David M. 、 Jordan 、 Michael I 和吴恩达于 2003 年提出,目前在文本挖掘领域如文本主题识别、文本分类及文本相似度计算方面都有应用。

LDA 是一种典型的词袋模型,即一篇文章是由一组词构成的集合,词与词之间没有顺序及先后关系,一篇文档可以包含多个主题,文档中每个词都由对应的主题生成。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供