潜在语义分析 Latent semantic analysis

潜在语义分析主要是讨论字词背后的关系,而非字典上定义的基础,这种关系基于字词的实际使用环境,并以此作为基本参考。

这种思想源于心理语言学家,他们认为世界上数以百计的语言存在一个共同的机制,由此得出结论,任何人在特定的语言环境下成长都能掌握相关语言。基于这种思想,人们找到了一种简单的数学模型,其可以输入由任何一种语言书写的文献构成的文库,并输出基于该语言的字、词的数学表达,字、词之间的关系乃至任何文章片段之间的含义,均可基于这种向量之间的运算。