Open carlos9310 opened 4 years ago
https://carlos9310.github.io/2019/08/07/LDA/
LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型由如下假设而来:一篇文章的每个词都是通过这样的过程生成而来:先按某种概率分布选择某个主题,再从该主题中按某种概率分布选择某个词。 文档到主题服从多项式分布,主题到词服从多项式分布。
https://carlos9310.github.io/2019/08/07/LDA/
LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型由如下假设而来:一篇文章的每个词都是通过这样的过程生成而来:先按某种概率分布选择某个主题,再从该主题中按某种概率分布选择某个词。 文档到主题服从多项式分布,主题到词服从多项式分布。