fuos / my-blog

🛩 A blog build with Hexo and Travis-CI.
https://fuos.github.io/my-blog
0 stars 1 forks source link

PAI算法组件详解-PLDA #17

Closed fuos closed 3 months ago

fuos commented 4 years ago

https://fuos.github.io/my-blog/posts/72ac77ba.html

通过文章主题做文本分类的理论依据直观来讲,如果一篇文章有一个中心思想,那么一些特定词语会更频繁的出现。比方说,如果一篇文章是在讲猫的,那”猫”和”鱼”等词出现的频率会高些,如果一篇文章是在讲狗的,那”狗”和”骨头”等词出现的频率会高些。而有些词例如”这个”、”和”大概在两篇文章中出现的频率会大致相等。但真实的情况是,一篇文章通常包含多种主题,而且每个主题所占比例各不相同。因此,如果一篇文章10%和

fuos commented 4 years ago

🚌这篇文章转自我的https://www.cnblogs.com/zkio