Closed fuos closed 3 months ago
https://fuos.github.io/my-blog/posts/72ac77ba.html
通过文章主题做文本分类的理论依据直观来讲,如果一篇文章有一个中心思想,那么一些特定词语会更频繁的出现。比方说,如果一篇文章是在讲猫的,那”猫”和”鱼”等词出现的频率会高些,如果一篇文章是在讲狗的,那”狗”和”骨头”等词出现的频率会高些。而有些词例如”这个”、”和”大概在两篇文章中出现的频率会大致相等。但真实的情况是,一篇文章通常包含多种主题,而且每个主题所占比例各不相同。因此,如果一篇文章10%和
🚌这篇文章转自我的https://www.cnblogs.com/zkio
https://fuos.github.io/my-blog/posts/72ac77ba.html
通过文章主题做文本分类的理论依据直观来讲,如果一篇文章有一个中心思想,那么一些特定词语会更频繁的出现。比方说,如果一篇文章是在讲猫的,那”猫”和”鱼”等词出现的频率会高些,如果一篇文章是在讲狗的,那”狗”和”骨头”等词出现的频率会高些。而有些词例如”这个”、”和”大概在两篇文章中出现的频率会大致相等。但真实的情况是,一篇文章通常包含多种主题,而且每个主题所占比例各不相同。因此,如果一篇文章10%和