Alex-McAvoy / Gitalk-Comment

存储博客评论的 Gittalk 仓库
0 stars 0 forks source link

词袋模型 | Alex_McAvoy #1078

Open Alex-McAvoy opened 2 months ago

Alex-McAvoy commented 2 months ago

https://alex-mcavoy.github.io/artificial-intelligence/deep-learning/nlp/e8b9bf93.html

【概述】词袋模型(Bag of Words,BOW)最早用于文本分类,其将每个句子看成一个袋子,袋子中装的都是单词,每个单词都是独立的,然后看这个袋子里装的都是些什么词汇,将其进行分类 如果猪、马、牛、羊、山谷、土地、拖拉机这样的词汇多些,而银行、大厦、汽车、公园这样的词汇少些,我们就倾向于判断它是一篇描绘乡村的文档,而不是描述城镇的