Alex-McAvoy / Gitalk-Comment

存储博客评论的 Gittalk 仓库
0 stars 0 forks source link

TF-IDF 算法 | Alex_McAvoy #1081

Open Alex-McAvoy opened 2 months ago

Alex-McAvoy commented 2 months ago

https://alex-mcavoy.github.io/artificial-intelligence/deep-learning/nlp/93aca240.html

【概述】词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)是一种用于信息检索与数据挖掘的常用加权技术,常用于衡量单词在文档中重要性,其结合了单词在文档中的频率和在整个文集中的普遍程度 TF-IDF 的主要思想是:如果某个单词在一个文档中出现的频率高,并且在其他文档中很少出现,则认为此词或者短语具有很好的类别区分能力