nlpinaction / learning-nlp

nlp in action
1.03k stars 823 forks source link

第七章向量化算法 词袋模型,无法理解 #15

Open rffanlab opened 5 years ago

rffanlab commented 5 years ago

稳重表述的是“词典中每个单词在文本中出现的频率”但是这个10维向量中应该不会出现0才对应为,另外按照数量来算的话,那么John出现了2次,而likes出现了3次,那么向量不应该是1,2开始的而是2,3开始,不知道我表述的对不对,或者可能我的理解有问题?