nlpinaction / learning-nlp

nlp in action
1.03k stars 823 forks source link

第三章中文分词-代码问题 #4

Closed cpz19952007 closed 6 years ago

cpz19952007 commented 6 years ago

位置:p42 问题1:init函数中maximum代表的是词典中最长词的长度,那是不是应该只保留最长词的长度,而不是每次读入一行都赋值,将self.maximum = len(line)改为self.maximum = max(self.maximum , len(line))

问题2:cut函数的while循环中,在if word is None:中除了要考虑一个字为词的索引移动以外,还应该把该字加入到result中,应该改为

if word is None:
    index -= 1
    result.append(text[index])

以上为个人见解,谢谢。

sloth2012 commented 6 years ago

issue重复,该问题已修复,书中代码确实有问题,重印版将修正该问题 见 #1