Open liqq1228 opened 5 years ago
print ("现在对第%s个栏目进行检测" % (columnNum)) for url in self.getPercolumn_allUrl(columnUrl):这两句,感觉getPercolumn_allUrl只是validUrlList列表里栏目的文章详情url,而不是所有的completedArticleColumnUrl里的详情url,感觉是不是decorateArticleUrlDict里的temp = self.__getPercolumn_allUrl__(columnUrl)要放在该函数最后执行
print ("现在对第%s个栏目进行检测" % (columnNum))这一句,对栏目进行检测是时候遍历的不应该是合并的全部的completedArticleColumnUrl列表吗,而在代码中遍历的好像只是从txt读取的validUrlList列表