Closed hack-fang closed 4 years ago
丁香园更新了overall_information的结构,导致解析json出错,原因是获取的字符串少了 ]}
overall_information
]}
在 crawler.py 的 47行以下更改即可
# old #overall_information = re.search(r'\{("id".*?)\}', str(soup.find('script', attrs={'id': 'getStatisticsService'}))) # new overall_information = re.search(r'\{("id".*?)\]\}', str(soup.find('script', attrs={'id':'getStatisticsService'})))
万分感谢,已经修改并重启爬虫。可以直接提交pull request,我会merge进来的~
丁香园更新了
overall_information
的结构,导致解析json出错,原因是获取的字符串少了]}
在 crawler.py 的 47行以下更改即可