Closed xgxofdream closed 7 years ago
Hi 我试着爬了知乎的一个页面 (https://www.zhihu.com/question/60228354/answer/173937872)。 返回的Html里的中文信息有一部分是乱码,很奇怪。OK,没事了,现在发现把返回的html拷贝到html编辑器里后,中文信息就全部显示了,看来与Eclipe的输出有关。不想研究怎么删这条request了,就不折腾放在这里吧。
我在原代码上加的爬页面的代码:
import urllib.request
...
#网址 url = "https://www.zhihu.com/question/60228354/answer/173937872" #请求 request = urllib.request.Request(url) #爬取结果 response = urllib.request.urlopen(request) data = response.read() #设置解码方式 data = data.decode('utf-8') #打印结果 print(data) `
Hi 我试着爬了知乎的一个页面 (https://www.zhihu.com/question/60228354/answer/173937872)。 返回的Html里的中文信息有一部分是乱码,很奇怪。OK,没事了,现在发现把返回的html拷贝到html编辑器里后,中文信息就全部显示了,看来与Eclipe的输出有关。不想研究怎么删这条request了,就不折腾放在这里吧。
我在原代码上加的爬页面的代码:
...