xchaoinfo / fuck-login

模拟登录一些知名的网站,为了方便爬取需要登录的网站
5.86k stars 2.02k forks source link

Fuck login py3 #77

Closed xgxofdream closed 7 years ago

xgxofdream commented 7 years ago

Hi 我试着爬了知乎的一个页面 (https://www.zhihu.com/question/60228354/answer/173937872)。 返回的Html里的中文信息有一部分是乱码,很奇怪。OK,没事了,现在发现把返回的html拷贝到html编辑器里后,中文信息就全部显示了,看来与Eclipe的输出有关。不想研究怎么删这条request了,就不折腾放在这里吧。

我在原代码上加的爬页面的代码:

import urllib.request

...

#网址  
url = "https://www.zhihu.com/question/60228354/answer/173937872"  

#请求  
request = urllib.request.Request(url)  

#爬取结果  
response = urllib.request.urlopen(request)  

data = response.read()  

#设置解码方式  
data = data.decode('utf-8')  

#打印结果  
print(data) `