Closed youyouYoung closed 8 years ago
read time out是因为网络原因downloader下载失败 用Site.setTimeOut()设置一个较大的值
同 @yokiqust 所说。网络不好的话,建议设置Site.setTimeOut(),并且将Site.setRetryTimes()设置一个重试次数,可以保证抓的更全一些。
这个我发现没有出发listener里面的onerror()方法,请问下作者出现timeout该怎么抓取这个超时的url
目的:
从知乎的一个问题开始爬取其中所有的回答.我选了贫穷会对人的身心造成多大的影响?问题.
实现:
知乎需要链接访问需要登录才可以,是不是需要添加账户信息.如果需要才怎么做. 之前写过一个使用java.net包中的类实现的爬取一个知乎页面内容的代码是不需要账户信息的这是为什么!
麻烦各位帮助!