Closed linux40 closed 5 years ago
是通过ip地址封锁的, 只有通过转发器,代理之类的方法才能突破。
好吧,可能是不准机器人抓去文章内容吧。。。
是因为GAE太流行了,很多粗暴没节制的爬虫都部署在GAE上,导致很多网站开始封锁GAE的IP地址。 我使用 https://github.com/cdhigh/Forwarder 发现是能正常获取文章内容的。 如果你确实想看此网站,可以仿照 books/ZhihuDaily.py,创建一个py文件,通过转发器获取内容。 建议在heroku上搭建自己的转发器,内置的默认转发器负荷有点大了,免费额度只够每个月运行多半个月。
版本 1.26.5
rss地址