Henryhaohao / Wenshu_Spider

:rainbow:Wenshu_Spider-Scrapy框架爬取中国裁判文书网案件数据(2019-1-9最新版)
http://wenshu.court.gov.cn/
MIT License
191 stars 71 forks source link

博主,你好,如何遍历文书网的所有的文书 #2

Open GoldenNotebook opened 5 years ago

GoldenNotebook commented 5 years ago

鉴于目前文书网一次返回的结果太少。我的想法是地点加日期,可是现在不能单独已某天的范围来抓取数据呢,如:param:"案件类型:民事案件,中级法院:北京市第二中级人民法院,裁判日期:2018-11-13 TO 2018-11-20",这中条件似乎不能返回结果。如果去掉日期改为:param:"案件类型:民事案件,中级法院:北京市第二中级人民法院",则可以。 我就很困惑,似乎也没有其他的筛选方法了。 谢谢。

Henryhaohao commented 5 years ago

你好: 我刚试了下,加日期可以访问的呀,没毛病的,你再试试吧:smile: 另外,感谢你对我github项目的支持~~ @GoldenNotebook

GoldenNotebook commented 5 years ago

谢谢,是可以呢。但是需要正确的参数。现在获取number有问题。请求http://wenshu.court.gov.cn/ValiCode/GetCode 有时候不返回numbe,如果返回了,好像也不能用。 方便的话,请您看下。

Henryhaohao commented 5 years ago

应该不会吧,我晚上刚刚运行了一下,没有问题呀,返回正常的。有可能是爬太快你IP被封了哟,而且文书网经常抽风的,连接很不稳定,贼慢。 @GoldenNotebook