icimence / icimence.github.io

icimence's Tech blog
https://icimence.github.io/
2 stars 0 forks source link

Python爬虫xpath解析 | Icimence's Tech Blog #7

Open icimence opened 4 years ago

icimence commented 4 years ago

https://icimence.cn/2020/05/05/Python%E7%88%AC%E8%99%ABxpath%E8%A7%A3%E6%9E%90/

引言  上篇文章挖了个坑说要解释爬虫的程序,那就找时间填上了,其实Python的爬虫十分的简单,基本上只有要有一个模板,就可以了,这里恬不知耻的推广一下我的模板,我的这个爬虫前面的两个准备文件比较完善,可以直接套用,提高爬虫的安全性。 核心代码url的获取作为爬虫肯定要知道哪一个网址是目标,然后进行观察,网址是不是有翻页的能力,有的话翻页的能力在url上是怎么体现的,总结出翻页