Open lyk6756 opened 4 years ago
https://lyk6756.github.io/2017/08/01/selenium.html
前言在使用Python开发爬虫时,可以使用urllib+BeautifulSoup,Requests+BeautifulSoup,Scrapy等框架实现对静态网页的抓取。但在处理动态网页时,网页上采用异步加载的JavaScript和XML等。为了避免分析页面请求等复杂问题,我们可以牺牲一定的数据采集效率和时间,采...
https://lyk6756.github.io/2017/08/01/selenium.html
前言在使用Python开发爬虫时,可以使用urllib+BeautifulSoup,Requests+BeautifulSoup,Scrapy等框架实现对静态网页的抓取。但在处理动态网页时,网页上采用异步加载的JavaScript和XML等。为了避免分析页面请求等复杂问题,我们可以牺牲一定的数据采集效率和时间,采...