lyk6756 / lyk6756.github.io

My blog made with Jekyll on GitHub Pages.
https://lyk6756.github.io
MIT License
6 stars 3 forks source link

Python语言下使用Selenium实现对浏览器的自动控制 - 李宇琨的博客 #12

Open lyk6756 opened 4 years ago

lyk6756 commented 4 years ago

https://lyk6756.github.io/2017/08/01/selenium.html

前言在使用Python开发爬虫时,可以使用urllib+BeautifulSoup,Requests+BeautifulSoup,Scrapy等框架实现对静态网页的抓取。但在处理动态网页时,网页上采用异步加载的JavaScript和XML等。为了避免分析页面请求等复杂问题,我们可以牺牲一定的数据采集效率和时间,采...