code4craft / webmagic

A scalable web crawler framework for Java.
http://webmagic.io/
Apache License 2.0
11.44k stars 4.18k forks source link

如何在PageProcessor的process里面实现点击操作? #1102

Open Mr-LiuDC opened 1 year ago

Mr-LiuDC commented 1 year ago

我用 SeleniumDownloader 配置的 chrome 来下载网页,但是页面上有些内容是要有点击操作才会动态渲染出结果,请问在 PageProcessor的process方法中如何进行点击操作呢?或者有其他什么好的方式来实现。

zkywalker commented 1 year ago

自己实现一个SeleniumDownloader,在download(Request request, Task task)里添加chrome driver的操作,渲染完了再调onSuccess(request, task)