code4craft / webmagic

A scalable web crawler framework for Java.
http://webmagic.io/
Apache License 2.0
11.43k stars 4.18k forks source link

xpath轴问题 #869

Open johntsu opened 5 years ago

johntsu commented 5 years ago

我使用的webmagic版本是0.7.3,用xpath轴选取元素的时候,抛出了异常。 代码如下: List sectionLinkList = page.getHtml().xpath("//*[@id=\"main\"]/div/dl/dt[2]/following-sibling::input").all();

抛出的异常: org.jsoup.select.Selector$SelectorParseException: Could not parse query 'following-sibling::input': unexpected token at '::input'

这个版本的webmagic中的jsoup是不是不支持xpath轴?

dcncy commented 5 years ago

我也遇到了同样的问题;

guiyuma commented 5 years ago

我也遇到了同样的问题。

qiangzhigan commented 4 years ago

我也遇到了同样的问题

sfyc23 commented 4 years ago

我也遇到了同样的问题。by:2020-8-10 23:10:59

hhh123-sec commented 4 years ago

少了好多xpath的支持,不过可以用css选择器来解决,找同级元素

yuweiming2016 commented 3 years ago

因为webmagic的xpath解析框架是作者自己写的xsoup,跟其他的还不太一样,感觉其他框架做得挺好了,没必要再搞一套