code4craft / webmagic

A scalable web crawler framework for Java.
http://webmagic.io/
Apache License 2.0
11.41k stars 4.18k forks source link

更全面的XPath语法支持 #138

Open code4craft opened 10 years ago

code4craft commented 10 years ago

使用Antlr重写XPath解析器,支持完整的XPath 1.0语法。 Xsoup #11

ouyanghuangzheng commented 10 years ago

这个需要赞一下

myboyliu commented 9 years ago

0.5.3的代码从哪里下载?

herrygoon commented 8 years ago

xpath的语法的确需要加强。 看到以前的扩展包webmagic-saxon,如何结合到webmagic-core中使用是个问题。Selectors是否可以抽象出来,用户可以设置xpath的选择器。