code4craft / webmagic

A scalable web crawler framework for Java.
http://webmagic.io/
Apache License 2.0
11.42k stars 4.18k forks source link

xpath匹配标签使用或后得到的结果集不是按顺序出现 #1115

Open wanygan83 opened 1 year ago

wanygan83 commented 1 year ago

您好,使用 node.getHtml().xpath("//p|img").nodes()方法执行得到节点结果集,p 标签和 img 不是按顺序的,img 是在最后面,如果把 img 写在 p 前面则 img 标签是在结果集最前面,请问有其它办法吗?