jae-jae / QueryList

:spider: The progressive PHP crawler framework! 优雅的渐进式PHP采集框架。
https://querylist.cc
2.65k stars 441 forks source link

请教如何获取rule中每个遍历元素本身的html? #58

Closed amhoho closed 3 years ago

amhoho commented 5 years ago
rules(
[
'title' => ['.title','text'],
'list' => ['怎么当前.con自身html','html']
]
)->range('.con')

结构示例:

<ul>
<li>
<div class='title'>title1</div>
<a href=''>test1</a>
<a href=''>test2</a>
<a href=''>test3</a>
</li>
...
</ul>
jae-jae commented 5 years ago

如果你想获取.con的 innerHTML 的话,选择器为空字符串即可。 如果你想获取.con的 outerHTML 的话,目前还没有很好的方法能获取到。

jae-jae commented 3 years ago

新版本 rules 已加入 htmlOuter 特性