jae-jae / QueryList

:spider: The progressive PHP crawler framework! 优雅的渐进式PHP采集框架。
https://querylist.cc
2.65k stars 441 forks source link

这样的html h2不被识别 #38

Closed varphper closed 6 years ago

varphper commented 6 years ago
<div class="aa">
        <h1>bbbbbb&nbsp;&nbsp;</h1>
        <h2 style="font-size:24px; line-height:30px; text-align:center;">ccccc</h2>
        <div>adsdfsdfsf</div>
</div>

这样的html h2不被识别,采集出来的内容不对。

varphper commented 6 years ago

已经查到原因:源码 h2闭合标签里写成了h3,但是在chrome的调试工具中显示的是h2,不是queryList的锅