Closed aboutboy closed 4 years ago
进一步的研究参考这里:https://segmentfault.com/q/1010000023035809
这是一个phpQuery的已知问题,phpQuery 解析内容时当遇到一些特殊字符会导致内容被截断,如某些繁体字,一种解决方法是将导致内容截断的特殊字符替换掉然后再将HTML传给QueryList解析
果然是特殊符号导致的。不过一个尖括号就导致了错误,也太脆弱了。。
我再研究下怎么面对这种特殊情况。
建议:querylist解析规则时最好做异常处理。
比如这里:http://xiaohua.zol.com.cn/lengxiaohua/34.html 我setHtml后,发现html的内容被破坏了,少了一个导致DOM无法解析,如下: