LogicJake / WebMonitor

实时监控网页变化,并发送通知(Monitor web page changes in real time and send notifications)
https://logicjake.github.io/WebMonitor/#/
825 stars 201 forks source link

出现错误 Exception('无法获取文本信息',) 可能的原因是xpath需要去除tbody #108

Open LDMan1993 opened 2 years ago

LDMan1993 commented 2 years ago

主要是由于浏览器本身自动为table新增了tbody标签内容,但是在xpath中是不需要的,需要在进行xpath查询之时移除掉。

LogicJake commented 2 years ago

这个问题我在做其他爬虫的时候也遇到了,确实

Memorainer commented 2 years ago

主要是由于浏览器本身自动为table新增了tbody标签内容,但是在xpath中是不需要的,需要在进行xpath查询之时移除掉。

网页源代码中确实没有<tbody>标签,去除/tbody之后还是显示:Exception('无法获取文本信息',) 该怎么处理呢?