alwaystest / Blog

24 stars 2 forks source link

深夜Debug发现的一个坑 #17

Open alwaystest opened 8 years ago

alwaystest commented 8 years ago

深夜Debug发现的一个坑

标签(空格分隔): 前端 浏览器 爬虫 NodeJS


使用NodeJS写爬虫来获取一些信息,解析table的时候居然出错了。在选择器中使用tbody来去除thead中的数据,但是选择器中一旦出现tbody,就什么都选不出来了。

明明是使用浏览器的开发者模式找出来的选择器,怎么会出问题呢,而且选择器选择thead的时候还好好的。

最后灵机一动,直接查看网页源码,根本就没有tbody这个东西嘛。

搜索资料发现:

一个表格应该有表头,若直接写tr>td这样的结构,浏览器会自动创建一个tbody包裹

看来浏览器也不是百分之百可以相信的呀。

参考