Open alwaystest opened 8 years ago
标签(空格分隔): 前端 浏览器 爬虫 NodeJS
使用NodeJS写爬虫来获取一些信息,解析table的时候居然出错了。在选择器中使用tbody来去除thead中的数据,但是选择器中一旦出现tbody,就什么都选不出来了。
table
tbody
thead
明明是使用浏览器的开发者模式找出来的选择器,怎么会出问题呢,而且选择器选择thead的时候还好好的。
最后灵机一动,直接查看网页源码,根本就没有tbody这个东西嘛。
搜索资料发现:
一个表格应该有表头,若直接写tr>td这样的结构,浏览器会自动创建一个tbody包裹
看来浏览器也不是百分之百可以相信的呀。
参考
深夜Debug发现的一个坑
标签(空格分隔): 前端 浏览器 爬虫 NodeJS
使用NodeJS写爬虫来获取一些信息,解析
table
的时候居然出错了。在选择器中使用tbody
来去除thead
中的数据,但是选择器中一旦出现tbody
,就什么都选不出来了。明明是使用浏览器的开发者模式找出来的选择器,怎么会出问题呢,而且选择器选择
thead
的时候还好好的。最后灵机一动,直接查看网页源码,根本就没有
tbody
这个东西嘛。搜索资料发现:
看来浏览器也不是百分之百可以相信的呀。
参考