haozi23333 / haozi23333.github.io

我的博客评论
0 stars 0 forks source link

抓取博客之间的友链分析 | haoziの窝 #29

Open haozi23333 opened 4 years ago

haozi23333 commented 4 years ago

https://haozi.moe/2019/11/15/%E6%8A%93%E5%8F%96%E5%8D%9A%E5%AE%A2%E4%B9%8B%E9%97%B4%E7%9A%84%E5%8F%8B%E9%93%BE%E5%88%86%E6%9E%90/

一个什么都在学的新手萌二程序员的日常~

chanshiyucx commented 4 years ago

像我这种 SPA 类型的博客就不好爬~

haozi23333 commented 4 years ago

@chanshiyucx 像我这种 SPA 类型的博客就不好爬~

的确, 需要无头浏览器配合抓取, 把返回的页面数据正则找一下body里面是不是特别短, 或者#app的ID这些特征啥的.