ZejunCao / WeChatOA_Aggregation

微信公众号聚合平台,获取多个公众号的博文进行筛选、过滤,使用户更方便的读取公众号上的所有文章,每日爬取文章并在个人博客上更新 https://zejuncao.github.io/
24 stars 3 forks source link

WeChatOA_Aggregation

微信公众号聚合平台,获取多个公众号的博文进行筛选、过滤,使用户更方便的读取公众号上的所有文章

关于token和cookie

进入微信公众平台,扫码登录后在网页地址栏最后面就可以看到token=xxxxxxxxx, 此时按F12点Network监控网络请求,选中Fetch/XHR,刷新一下网页,随便点击一个请求就可以找到Cookie字段

目前支持token或cookie自动过期时,会自动打开浏览器,弹出公众号页面,用户扫码登录后自动获取token和cookie

TODO

minHash实验记录

方法 检测重复个数 错误个数
minhash_0.9 528 0
minhash_0.8 699 24
minhash_0.8+规则0.7 665 1 (文字很少,主体为图片)

类似项目参考