Jack-Cherish / python-spider

:rainbow:Python3网络爬虫实战:淘宝、京东、网易云、B站、12306、抖音、笔趣阁、漫画小说下载、音乐电影下载等
https://cuijiahua.com/blog/spider/
18.24k stars 5.96k forks source link

大佬,可否讲一下怎么在python里面运行js找了个小说网站,他原始html里面的是乱序的文字,要用js重新排序才是正确的. #111

Open 2651084156 opened 3 years ago

2651084156 commented 3 years ago

那个js实在是太大了,完全分析不了.

kyrie4899 commented 3 years ago

我也不太清楚, pip3 install PyExecJS 试一下?你bing搜一下,应该挺多办法的。 ------------------ 原始邮件 ------------------ 发件人: "Jack-Cherish/python-spider" @.>; 发送时间: 2021年8月21日(星期六) 下午5:20 @.>; @.***>; 主题: [Jack-Cherish/python-spider] 大佬,可否讲一下怎么在python里面运行js找了个小说网站,他原始html里面的是乱序的文字,要用js重新排序才是正确的. (#111)

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.

2651084156 commented 3 years ago

我也不太清楚, pip3 install PyExecJS 试一下?你bing搜一下,应该挺多办法的。 ------------------ 原始邮件 ------------------ 发件人: "Jack-Cherish/python-spider" @.>; 发送时间: 2021年8月21日(星期六) 下午5:20 @.>; @.***>; 主题: [Jack-Cherish/python-spider] 大佬,可否讲一下怎么在python里面运行js找了个小说网站,他原始html里面的是乱序的文字,要用js重新排序才是正确的. (#111) — You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.

找了,解决方法,基本上都直接用浏览器,唯一一篇有些是讲逆向js的,但是他那js太长了,大概26 KB.而且还各种混淆,网上的反混淆工具基本上搞不干净,后面在浏览器跑的时候发现他这个js还会检查是否有cookie,如果没有的话,直接跳到主界面,然后它的cookie还是动态的,基本上每个页面都不一样无语...

kyrie4899 commented 3 years ago

哈哈哈哈,我也不会,帮不了你,不好意思哈

------------------ 原始邮件 ------------------ 发件人: "Jack-Cherish/python-spider" @.>; 发送时间: 2021年8月23日(星期一) 下午5:32 @.>; @.**@.>; 主题: Re: [Jack-Cherish/python-spider] 大佬,可否讲一下怎么在python里面运行js找了个小说网站,他原始html里面的是乱序的文字,要用js重新排序才是正确的. (#111)

我也不太清楚, pip3 install PyExecJS 试一下?你bing搜一下,应该挺多办法的。 ------------------ 原始邮件 ------------------ 发件人: "Jack-Cherish/python-spider" @.>; 发送时间: 2021年8月21日(星期六) 下午5:20 @.>; @.***>; 主题: [Jack-Cherish/python-spider] 大佬,可否讲一下怎么在python里面运行js找了个小说网站,他原始html里面的是乱序的文字,要用js重新排序才是正确的. (#111) — You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.

找了,解决方法,基本上都直接用浏览器,唯一一篇有些是讲逆向js的,但是他那js太长了,大概26 KB.而且还各种混淆,网上的反混淆工具基本上搞不干净,后面在浏览器跑的时候发现他这个js还会检查是否有cookie,如果没有的话,直接跳到主界面,然后它的cookie还是动态的,基本上每个页面都不一样无语...

— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.

onism68 commented 3 years ago

https://github.com/doloopwhile/PyExecJS