posir / 91PornCrawler

91porn crawler, 91Porn采集 , 91porn 爬虫
0 stars 0 forks source link

91porn 又又更新了 #3

Open posir opened 4 hours ago

posir commented 4 hours ago

91porn 又又更新了

这一次除了混淆 还使用了加密函数 ......

整个页面体积 增加了30%大小 已经彻底放弃搜索引擎优化了 这样它的流量会越来越低 直到被搜索引擎屏蔽

处理中

posir commented 3 hours ago

    const decryptedText = decryptAndNavigate('wgtBhl3PL8rS2EtsWw6fRw==::ygHqiuTlt8xTj797/1mBMhYPHWHEmqR5cPvzvoCRYxv17V9ldGXUnHq46pRvkLEzCGyxagUgX19qZOPcbq1+61rgff7HUHxZZ+Z0ompwlZyHIb/hECtdOfUfWIoVs9La')

    const decryptedFrom = decryptAES("HIqUDgKfpgDGJRpNUzmeEA==", "92345678901234567890123456789018", "1234567880123458");

    console.log("URL:", decryptedText, "作者",decryptedFrom);

node decryted.js

解密后的内容

URL: view_video.php?viewkey=ce7cd422729b5f83edd3&page=1&c=tptlj&viewtype=basic&category=new 
作者 luck357广州

把加密的内容还原 避免后续对方采用随机密匙和动态生成的初始化向量IV 直接采用智能识别通用的加密组件变量提取方式

其实网站只要是能web访问,任何的加密都意义不大 无非是个加密和解密的过程,而且会大量加大网页载入速度和搜索引擎优化不友好

耗费时间30分钟完成

我还有一套智能方案 就是定制修改的浏览器内核 能直接转换网页为特定格式 比如PDF WORD等 直接使用GPU来识别和提取 因为网页列表和内容页面结构都是固定区域的 可以标记网页区域围栏 然后固定提取指定参数 就可以了 适合任何网站 不用担心是否可见的问题 标题因为超出范围出现省略号的这种 也是没问题的 可以触发显示全部内容

91porn的管理感觉还活在HTML + CSS 的web 1.0的时代 总是折腾些没卵用的东西 都是下九流 有这时间 把那些害人害己的赌博,咋骗的广告删了 不要接这种 比什么都好