写来玩的,看到的大佬点个watch, star还有博客上点个赞啥的鼓励一下我吧(๑•̀ㅂ•́)و✧
漫画爬虫阅读网页 预览地址:
预览地址1. https://mumu_zero.gitee.io/
预览地址2. https://zero0mum.github.io/web/
一个阅读,爬取,导入和下载还有打包漫画的python爬虫
有bug可以在github或gitee上先新建一个issue然后邮箱联系我。
我的邮箱:mumuwyyx@163.com欢迎你来评论,提意见。
爬取过程:
漫画阅读网页所有功能展开后:
收起时:
漫画删除打包导入工具:
python3.8.X
依赖库:BeautifulSoup, tqdm, requests ,lxml, selenium, pydub, ffmpeg, simpleaudio
源码文件夹中的需要安装python3.8和相关依赖库(文件内有说明有可以自动安装库的.bat批处理脚本,安装库前记得换成国内pip源,要不可能下载失败)
打包好的exe内文件不需要安装,下载其中.zip解压后点击漫画爬虫.exe运行即可。
漫画爬虫网页 预览地址:https://mumu_zero.gitee.io/ 详细请看: 简书文章地址 CSDN博文地址 一.爬取 可以先到漫画网站上寻找想看的漫画再来打开爬虫爬取。 双击打开 漫画爬虫.py 或.exe
二.漫画打包工具程序: 选择需要打包的已下载的漫画执行后会在”Download“文件夹中对应的漫画名称文件夹下生成一个叫做 “打包好啦!”的文件夹,并将下载的漫画每一章打包成为一个zip压缩包放入其中,从而方便在其它软件中阅读,比如comics++; tachiyomi app; 布卡漫画app的本地漫画功能。
爬取中推荐使用谷歌chrome浏览器,IE11浏览器不稳定。 爬取中若使用IE浏览器请在爬取前进入IE的 设置>Internet选项>安全>安全中四项 都勾选启动保护模式或全部关闭保护模式并应用
并且将ie浏览器的缩放设置为100%
//如果使用谷歌浏览器,请直接官网下载最新的谷歌浏览器,查看浏览器版本,再到 “各种浏览器驱动” 目录下的 “浏览器驱动更新地址.txt”的地址下载对应版本的浏览器驱动程序替换原驱动程序。 浏览器驱动程序默认下载好的对应 浏览器版本号(如果和你的浏览器版本与默认不同请到浏览器驱动文件夹的下载地址中下载对应版本驱动替换该文件夹中驱动程序): chromedriver.exe>谷歌Chrome 86.0.4240.183;IEDriverServer.exe>ie11浏览器