FictionDown 是一个命令行界面的小说爬取工具
用于批量下载盗版网络小说,该软件仅用于数据分析的样本采集,请勿用于其他用途
该软件所产生的文档请勿传播,请勿用于数据评估外的其他用途
文档目前「指南」部分已完成,你可以在这里查看。
metadata
,保留书本信息、卷结构、作者信息站点名称 | 网址 | 是否正版 | 是否分卷 | 支持站内搜索 | 代码文件 |
---|---|---|---|---|---|
起点中文网 | www.qidian.com | ✅ | ✅ | ✅ | sites\com_qidian\main.go |
笔趣阁 | www.b520.cc | ❌ | ❌ | ✅ | sites\cc_b520\main.go |
顶点小说 | www.ddyueshu.com | ❌ | ❌ | ✅ | sites\com_ddyueshu\main.go |
全本小说网 | www.qb5.la | ❌ | ❌ | ✅ | sites\la_qb5\main.go |
新八一中文网 | www.81new.net | ❌ | ❌ | ✅ | sites\net_new81\main.go |
书迷楼 | www.shumil.co | ❌ | ❌ | ✅ | sites\co_shumil\main.go |
完本神站 | www.wanben.org | ❌ | ❌ | ✅ | site\org_wanben\main.go |
38 看书 | www.mijiashe.com | ❌ | ❌ | ⚠️ | sites\com_mijiashe\main.go |
Example
中作为校对样本tamp
字段Example
进行校对conv -f md
生成 markwownpandoc -o xxxx.epub xxxx.md
> ./FictionDown --url https://book.qidian.com/info/3249362 d # 获取正版信息
# 有时会发生`not match volumes`的错误,请启用Chromedp或者PhantomJS
# Use Chromedp
> ./FictionDown --url https://book.qidian.com/info/3249362 -d chromedp d
# Use PhantomJS
> ./FictionDown --url https://book.qidian.com/info/3249362 -d phantomjs d
> vim 一世之尊.FictionDown # 加入盗版小说链接
> ./FictionDown -i 一世之尊.FictionDown d # 获取盗版内容
# 爬取完毕就可以输出可阅读的文档了
> ./FictionDown -i 一世之尊.FictionDown conv -f txt
# 转换成epub有两种方式
# 1.输出markdown,再用pandoc转换成epub
> ./FictionDown -i 一世之尊.FictionDown conv -f md
> pandoc -o 一世之尊.epub 一世之尊.md
# 某些阅读器需要对章节进行定位,需要加上--epub-chapter-level=2
> pandoc -o 一世之尊.epub --epub-chapter-level=2 一世之尊.md
# 2.直接输出epub(调用Pandoc)
> ./FictionDown -i 一世之尊.FictionDown conv -f epub
> ./FictionDown s -d -k "诡秘之主"
> ./FictionDown --url https://book.qidian.com/info/3249362 d # 获取正版信息
# 有时会发生`not match volumes`的错误,请启用Chromedp或者PhantomJS
# Use Chromedp
> ./FictionDown --url https://book.qidian.com/info/3249362 --driver chromedp d
# Use PhantomJS
> ./FictionDown --url https://book.qidian.com/info/3249362 --driver phantomjs d
> ./FictionDown -i 一世之尊.FictionDown s -k 一世之尊 -p # 搜索然后放入
> ./FictionDown -i 一世之尊.FictionDown d # 获取盗版内容
# 爬取完毕就可以输出可阅读的文档了
> ./FictionDown -i 一世之尊.FictionDown conv -f txt
# 转换成epub有两种方式
# 1.输出markdown,再用pandoc转换成epub
> ./FictionDown -i 一世之尊.FictionDown conv -f md
> pandoc -o 一世之尊.epub 一世之尊.md
# 2.直接输出epub(某些阅读器会报错)
> ./FictionDown -i 一世之尊.FictionDown conv -f epub
Cookie
,用于爬取已购买章节NAME:
FictionDown - https://github.com/ma6254/FictionDown
USAGE:
[global options] command [command options] [arguments...]
AUTHOR:
ma6254 <9a6c5609806a@gmail.com>
COMMANDS:
download, d, down 下载缓存文件
check, c, chk 检查缓存文件
edit, e 对缓存文件进行手动修改
convert, conv 转换格式输出
pirate, p 检索盗版站点
search, s 检索盗版站点
help, h Shows a list of commands or help for one command
GLOBAL OPTIONS:
-u value, --url value 图书链接
--tu value, --turl value 资源网站链接
-i value, --input value 输入缓存文件
--log value log file path
--driver value, -d value 请求方式,support: none,phantomjs,chromedp
--help, -h show help
--version, -v print the version
程序为单执行文件,命令行 CLI 界面
包管理为 gomod
go install github.com/ma6254/FictionDown@latest
交叉编译这几个平台的可执行文件:linux/arm
linux/amd64
darwin/amd64
windows/amd64
make multiple_build